Menu
您的位置:中国房产新闻网 > 数据研究 > >

房源推荐、房屋估价、经纪人画像房产新闻...,链家如何利用数据挖掘技术服务房地产?

新闻来源:网络整理  2018-03-04 02:42

5) Kmeans 是寻找相似房源相似小区时使用的方法

从这幅图可以看出,用户画像采用的是Lambda架构,包含三层架构:批处理层、实时处理层、服务层。

A3:参见我之前的分享内容哈。 日志数据6T,成交数据超过百万,用户画像数量超过2000万。

2)快速的检索与Olap查询

1)整理用户线下和线上行为记录,分析用户行为、刻画用户偏好

iv)经纪人客户相似度: 价格相似、面设相似等等

3)展位规则


d) 从调研结果来看,符合此特征的展位匹配关系,能够带来20%的效果提升。

下面我们说说估价我们是怎么做的, 我们如何评估估价功能,以及我们如何在迭代中一步步的提升了估价的准确率和用户体验。

6) CNN卷积神经网络为基础的深度学习方法,是我们在做图片方面的处理时使用的算法

4)用户留存分析,服务于产品和运营,例如产品能够从用户画像中得到一段时间内的活跃用户后来不活跃时,如何进行针对性的激活.

4) HMM是我们在客源解读中刻画用户购房意愿的算法

开发和运维的复杂性:Lambda需要将所有的算法实现两次,一次是为批处理系统,另一次是为实时系统,还要求查询得到的是两个系统结果的合并.

ii)增加用户满意度和忠诚度

v)  需要考虑平滑策略, 这是非线性回归模型在纳入时间因子时需要考虑的。从我们的角度而言,我们之所以要做价格平滑,是不想让用户看到自己的房子的价格在相隔两天中发生比较大的感知到的差异。

ii)特征离散化: 对价格分布做了5000为间隔的离散

a) 实时:低延迟处理数据; b)可重计算:由于数据不可变,重新计算一样可以得到正确的结果; c)容错:第二点带来的,程序bug、系统问题等,可以重新计算;  d) 复杂性分离、读写分离

由这幅图大家可以看出,这位同事对于团结湖公寓小区和阳光100小区的兴趣度,他想要买的房屋价格分布在500-800万中间,商圈是团结湖,面积更倾向于在130-150平米。最后这个同事成交的地方就在团结湖公寓,价格是在700多万。因此,画像标签数据精准的获取了这些有用的信息。

免责声明:凡本网注明 “来源:XXX(非中国房产新闻网)” 的作品,均转载自其它媒体,转载目的在于传递更多信息,并不代表本网赞同其观点和对其真实性负责。

最新资讯

滚动播报

更多