WEWORK 数据采集解决方案

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

多数据源的楼盘信息整合
房地产网站内容在搜集过程中,或者由于编辑的失误或者调查资料不全, 有些楼盘会在某个网站中遗漏一些指标信息,有些楼盘会出现不同网站对同一 个项目信息资料描述互有不同,我们采用相应的算法对数据进行整合,给出一 个完善和准确的结果。
解决方案-楼盘项目基本信息处理流程
1
2 3
4
解决方案-楼盘项目周边配套
更新,可以通过此搜集户型、面积和当前 的租金情况,写字楼的办公配套等等。 满足。在建地铁会通过政府网站公示,并 会有相应的站点规划,获取站点位置。能
4、能否搜集在建的地铁信息。
得出楼盘在未来规划中的交通信息。
流程图(一)
1
2 3
4
流程图(二)
1
2 3
4
数据呈现 –使用系统地图查找
在地图上通过圈选或者输入楼盘名称查找周边信息
楼盘项目周边配套内容 1
周边配套包括楼盘周边交通、大型商场、行政办公、药店、便利店、超 市、学校、银行、餐饮和娱乐信息。
数据来源
大众点评网、美团网和去哪儿等生活服务类网站提供的消费场所信息。 地图应用中的各商场超市等的地利位置信息。 政府网站中获取最新的轨道交通规划和站点位置信息。
解决方案-楼盘项目周边配套处理流程
2 3
4 5
式下,指标信息也越来越准确和完善。 满足。周边娱乐设施和餐饮可以通过众多 团购网、生活服务类网站进行搜集。大型 超市,药店,交通,便利店,商场则能通 过谷歌百度等地图应用中找到对应的地址 信息。 满足。现在大型中介网站都以提供真实房
3、住宅写字楼户型,面积,租金情况。
源为卖点,各家都有自己的房源,并随时
数据来源
搜房网、新浪乐居、搜狐焦点、安居客等大型房地产垂直网站。 中原地产、链家地产、我爱我家等大型地产中介网站。 蘑菇公寓等平台型房屋出租网站 办办网等商务项目网站。
解决方案-楼盘项目租金信息处理流程
数据提取和整合 1
分析楼盘的出租信息,对户型进行规范化处理,对不同时间段的相同户型 进行融合,便于分析和查询。不同数据源都有自己独有的房源信息,对这些数 据进行整合,全面的展现楼盘的出租信息。
定时更新
住宅写字楼出租有时效性,需要经常跟新最新的数据情况,系统将定期 的更新最新的出租情况,并对数据进行更新。
谢谢
数据来源
搜房网,新浪乐居,搜狐焦点,安居客等大型房地产垂直网站。 中原地产,链家地产,我爱我家等大型地产中介网站。 赢商网,办办网等商务项目网站。
解决方案-楼盘项目基本信息处理流程
数据的采集整理 1
采集器能自动的结构化的对网络资源进行采集,我们对采集结果进行单位统 一和内容描述格式化等处理手段使结果便于阅读和分析。
1
数据呈现-文件形式
导出文件
1
将数据以EXCEL的形式导出,也可根据实际需要扩展。
Fra Baidu bibliotek
自定义条件导出
可通过自定义检索条件导出范围对数据进行导出,也可以对数据进行操作后导 出。
解决方案-楼盘项目基本信息定义
楼盘项目指标内容 1
楼盘项目指标包括 城市,区域,项目名称,开发商,物业公司,楼 龄,楼盘价格,物业费,建筑面积,总户数。
数据提取
1
从网络资源中采集超市、便利店、药店等配套设施的地址和名称。 消费类则可以获取消费价格和细分类型。 采集交通设施各站点名称位置线路。
计算项目周边配套
我们对楼盘项目地址和配套设施地址通过相互之间的距离计算,获取楼盘任意 范围内的配套项目。
解决方案-楼盘项目周边配套结果(一)
项目与周边配套关系
显示项目与周边配套之间的距离
1
解决方案-楼盘项目周边配套结果(二)
周边消费水平 1
统计楼盘周边消费水平,在这基础上可以对数据进行归一化处理,建立数 学模型分析消费能力。
解决方案-楼盘租金相关信息
楼盘租金内容 1
包括楼盘户型、面积、价格、出租时间和楼层数以及写字楼相关办公环 境包括电梯数、空调、停车位、入驻企业和安防系统等。
WEWORK 数据采集解决方案
目录
1
需求分析
2 3
4 5
项目流程图和结果呈现
采集楼盘基本信息
采集楼盘配套信息
采集楼盘出租信息
技术应答表
技术要求 1:搜集住宅写字楼指标信息。 是否满足 满足。新房和在建楼盘的指标信息都会在 多个房地产垂直网站上展现。对于二手房 小区,在当前地产中介的逐渐互联网化形 2、搜集住宅写字楼的周边配套。
相关文档
最新文档