微博数据抓取方法
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
微博数据抓取方法
2009年8月以来微博用户规模快速扩张,虽然经历2012年以来移动互联网产品如微信产品等冲击,微博的用户增长有所趋缓,据相关数据统计2014年新浪微博用户依然保持有1.29亿的活跃数,而随着淘宝与新浪微博入口的打通后,更多的商家也将微博用户作为企业营销的数据源和营销阵地之一。
针对八爪鱼在微博的应用上,除了用户信息之外还包括话题内容方面的采集,目前绝大多数企业均在微博设有官方微博,八爪鱼可以协助企业快速及时的抓取与企业产品相关联的话题信息,规则市场内有配置好的规则供企业下载,在本文中不再单独叙述。本文中只针对很多企业都很关注的微博用户信息采集,推荐本期的精选规则——新浪微博用户信息采集。
企业或商家下载完八爪鱼采集器之后,可以前去规则市场下载标题名为“新浪微博-用户信息采集”。
下载之后将规则导入任务中,运行前留意看规则的相关说明,部分选项需要根据自己的需求进行适当的修改,可修改的选项包括为:用户登录的信息(修改成你自己的微博用户登录信息)、搜索条件,具体说明如下图:
任务导入之后,我们按下一步进行操作,到设计工作流程步骤时,先修改设置中的搜索条件。操作如下:
保存后,点击下一步下一步至完成,在“检查任务”中,点击运行后,按照提示输入用户登录名及密码后(八爪鱼不保存你的新浪用户登录名和密码,请放心使用)即可开始抓取你指定条件的用户信息数据。