饿了么外卖数据采集

合集下载
相关主题
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

饿了么外卖数据采集

本文介绍使用八爪鱼采集饿了么商家外卖数据的方法。

采集网站:

https://www.ele.me/place (不换外卖配送地址的采集网址)

采集的内容包括:店名,起送价,配送费,平均送达速度,月售,综合评价,商家地址,营业时间,服务态度,菜品评价。

使用功能点:

八爪鱼7.0教程——AJAX点击和翻页教程

/tutorialdetail-1/ajaxdjfy_7.html

步骤1:创建饿了么外卖数据任务

1)进入主界面,选择“自定义采集”

采集步骤1

2)将要采集的网址URL复制粘贴到网站输入框中,点击“保存网址”。

打开网页之后,打开右上角的流程按钮,使制作的流程可见状态。 此时网页会迅速定位到当前地址,网址也会变成地址附近的商家。

如果想要修改成其他地址,在网址栏输入https://www.ele.me/home/,在首页的选项中选择“输入文字”,在文字框中输入“深圳软件园一期”(离八爪鱼公司较近),点击确定。

在页面中显示出来的下拉框中点击一个你要采集的地址,比如我点击了第一个地址,则地址更换完成。

步骤2:创建翻页循环

1)如图所示,饿了商家信息没有下一页,需要向下滚动刷新,并且在最下方是“点击加载更多商家”,因此需要做两个操作。此操作涉及到AJAX点击和翻页教程,具体请看:

操作1:点击上一步已做好的“点击元素”,进行“滚动页面”设置。在右侧高

级选项里勾选滚动页面,设置滚动4次,每次间隔3

秒,滚动方式直接滚动到

底部。点击“确定”。

没有修改地址的用户可以直接在第一步“打开网页”中进行设置,设置方式相同。

操作2:点击最下方的“点击加载更多商家”,在选项框中选择“循环点击单个元素”,翻页循环步骤就在左上角流程里了。

在流程的点击翻页右侧高级选项里,勾选滚动页面,设置滚动4次,每次间隔3秒,滚动方式直接滚动到底部。勾选ajax加载,超时5秒。设置执行前等待2秒,点击“确定”。

步骤3:创建列表循环

1)鼠标先点击商品列表中第一个商品(注意要包括该商品全部子元素,如果只选择了标题或者配送费,可点击提示框最右下角的正方形加小斜线的图标,扩大选项范围),再点击第二个商品,此时所有商品已经全都选中,鼠标点击提示框中的“循环点击每个元素”,列表循环就创建完成,并进入到第一个循环项的详情页面。

2

)数据提取,接下来采集具体字段,分别选中页面店名,起送价,配送费,平

均送达速度,月售,综合评价,商家地址,营业时间,服务态度,菜品评价,再分别鼠标点击“点击该元素的文本”,再修改字段名称,数据提取完毕。

3)可在流程各个步骤的高级选项里设置“执行前等待”几秒时间,可减少访问页面较快出现防采集问题。设置后点击“确定”。

步骤4:饿了么外卖数据采集及导出

1)点击左上角的“保存”,然后点击“开始采集”。

选择“启动本地采集”

3)采集完成后,会跳出提示,选择“导出数据”,选择“合适的导出方式”,将采集好的数据导出即可。

相关采集教程:

大众点评商家数据采集:

/tutorialdetail-1/dzdp2_7.html

淘宝数据采集:

/tutorialdetail-1/tbwsjcj-7.html

淘宝网宝贝采集器:

/tutorialdetail-1/cjtbsp-7.html

美团商家数据采集:

/tutorialdetail-1/mtsj_7.html

京东商品信息采集:

/tutorialdetail-1/jdsp_7.html

大众点评商家团购评价数据采集:

/tutorialdetail-1/dzdppj.html

八爪鱼——90万用户选择的网页数据采集器。

1、操作简单,任何人都可以用:无需技术背景,会上网就能采集。完全可视化流程,点击鼠标完成操作,2分钟即可快速入门。

2、功能强大,任何网站都可以采:对于点击、登陆、翻页、识别验证码、瀑布流、Ajax脚本异步加载数据的网页,均可经过简单设置进行采集。

3、云采集,关机也可以。配置好采集任务后可关机,任务可在云端执行。庞大云采集集群24*7不间断运行,不用担心IP被封,网络中断。

4、功能免费+增值服务,可按需选择。免费版具备所有功能,能够满足用户的基本采集需求。同时设置了一些增值服务(如私有云),满足高端付费企业用户的需要。

相关文档
最新文档