八爪鱼采集器如何循环采集数据

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

应用:循环下翻下拉框
适用情况:网页中存在可以下拉并选择元素的 下拉框,需要先循环选择下拉框中的元素,再 进行数据采集。 循环选择下拉框中所有元素或循环选择下拉框 中某些特定元素。 示例网址:http://live.500.com/
The End
谢谢大家
五、不固定元素列表循环
适用情况:网页上要采集的元素不是固定数目。 每个页面上元素数目不固定:一页存在同类元 素7个,另一页存在同类元素10个......
实现方式:通过不固定因素列表循环,循环页 面内的不固定数目的元素。
定位方式:使用xpath定位,一条xpath对应 循环列表中的多个元素。
示例网址: http://sz.58.com/?utm_source=link&spm =u-LscBIm_2J9tMeMj.psy_111
Байду номын сангаас 三、单个元素循环
适用情况:需循环点击页面内的某个按钮。例如: 循环点击下一页按钮进行翻页。
实现方式:通过单个元素循环方式,达到循环点 击下一页按钮进行翻页目的。
定位方式:使用xpath定位,在当前页始终能定 位到下一页按钮。
示例网址: http://www.skieer.com/guide/demo/genrem oviespage1.html
二、文本循环
适用情况:在搜索框中循环输入关键词,采集关键 词搜索结果的信息。 示例网址:https://zhidao.baidu.com/ 注意事项:有的网页,点击搜索按钮后,页面会发 生变化,能正常采集到第一个关键词的数据,则打 开网页步骤需放在文本循环内 示例网址:https://v.qq.com/
四、固定元素列表循环
适用情况:网页上要采集的元素是固定数目的。1) 每一页的元素数目固定;2)采集特定数目的元素。 实现方式:通过固定因素列表循环,循环页面内 的固定元素。 定位方式:使用xpath定位,一条xpath对应循环 列表中的一个元素。 示例网址:http://weixin.sogou.com/
八爪鱼 让数据触手可及
视频教程PPT
http://www.bazhuayu.com
五大循环方式
一、URL循环 二、文本循环 三、单个元素循环 四、固定元素列表循环 五、不固定元素列表循环
一、URL循环
适用情况:在多个同类型的网页中,网页结构和要采 集的字段相同。
示例网址: https://movie.douban.com/subject/26387939/ https://movie.douban.com/subject/6311303/ https://movie.douban.com/subject/1578714/ https://movie.douban.com/subject/26718838/ https://movie.douban.com/subject/25937854/ https://movie.douban.com/subject/26743573/ https://movie.douban.com/subject/20451290/ https://movie.douban.com/subject/26816383/ https://movie.douban.com/subject/26260853/
相关文档
最新文档