如何从列表页批量点击采集详情页内容

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

如何从列表页批量点击采集详情页内容

新标签是什么

新标签是指在浏览器中打开的一个新页面,新标签打开的意思是在浏览器中打开一个新页面,并重新加载整个网页。

常见应用情景

当你在浏览器中对某些页面选项进行点击时,比如在京东的商品列表里点击一个商品,浏览器会打开一个新标签,加载出来的是该商品的详情页面。(如下图)

此时这个点击步骤就要做“在新标签页中打开一个页面”的高级选项设置。

在八爪鱼中的页面介绍

在八爪鱼客户端中,新标签选项通常在“点击元素”的步骤中做设置,但并不是所有“点击元素”都要设置新标签,要满足一个条件才能设置,否则采集流程会问题,采不到数据。要满足的条件是:当你在浏览器里进行相同的点击操作,而浏览器自动打开了一个新标签页面,那么你要在八爪鱼的点击元素步骤里进行该项设置。

操作示例

示例网址:https:///news/gold-latest(黄金头条网站资讯频道)

示例采集需求:采集页面上第一条资讯新闻的详细内容。

以下为具体操作步骤

1.用户可以先在浏览器里测试一下,如下图,点击新闻标题链接后,浏览器自动跳出了一个新页面,加载了第一条新闻的详细内容,证明这个点击步骤是“新标签打开”,需要在八爪鱼的这一个“点击元素”步骤做新标签设置。

2.在八爪鱼中新建任务,打开示例网址

3.因为需求是只采集第一条新闻的详细内容,其他新闻不用采,所以不做循环,只点击第一条新闻的标题链接,在提示框中选择“点击该链接”。

4.此时已进入到详情页,点击一下右上角的“流程”,就可见到八爪鱼流程图,包括“点击元素”步骤和右侧的高级选项,八爪鱼已经自动勾选了“在新标签中打开页面”。(如果八爪鱼没有自动勾选,用户要手动点击勾选)

5.在八爪鱼中点击正文内容,在提示框中选择“采集该元素的文本”即可。

该规则制作完成。

注意:

如果在浏览器中做点击设置,并没有打开新标签,而是在原网页中做加载,说明不是新标签打开页面,可能是ajax加载页面,要做ajax加载设置,具体设置方法请查看“ajax功能点教程”。

相关采集教程:

网络爬虫视频教程/tutorial/videotutorial

新手入门视频采集教程/tutorial/videotutorial/videoxsrm 八爪鱼爬虫软件入门准备/tutorial/xsksrm/rmzb

八爪鱼爬虫软件功能使用教程/tutorial/gnd

xpath抓取网页文字/tutorial/gnd/xpath

网页数据导出/tutorial/gnd/dataexport

八爪鱼——90万用户选择的网页数据采集器。

1、操作简单,任何人都可以用:无需技术背景,会上网就能采集。完全可视化流程,点击鼠标完成操作,2分钟即可快速入门。

2、功能强大,任何网站都可以采:对于点击、登陆、翻页、识别验证码、瀑布流、Ajax脚本异步加载数据的网页,均可经过简单设置进行采集。

3、云采集,关机也可以。配置好采集任务后可关机,任务可在云端执行。庞大云采集集群24*7不间断运行,不用担心IP被封,网络中断。

4、功能免费+增值服务,可按需选择。免费版具备所有功能,能够满足用户的基本采集需求。同时设置了一些增值服务(如私有云),满足高端付费企业用户的需要。

相关文档
最新文档