八爪鱼采集器提取数据-找不到时如何处理

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

八爪鱼采集器提取数据-找不到时如何处理八爪鱼提取字段时,有找不到时如何处理的选项。如下图:

八爪鱼提取数据找不到时如何处理-图1

下面介绍如何设置找不到字段时的操作:

步骤一、点击需要设置的字段名称→自定义数据字段→自定义定位元素方式

八爪鱼提取数据找不到时如何处理-图2

八爪鱼提取数据找不到时如何处理-图3

进入自定义定位元素方式后,我们可以看到下图中红框内,有找不到时如何处理的三个选项,分为:使用默认值、该字段留空以及该步骤所有字段留空。

八爪鱼提取数据找不到时如何处理-图4

这里为了方便演示,我们修改一下元素匹配的Xpath,这样八爪鱼就抓取不到原来的字段了。

八爪鱼提取数据找不到时如何处理-图5

八爪鱼提取数据找不到时如何处理-图6

由于我们在标题处选择的是找不到时该字段留空,所以修改Xpath后,标题处提取到的数据为空。

八爪鱼提取数据找不到时如何处理-图7

我们同样修改类型和评分处的Xpath看一下其余两项效果。评分处的使用默认值设置提取不到内容容时出现默认值,默认值设置如下:

八爪鱼提取数据找不到时如何处理-图8 步骤二:保存并启动

八爪鱼提取数据找不到时如何处理-图9 可以看到弹出了采集错误报告,当前网页三条数据均未采集到信息

八爪鱼提取数据找不到时如何处理-图10

此处是因为类型中,找不到字段时该步骤所有字段留空,导致标题、类型、评分、上映年份以及时间均为空值,当八爪鱼一条信息采集不到任何一个字段时便会弹出错误提醒,我们可以查看采集错误报告看到错误类型来进行修改。

八爪鱼提取数据找不到时如何处理-图11

如上图,我们设置类型采集不到数据时该字段留空,保存并运行后,可以看到:

八爪鱼提取数据找不到时如何处理-图12

标题与类型因为我们设置的该字段留空,所以未显示有任何内容;八爪鱼因为我们没有设置该步骤所有字段留空,所以也没有弹出错误报告;评分处因为我们设置使用默认值,默认值为找不到数据*——*,所以弹出如图所示的内容。

这就是找不到数据时的三种办法,其中该字段留空可以使我们在结果中明显的看到哪里有数据没采集到;该步骤所有字段留空则会使一个字段找不到数据时,便忽略该信息所有字段,相当于跳过该条信息的采集;使用默认值可以让你在找不到数据时默认填写一个字段,来补充没有采集到的内容。

相关采集教程:

天猫商品信息采集

新浪微博数据采集

1688热门商品采集

八爪鱼——70万用户选择的网页数据采集器。

1、操作简单,任何人都可以用:无需技术背景,会上网就能采集。完全可视化流程,点击鼠标完成操作,2分钟即可快速入门。

2、功能强大,任何网站都可以采:对于点击、登陆、翻页、识别验证码、瀑布流、Ajax脚本异步加载数据的网页,均可经过简单设置进行采集。

3、云采集,关机也可以。配置好采集任务后可关机,任务可在云端执行。庞大云采集集群24*7不间断运行,不用担心IP被封,网络中断。

4、功能免费+增值服务,可按需选择。免费版具备所有功能,能够满足用户的基本采集需求。同时设置了一些增值服务(如私有云),满足高端付费企业用户的需要。

相关文档
最新文档