八爪鱼采集器实战采集练习案例

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

题目一:采集列表页同时采集详情页

网址:https:///baojian

红框是采集字段

下箭头是翻页

上箭头需要点击详情页

详情页网址:https:///baojian/1.html、https:///baojian/15902.html

要求:

1.字段不能遗漏

2.字段不能乱序

3.循环限制采集30页

题目2:采集新闻并保持图文顺序网址:/

红线处为翻页

详情页:要保持图文次序

网站:/19835.html

采集效果如图:

采集效果示例:/11088.html

要求:

1.采集新闻标题并且点击进去采集新闻正文内容和作者

2.保持原网页的图文顺序

题目3:利用分支和验证码,采集时验证码失效时能检测出来并自动重新输入验证码

网址:/index.html

要求输入深圳以及验证码并点击查询,然后对列表内容进行翻页采集

要求:

1.采集列表数据

2.采集50页

题目4:利用分支判断,对页码进行判断,跳过偶数页的列表内容

网址:https:///baojian

红框处:2、4、6、8、..、2m、..、2n、2n+2、

要求

1.跳过偶数页的内容都不采集

2.采集奇数页内容的列表以及详情,字段要求与题目1向符合

相关文档
最新文档