解析网页结构及爬取数据

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

课题:项目4 设计爬虫获取数据源第3部分解析网页结构及爬取数据课次:第12次教学目标及要求:

(1)任务1 解析网页结构(掌握)

(2)任务2 爬取数据(掌握)

教学重点:

(1)任务1 解析网页结构(掌握)

(2)任务2 爬取数据(掌握)

教学难点:

(1)任务1 解析网页结构(掌握)

(2)任务2 爬取数据(掌握)

思政主题:

旁批栏:

教学步骤及内容:

1.课程引入

2.本次课学习内容、重难点及学习要求介绍

(1)任务1 解析网页结构(掌握)

(2)任务2 爬取数据(掌握)

3.本次课的教学内容

(1)任务1 解析网页结构(掌握)

爬虫分为两步走,首先要对你想要获取数据的目标网页进行解析,明确

所要获取的数据以及目标网页的结构;其次,再进行数据的爬取。

上一节,大家了解到了什么是网络爬虫和爬虫的一些基本知识。那么这

一章就以爬取猫眼电影Top 100为实例,先教大家如何解析网页。

1.打开网页https:///board/4?offset=,如图所示

- 1 -

相关文档
最新文档