解析网页结构及爬取数据
合集下载
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
课题:项目4 设计爬虫获取数据源第3部分解析网页结构及爬取数据课次:第12次教学目标及要求:
(1)任务1 解析网页结构(掌握)
(2)任务2 爬取数据(掌握)
教学重点:
(1)任务1 解析网页结构(掌握)
(2)任务2 爬取数据(掌握)
教学难点:
(1)任务1 解析网页结构(掌握)
(2)任务2 爬取数据(掌握)
思政主题:
旁批栏:
教学步骤及内容:
1.课程引入
2.本次课学习内容、重难点及学习要求介绍
(1)任务1 解析网页结构(掌握)
(2)任务2 爬取数据(掌握)
3.本次课的教学内容
(1)任务1 解析网页结构(掌握)
爬虫分为两步走,首先要对你想要获取数据的目标网页进行解析,明确
所要获取的数据以及目标网页的结构;其次,再进行数据的爬取。
上一节,大家了解到了什么是网络爬虫和爬虫的一些基本知识。那么这
一章就以爬取猫眼电影Top 100为实例,先教大家如何解析网页。
1.打开网页https:///board/4?offset=,如图所示
- 1 -