网易云音乐评论采集教程
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
网易云音乐评论采集教程
网易云音乐是一款由网易开发的音乐产品,依托专业音乐人、DJ、好友推荐及社交功能,在线音乐服务主打歌单、社交、大牌推荐和音乐指纹,以歌单、DJ 节目、社交、地理位置为核心要素,主打发现和分享。
网易云音乐中的评论区是一个很有意思的地方——各种味道的故事,引起了网友们的强烈共鸣。甚至产生了一个歌单——网易云评论最多的前100首歌。在这个歌单中,周杰伦的晴天评论数居于第一(截止本文上传时间)。
本文将介绍使用八爪鱼采集网易云音乐评论(以周杰伦的晴天下的评论为例)的方法。采集字段主要有评论内容、用户ID、用户主页链接和点赞数。本文仅为一个示例,大家在采集过程中,可更换歌曲URL,采集歌曲下的评论。还可先采集一批歌曲URL,再使用URL列表循环,采集大量歌曲评论。
采集网站:
/#/song?id=186016
使用功能点:
●分页列表循环
/tutorial/fylb-70.aspx?t=1
●Ajax点击和翻页
/tutorial/ajaxdjfy_7.aspx?t=1
步骤1:创建采集任务
1)进入主界面,选择“自定义采集”
网易云音乐评论采集步骤1
2)将要采集的网站URL复制粘贴到输入框中,点击“保存网址”。这里我们先到网易云音乐上面复制想要采集的音乐网址。然后复制粘贴
网易云音乐评论采集步骤2
步骤2:创建翻页循环
1)网页打开以后,将页面下拉到底部,点击“下一页”按钮。在右侧的操作提示框中,选择“循环点击下一页”
网易云音乐评论采集步骤3
步骤3:创建列表循环及信息提取
1)移动鼠标,选中第一条评论,评论框会变成绿色,其中的字段会变为红色底色。然后选择右侧操作提示框中的“选中子元素”
网易云音乐评论采集步骤4 2)接着在右边的提示框中选择“选中全部”
网易云音乐评论采集步骤5
3)然后选择“采集数据”
网易云音乐评论采集步骤6
4)打开右上角的流程按钮,可以删除不需要的字段并编辑字段名称
网易云音乐评论采集步骤7
5)因为网页涉及到Ajax技术,所以需要设置Ajax,如下图,鼠标点击“点击翻页”步骤,打开高级选项,在Ajax加载项勾选Ajax加载数据,设置超时2秒
网易云音乐评论采集步骤8
步骤4:采集并导出数据
1)点击左上角的“开始采集”,选择“启动本地采集”
网易云音乐评论采集步骤9
2)采集完成后,会跳出提示,选择“导出数据”选择“合适的导出方式”,将采集好的数据导出,这里我们选择excel作为导出为格式,数据导出后如下图
网易云音乐评论采集步骤10