怎么下载网页上的图片
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
怎么下载网页上的图片
如果正在从事自媒体相关的工作,那么你每天一定会有固定工作是:找配图。但是找到了图片,要如何才能快速、方便的把它们都下载、保存到电脑?这里我将推荐一款图片下载神器给你。
本文向大家介绍一款网络数据采集工具【八爪鱼数据采集器】,教大家如何使用八爪鱼采集软件批量下载网页上图片的方法。
图片网站大概有以下两大类情况:
一、非瀑布流网站的图片采集
示例网站:豆瓣网
八爪鱼可以对网页中图片的URL进行采集,然后通过专用的图片批量下载工具将URL转化为图片,下载并保存到本地电脑。
八爪鱼图片批量下载工具:https:///s/1c2n60NI
二、瀑布流网站的图片采集
示例网站:百度图片网
这类瀑布流网站的采集需要按下面的步骤对采集规则进行设置:
1、点击采集规则打开网页步骤的高级选项;
2、勾选页面加载完成后下滚动;
3、填写滚动的次数及每次滚动的间隔;
4、滚动方式设置为:直接滚动到底部;
完成上面的规则设置后,再对页面中图片的url进行采集。
以下为使用八爪鱼采集图片的具体案例。
一、非瀑布流网站的图片采集:豆瓣图片采集
步骤1:创建采集任务
1)进入主界面,选择自定义模式
如何下载网页的图片图1
2)将上面网址的网址复制粘贴到网站输入框中,点击“保存网址”
如何下载网页的图片图2
3)保存网址后,页面将在八爪鱼采集器中打开,红色方框中的图片是这次演示要采集的内容
如何下载网页的图片图3
步骤2:创建翻页循环
●找到翻页按钮,设置翻页循环
●设置ajax翻页时间
1)将页面下拉到底部,找到下一页按钮,鼠标点击,在右侧操作提示框中,选择“更多操作”
如何下载网页的图片图4
2)选择“循环点击单个链接”
如何下载网页的图片图5
步骤3:图片链接采集采集
●选中采集的图片,创建图片的采集列表
●提取图片链接
1)点击需要采集的图片,点击“选中全部”
如何下载网页的图片图6
2)当前页面中所有的图片地址将会被选中,点击“采集以下图片地址”
如何下载网页的图片图7
注意:在提示框中的字段上会出现一个“X”标识,点击即可删除该字段。3)修改采集任务名、字段名,并点击下方提示中的“保存并开始采集”
如何下载网页的图片图8
4)根据采集的情况选择合适的采集方式,这里选择“启动本地采集”
如何下载网页的图片图9
说明:本地采集占用当前电脑资源进行采集,如果存在采集时间要求或当前电脑无法长时间进行采集可以使用云采集功能,云采集在网络中进行采集,无需当前电脑支持,电脑可以关机,可以设置多个云节点分摊任务,10个节点相当于10台电脑分配任务帮你采集,速度降低为原来的十分之一;采集到的数据可以在云上保存三个月,可以随时进行导出操作。
步骤4:数据采集及导出
1)采集完成后,会跳出提示,选择导出数据
如何下载网页的图片图10
2)选择合适的导出方式,将采集好的数据导出
如何下载网页的图片图11
步骤5:将图片URL批量转换为图片
经过如上操作,我们已经得到了要采集的图片的URL。接下来,再通过八爪鱼专用的图片批量下载工具,将采集到的图片URL中的图片,下载并保存到本地电脑中。
图片批量下载工具:https:///s/1c2n60NI
1)下载八爪鱼图片批量下载工具,双击文件中的MyDownloader.app.exe文件,打开软件
如何下载网页的图片图12
2)打开File菜单,选择从EXCEL导入(目前只支持EXCEL格式文件)
如何下载网页的图片图13
3)进行相关设置,设置完成后,点击OK即可导入文件
选择EXCEL文件:导入你需要下载图片地址的EXCEL文件
EXCEL表名:对应数据表的名称
文件URL列名:表内对应URL的列名称
保存文件夹名:EXCEL中需要单独一个列,列出图片想要保存到文件夹的路径,可以设置不同图片存放至不同文件夹
如果要把文件保存到文件夹,则路径需要以“\”结尾,例如:“D:\同步\”,如果要下载后按照指定的文件名保存,则需要包含具体的文件名,例如“D:\同步\1.jpg”
如果下载的文件路径和文件名完全一样,则原先存在的文件会被删除
如何下载网页的图片图14
二、瀑布流网站的图片采集:百度图片采集
采集网站:
https:///search/index?tn=baiduimage&ipn=r&ct=201326592&cl =2&lm=-1&st=-1&sf=1&fmq=&pv=&ic=0&nc=1&z=&se=1&showtab=0&fb=0 &width=&height=&face=0&istype=2&ie=utf-8&fm=index&pos=history&word= %E5%A4%8F%E7%9B%AE%E5%8F%8B%E4%BA%BA%E5%B8%90
步骤1:创建采集任务
1)进入主界面,选择自定义模式
2)将上面网址的网址复制粘贴到网站输入框中,点击“保存网址”
3)系统自动打开网页。我们发现,百度图片网是瀑布流的网页,经过每一次下拉加载,都会出现新的数据。当图片足够多的时候,可无数次下拉加载。因而,此网页涉及AJAX技术,需要设置AJAX 超时,以便确保数据采集的时候不会遗漏。
选中“打开网页”步骤,打开“高级选项”,勾选“页面加载完成向下滚动”,设置滚动次数为“5次”(根据自身需求进行设置),时间为“2秒”,滚动方式为“向下滚动一屏”;最后点击“确定”