八爪鱼采集器新手入门必备的知识点(7.0版)

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

网页数 据
八爪鱼采集 器
数据 库
EXCE L
AP I
其 他
产品介绍
高级模式
简单规则设置,灵活应对 各种复杂网页结构
强大的功能+简便的操作,我们提供三 种操作模式,满足不同用户的个性化应 用需求。
向导模式
内置向导流程,点击执行 轻松解决采集难题 智能模式 智能识别算法,一键即可 提取结构化数据 简易模式 内置采集模板,输入参数 即可提取模板数据
界面简介
-八爪鱼界面功能介绍
界面简介
-智能模式介绍
界面简介
-app简易模式介绍
界面简介
-网页简易模式介绍
界面简介
-向导模式介绍
界面简介
-高级模式介绍
流程步骤
一、输入网址: 此处用于输入要采集网页URL 二、设计工作流程: 此处用于设计任务规则的自动化流程步骤,例如:你要让任 务规则打开哪一个网页,做哪些步骤等都在设计工作流程中完成,设计 工作流程是一个任务规则的核心步骤 三、任务启动选择: 如果规则编写正确,此处你就可以启动一个任务规则进行单 机采集或云采集了,并且可以设置定时计划
循环本身是不会有任何执行操作的,如果要实现循环翻页,则 需要一个点击元素来和循环产生联动
Ajax加载与新标签页
即通过在后台与服务器进行少量数据交换,意味 着可以在不重新加载整个网页的情况下,对网页的某 部分进行更新。 最简单的方式是看在八爪鱼浏览器里点击的时候 有没有转,, 如果是像这样就不是ajax,这种标志 就是ajax,需要设置ajax即可,如果不设置采集时出现 的现象就会一直等待在这里不提取数据,感觉采集速 度会很慢,设置了之后会加快速度。 一般真正ajax的情况下是一定不会开新标签的, 如果勾选了新标签就需要取消掉。
论坛
•免费版用户可以去论坛http://bbs.bazhuayu.com/提问,上面也会有专属客服回答问题的,论坛响 应时间一天以内。
八爪鱼采集原理
原理:
Ⅰ:模拟人的思维去浏览网页 Ⅱ:通过设计工作流程完成自动化数据采集 八爪鱼采集器是一款模拟人的思维去访问网页 文档的互联网数据采集器。通过设计工作流程,可以 实现采集的程序自动化,以达到快速的对网页数据进 行收集整合,完成用户数据采集的目的。
目录
1. 2. 3. 4. 5. 6. 产品介绍 学习渠道 八爪鱼采集原理 界面简介 实战演练 误区-ajax与新标签介绍
产品介绍
八爪鱼,深圳视界信息技术有限公司(国家高新企业)旗下产品,强大且易用的互联网数据采集平台。
八爪鱼可简单快速地将网页数据转化为结构化数据,存储于EXCEL或数据库等多种形式,并且提供基于云计算的大数据云采 集解决方案,实现精准、高效、大规模的数据采集。其智能模式可实现输入网址全自动化导出数据,是国内首个大数据一键 采集平台。
The End
谢谢大家
培训反馈http://cn.mikecrm.com/jpLnLy0
客服系统
•登陆www.bazhuayu.com在用户中心-售后咨询或者客户端上的“联系客服”按钮向专属客服反应 问题,上班时间客服在线响应时间为5分钟以内。下班时间可以提交工单,客服上班之后会进行 回复。此服务为一对一服务。
QQ群
•私有云用户可以联系购买时的商务,商务会帮你直接建一个组分配专属客服解答问题 •专业版或旗舰用户可以直接添加VIP群,在群内咨询问题。每个VIP群都有专属客服,客服看到都 会回复大家。专业版群客服响应时间4个小时内,旗舰版群客服响应时间两个小时内 •旗舰版QQ群 1群:130849246 2群:286777906 3群:196097783 限旗舰版用户 •专业版QQ群 1群:475423041 2群:385161018 3群:135071723 限专业版用户
结语: 实践出真知,八爪鱼让数据触手可及
实战演练
一、打开网页:
打开网页,一般指我们所要采集数据的网站,正如平时我们浏 览该网站的数据信息时需要输入URL一样
二、循环翻页:
循环翻页,指一般我们需要快速收集整合时,是需要做到翻页 循环的,循环翻页的本质是一个单个元素的循环
三、Fra Baidu bibliotek取数据:
正式的采集步骤
四、点击元素:
进阶步骤,是指除基本步骤外,我们需要通过下列操作来辅助完成我们的数据采集,进 阶步骤如下: 1)输入文字 3)切换下拉选项 5)移动鼠标到元素上 7)结束流程 2)识别验证码 4)判断条件 6)结束循环
实战演练
新浪财经 http://vip.stock.finance.sina.com.cn/q/go.php/vIR_RatingNewest/i ndex.phtml?p=1 58同城 http://bj.58.com/waiyu/30390652277055x.shtml?adtype=1&entinf o=30390652277055_0&adact=3&psid=16757968519683719719 1772083&iuType=q_1&ClickID=2&PGTID=0d303871-0000-4c8d427b-904ef31bbe7d
八爪鱼的规则配置流程模拟人的思维模式,贴合用户的操作习惯,任何人通过官网教程的学习都可以在30分钟内轻 松掌握全网数据采集的本领。
帮助渠道
八爪鱼官网www.bazhuayu.com
教程
•登陆www.bazhuayu.com,点击帮助和教程,里面包含了所有的使用教程。建议从新手入门1-7开 始,学会新手教程1-7就可采集互联网上80%的网站
流程步骤
流程设计步骤:
在八爪鱼采集器中,一共有11个流程设计操作,其中分为常用步骤和进阶步骤,划分为
以下:
常用步骤:
常用步骤本身是应用较多的流程设计操作,通常来说,要实现一个网页的数据快速整理 与采集,这些步骤是必不可少的,基本步骤如下: 1)打开网页 2)点击元素 3)循环 4)提取数据
进阶步骤:
相关文档
最新文档