八爪鱼验证码登陆-控件识别方法(7.0版本)

合集下载

1、下载文档前请自行甄别文档内容的完整性，平台不提供额外的编辑、内容补充、找答案等附加服务。
2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
3、如文档侵犯您的权益，请联系客服反馈,我们会尽快为您处理(人工客服工作时间：9:00-18:30)。

八爪鱼验证码登陆-控件识别方法（7.0版本）
本文给大家演示登陆界面有验证码或者其他验证（如滑块验证）的网站通过八爪鱼控件识别进行数据采集的方式。

所讲示例采集数据网址为/login.aspx
小贴士：通过八爪鱼的控件进行识别，这种方式如果需要自动识别，就需要购买验证码套餐，如果不购买也只能进行单机采集然后手动输入，注意这种方法只能是输入验证码的框才可以用这种方式。

步骤1 登陆八爪鱼7.0采集器→点击新建任务→自定义采集，进入到任务配置页面：然后输入网址→保存网址，系统会进入到流程设计页面并自动打开前面输入的网址。

验证码登陆-控件识别方法-图1：输入网址
接下来步骤是输入用户名密码了，八爪鱼模拟的是人的操作行为，所以这一步过程也很简单
步骤2 在浏览器中鼠标点击用户名输入框→在右边弹出的提示里面选择“输入文字”→输入自己的用户名→选择“确定”。

同样的方式输入密码，这样输入用户名密码的步骤就完成了。

验证码登陆-控件识别方法-图2：输入密码
验证码登陆-控件识别方法-图3：输入密码
这里八爪鱼采集器需要知道
1.验证码图片在哪里
2.输入框验证码的框在哪里
步骤3 点击下方浏览器中验证码图片的位置→按照提示框中的提示选择浏览器中的验证码框→再按照提示框中的提示点击浏览器中的登陆按钮
验证码登陆-控件识别方法-图4：点击验证码输入框
验证码登陆-控件识别方法-图5：点击验证码图片位置、登录按钮
接下来需要配置验证码输入失败和成功的两种场景
步骤4 点击提示框中的确认按钮，系统会自动提交一个错误的验证码→然后点击浏览器中的“验证码不正确”提示→再点击提示框中的确认按钮→选择提示框中的“开始配置识别成功场景”→在提示框中输入显示出来的验证码→选择提示框中的“应用到网页并完成配置”选项
验证码登陆-控件识别方法-图6：点击确认按钮
验证码登陆-控件识别方法-图7：配置验证码输入失败场景
验证码登陆-控件识别方法-图8：配置验证码输入成功场景
验证码登陆-控件识别方法-图9：配置验证码输入成功场景
上述操作中验证码识别就完成了，接下来需要手动执行这个流程，任务会自动进去到登陆界面
步骤5 点击“流程”按钮→进入到流程界面→手动点击流程步骤（可以看到浏览器中会按照会执行这些步骤）→点到识别验证码步骤时→在辅助模式选项中输入浏览器中当前显示的验证码→选择应用到网页并提交
验证码登陆-控件识别方法-图10：辅助模式选项
这样操作之后，可以看到任务就正常登陆进去了。

步骤6 这里我随意提取一个数据仅供演示登陆功能，具体的操作可以参考新手入门的教程。

验证码登陆-控件识别方法-图11：提取数据
步骤7 接下来选择保存并启动按钮，系统将会在本地启动一个采集流程，当执行到输入验证码操作时，如果是购买过验证码套餐的，直接勾选“自动识别验证码”即可。

如果没有购买的这里手动输入点确定也是可以的，但是这里这个规则就不能用云采集。

验证码登陆-控件识别方法-图12：启动采集
验证码登陆-控件识别方法-图13：勾选自动识别验证码
相关采集教程：
天猫商品信息采集
豆瓣电影短评采集
大众点评评价采集
八爪鱼——70万用户选择的网页数据采集器。

1、操作简单，任何人都可以用：无需技术背景，会上网就能采集。

完全可视化流程，点击鼠标完成操作，2分钟即可快速入门。

2、功能强大，任何网站都可以采：对于点击、登陆、翻页、识别验证码、瀑布流、Ajax脚本异步加载数据的网页，均可经过简单设置进行采集。

3、云采集，关机也可以。

配置好采集任务后可关机，任务可在云端执行。

庞大云采集集群24*7不间断运行，不用担心IP被封，网络中断。

4、功能免费+增值服务，可按需选择。

免费版具备所有功能，能够满足用户的基本采集需求。

同时设置了一些增值服务（如私有云），满足高端付费企业用户的需要。