验证码自动识别的应用
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
验证码自动识别的应用一、验证码的由来
智能时代的到来给我们的生活带来了很多的新鲜词,“验证码”便是在这样的背景之下诞生的。
垃圾评论和垃圾邮件可以轻松通过任何一个网站的注册程序,通过各种方式轰炸人民群众的眼球。
最先想要解决这一问题的是雅虎——作为互联网时代早期最重要的免费邮件提供商,他们一方面要解决用户们每天遇到的数以百计的垃圾邮件轰炸,另一方面,他们自己的免费邮箱,恰恰又是垃圾邮件的最爱耗费无数资源所阻止的垃圾邮件,都来自于自己的服务器。这让雅虎开始认真考虑如何解决人机辨识问题。(摘自网络文章)
二、验证码识别技术的背景
在国内验证码识别技术还是在摸索阶段,但是却无法阻挡它的发展。2009年,A.A. Chandavale等针对EZ-Gimpy 的四类验证码分别进行了识别。2008年,Jeff Yan等人以高达90%以上的识别率破解了微软先前的验证码。2005年,
Edward Aboufadel,Julia Olsen和Jesse Windle通过将字符旋转至水平并对单个字符应用Harr小波滤波结果作为特征,以接近100%的识别率破解了the Holiday Inn Priority Club的验证码。【摘自:验证码识别技术研究】
三、验证码识别技术的技术原理
为简单起见,破解说明主要针对是第2种类型的,先来看看网上常见的这种验证码的图片:
一种,最容易,图片背景和数字都使用相同的颜色,字符规整,字符位置统一。
二种,看似不容易,其实仔细研究会发现其规则,背景色和干扰素无论怎么变化,验证字符字符规整,颜色相同,所以排除干扰素非常容易,只要是非字符色素全部排除即可。
三种,看似更复杂,处理上面提到背景色和干扰素一直变化外,验证字符的颜色也在变化,并且各个字符的颜色也各不相同。
四种,除了第三个图片上提到的特征外,又在文字上加了两
条直线干扰率,看似困难其实,很容易去掉。
四、验证码识别技术的应用
验证码识别作为一种图灵测试,综合了图像处理、机器视觉、模式识别、人工智能等多个领域的研究。其研究成果不仅对于CAPTCHA识别这项图灵测试本身是一种挑战,更对这些领域中的其他研究有帮助,很多研究成果可以推广到其他的应用领域。例如手写文字识别技术(即OCR技术)等。
1、网络机器人技术,破解图片验证码,用来实现邮箱注册、信息群发、自动登录等功能。
2、小软件开发的批量破解验证码;
3、人工打码和验证码识别的结合;
五、验证码识别技术的应用实例(以答题吧打码平台为例)
通过验证码识别技术和用户软件开发者进行对接识别,帮助用户实现盈利的目的。(示例图)