正则表达式在网页表单验证中的应用
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
正则表达式是用于模式匹配和替换的有力工具,它既可以用于数据有效性验证,如测试字符串是否匹配某种模式;又可以用于替换文本,即在文档中使用正则表达式查找标识特定文字,然后进行替换或删除;还可以根据模式匹配从字符串中提取一个子字符串,用来在指定文本或输入数据中查找特定文字。
正则表达式功能十分强大,但是又非常简洁。
本文主要阐述正则表达式的基本内涵,及它在网站表单数据验证中的应用。
1 正则表达式概述
正则表达式,又称正规表示法、常规表示法(R e g u l a r Expression,常简写为regex、regexp或RE),在计算机科学中,是指一个用来描述或者匹配一系列符合某个句法规则的字符串的单个字符串,即用事先定义好的一些特定字符及这些字符的组合,组成一个“规则字符串”,用来表达对字符串的一种过滤逻辑。
所谓匹配,是指在给定的字符串中,查找与给定的正则表达式相匹配的部分,满足条件的可能不止一个,每一个满足条件的部分都被称为一个匹配。
例如,最简单正则表达式"is"可以匹配“this”、“his”等字符串,但是不能匹配"Island"。
给定一个正则表达式和另一个字符串,可以验证给定的字符串是否符合正则表达式的过滤逻辑(又称“匹配”),或者可以从字符串中获取我们想要的特定部分。
在编写处理字符串的程序或网页时,经常需要验证或查找符合某些复杂规则的字符串,正则表达式就非常适用于描述这些复杂的文本规则。
因为正则表达式的主要应用对象是文本,所以可以说正则表达式是用于文本匹配的工具。
2 正则表达式语法
正则表达式主要由普通字符和特殊字符(又称元字符)组成。
普通字符主要包含英文字母a-z/A-Z、数字0-9等,而特殊字符都具有特殊的含义,比如,特殊字符“\d”可以匹配任意一位数字,而“\w”则可以匹配字母、数字或下划线字符,还有匹配子表达式出现次数的“*”(任意次)、“+”(至少一次)、“?”(零次或一次)等特殊字符。
例如查找“i s”,可以使用最简单的由普通字符组成的正则表达式“i s”,匹配含有“i s”的字符串,但是很多单词如this、his、kiss等都包含“is”,因此若要精确匹配查找“is”,不能只用“i s”正则查找,而是应该使用正则表达式“\b i s\b”(“\b”是一个特殊字符,它用来匹配一个单词的边界,即匹配单词的开头或结尾)。
3 应用正则表达式验证表单数据
在网站开发,尤其是动态网站开发方面,表单是客户端向服务器提交数据的重要载体,扮演者非常重要的角色。
如何验证表单提交数据的合法性也成为一个大问题。
为了验证提交数据的合法性,开发人员可能需要写很多的验证函数,这给开发工作带来很大的困扰,而应用正则表达式验证提交数据则很大提高了代码的可重用性,并提高了开发效率。
通常表单数据的验证主要有两方面:一方面是判断用户输入的数据是否合法;另一方面是提示用户的数据为什么是不合法的。
在表单数据中,通常需要验证的内容有字符串(如以字母开头、规定长度等)、邮政编码、电话号码、电子邮件、手机号码、身份证号码等。
4 常用的表单验证正则表达式
在网站开发时,复杂的表单验证经常需要使用正则表达式,在实际应用中,表单中常用的几类正则表达式如下。
(1)/^[a-zA-Z][\w -]{n,m}$/:验证以字母开头、包含字母、数字、下划线、连接符- ,且长度在(n+1)-(m+1)之间的字符串。
(2)/^[\u4E00-\u9FA5]+$/:验证输入的数据只能为中文。
正则表达式在网页表单验证中的应用
孙立友1 梁宏英2
(1.北京信息职业技术学院,北京 100018;2.北京农学院,北京 102206)
摘要:在网站制作,尤其是应用B/S(Browser/Server,浏览器/服务器)架构的动态网站,表单扮演了非常重要的角色,它是客户端向服务器提交数据的载体。
为了保证表单提交数据的合法性,需要对提交的某些关键数据进行验证。
本文主要论述如何应用正则表达式验证表单数据,并给出了几类常用的表单验证正则表达式。
关键词:表单;正则表达式;网站制作
中图分类号:TP31文献标识码:A文章编号:1007-9416(2017)01-0236-01
收稿日期:2016-11-09
作者简介:孙立友(1977—),男,河北衡水人,硕士,北京信息职业技术学院,讲师,研究方向为软件测试、教育理论;梁宏英(1976—),女,河北衡水人,硕士,北京农学院,讲师,研究方向为应用数学、教育理论。
······下转第238页
内容时就可以采取数据实施的方式。
动态获取是建立在静态设置的基础之上,网络软件中使用的组播地址是不相同的,并且只是在运行的时候可以确定,在网络软件设计的时候应该先设置好组播的地址,当组播方式的系统建立起来之后就可以先侦听一段时间,当发现自己的组播地址没有发生冲突之后就可以继续的使用静态组播地址,如果出现了冲突就可以按照某种算法来设计静态地址,就需要及时的告知其他的成员软件来设计出新的组播形式,这个数据可以在网络软件中得到识别让该组播软件不会识别数据。
组播方式的网络软件设计时要充分考虑到数据标志与安全性,组播的范围要有一定的随意性,安全性方面也应该依赖于数据,可以对数据进行授权的操作等。
3 结语
综上所述,本文主要分析了网络软件中的数据传送技术的问题,计算机网络系统的应用范围逐渐扩大,人们对网络系统的依赖性也慢慢变大,我们可以了解到在实际的
网络中以及软件工作的过程中,如果出现以广播为数据传输的形式就会造成资源的浪费现象,从而导致网络通信的阻塞。
因此广播通常不会被人们所提倡,利用组播的方式也能让更多的用户了解到网络软件中数据传输的工作形式,相信在众多技术人员的共同努力之下,未来我国的网络软件中数据传送技术会取得更大的发展,迈上新的历史阶段。
参考文献
[1]王荣华.GSM 网络优化工具路测模块系统的设计与实现[D].上海交通大学,2013.
[2]白日昕.基于以太网络的数据传输系统设计研究[J].计算机光盘软件与应用,2011(13).
[3]金志刚,赵西满,何超.P2P 网络立体电视网络传输及播放优化[J].天津大学学报,2012(7).
······上接第235页
······上接第236页
(3)/^[\w-]+(\.[\w-]+)*@[\w-]+(\.[\w-]+)+$/:验证输入的E m a i l 格式是否正确。
(4)/^\d{15}$|^\d{17}([0-9]|X)$/或者/^\d{15}$|^\d{17}([0-9]|X)$:验证身份证号码(身份证号码为15位或者18位,15位时全为数字,18位时前17位为数字,最后一位是校验位,可能为数字或字符X )。
(5)/^[1-9]\d{5}$/:验证中国邮政编码。
(6)/^[1-9][0-9]{4,}$/:用于验证QQ号码,QQ号码最少是5位。
(7)/^1\d{10}$/:验证大陆手机号码。
5 结语
正则表达式是用来操作文本和数据的强大工具,它具有易用、灵活、功能强大的优点,而且还可以将那些原本复
杂、繁琐的文本处理过程变成可自动处理的工作。
应用正则表达式处理复杂字符操作,不仅可以提高工作效率,而且也可以在一定程度上节省代码量。
但是,对于初学者来说,正则表达式的语法比较晦涩难懂,原理比较复杂,不容易被学习和掌握。
而且,如果正则表达式写得不合理,很容易导致性能问题,所以只有清楚地理解正则引擎的执行方式,才能写出好的正则表达式。
参考文献
[1]Jeffrey E.F.Friedl 著,余晟译.精通正则表达式(第3版).电子工业出版社,2012.
[2]Micbael Fitzgerald.正则表达式入门.东南大学出版社,2013.[3]Jan Goyvaerts Steven Levithan 著 郭耀 迟骋译.正则表达式经典实例(第2版).人民邮电出版社,2014.
功能。
对于机器语言来说,其所使用的输入/输出设备为具体存储读或写数据的存储器,且每个存储器都有一个独立的地址编码;而对于高级语言来说,结合系统软件的支持,大众化、便捷化、易用化的计算机输入/输出设备就能够支持其实现自身语言的输入/输出,由此我们就能够发现科技进步在计算机编程语言中的体现。
3 结语
在本文就计算机编程语言的发展与输入输出设备的使用研究中,笔者详细论述了计算机编程语言的发展历程、不同计算机编程语言需要的输入/输出设备,结合这一
论述内容我们能够清楚的认识到科技发展在计算机编程语言与其输入/输出设备中的体现。
参考文献
[1]宋明杰.计算机编程语言的发展与输入输出设备的使用[J].辽宁大学学报(自然科学版),2005,02:148-149.
[2]张波.计算机编程语言的发展与输入输出设备的使用[J].计算机光盘软件与应用,2012,21:200+202.
[3]王婧.计算机编程语言的发展与输入输出设备的使用[J].黑龙江科技信息,2014,15:133.
[4]朱玉娟.计算机输入输出设备的使用与程序语言的发展[J].硅谷,2013,07:133+102.。