正则表达式语法及常用规则
正则表达式语法大全
正则表达式语法大全前言:一般开发中都会接触到正则表达式,作为一名合格的前端,也应该了解一下正则表达式编写原则,便于自己也能快速编写想要的正则表达式。
1、作用(正则表达式是一种字符串匹配的模式)数据验证:比如电话号码、邮箱等替换文本:快速找到特定文本,用于替换快速提取字符串:基于匹配原则,快速从文档中查找或提取子字符串2、语法(普通字符+特殊字符)普通字符[abc] 匹配[...]的所有字符[^abc] 取反,除了[...]的其他字符[A-Z] 区间字母A到Z.匹配除(\n换行符 \r 回车符)的任何单个字符\s \S 匹配所有,\s所有空白符,包括换行 \S非空白符,不包括换行\w 匹配字母、数字、下划线特殊字符$ 结尾位置(匹配$字符----\$)^ 开始位置(匹配$字符----\^)() 子表达式开始和结束(匹配字符----\( 和 \))* 匹配零次或多次(匹配字符----\*)+匹配一次或多次(匹配字符----\+)匹配零次或一次(匹配字符----\?)| 两项间的一个(匹配字符----\|)限定符{n} n为非负整数,匹配n次{n,} n为非负整数,至少n次{n,m} n为非负整数,n<=m,最少n次,最多m次修饰符i 不区分大小写g 全局匹配m 多行匹配s 特殊字符远点包含换行符3、常用场景•16进制颜色/^#([a-fA-F0-9]{6}|[a-fA-F0-9]{3})$/以#开始,6或3个字符(A-F、a-f、0-9)结尾•电话号码/^1(3\d|4[5-9]|5[0-35-9]|6[2567]|7[0-8]|8\d|9[0-35-9])\d{8}$/以1开头,3可跟任一数字(\d),4可跟5-9,5可跟0-3或5-9 ,6后2567其中一个,7后是0-8,8后任一数字,9后是0-3或3-5,其余8位是任意数字(\d{8})•身份证号/^[1-9]\d{5}(19|20|21)\d{2}(0[1-9]|10|11|12)(0[1-9]|[1-2]\d|30|31)\d{3}[\dX]$/ 第一位在0-9区间,后面是5位任意数字,4位年份(19、20、21开头,后两位任意),两位代表月份(0开头的1-9或者是10、11、12),两位日期(01-31),三位顺序码,最后一位是校验码,可数字可X•网址/^((https?):)?\/\/([^?:/]+)(:(\d+))?(\/[^?]*)?(\?(.*))?/•邮箱^[A-Za-z0-9-_\u4e00-\u9fa5]+@[a-zA-Z0-9_-]+(\.[a-zA-Z0-9_-]+)+$ 名称有汉字([\ue00-\u9fa5])、字母([a-zA-z])、数字、下划线、中划线,域名有数字、字母、下划线、中划线4、使用方法字符串.match(正则):返回符合的字符串,若不满足返回null字符串.search(正则):返回搜索到的位置,若非一个字符,则返回第一个字母的下标,若不匹配则返回-1字符串.replace(正则,新的字符串):找到符合正则的内容并替换正则.test(字符串):在字符串中查找符合正则的内容,满足则返回true,反之为false说明:new RegExp(规则).test(字符串)和上面写法作用相同。
如何在MySQL中使用正则表达式查询和替换数据
如何在MySQL中使用正则表达式查询和替换数据引言:MySQL是一种广泛使用的关系型数据库管理系统,而正则表达式是一种强大的文本处理工具。
使用正则表达式,我们可以更加灵活地进行数据的查询和替换。
本篇文章将介绍如何在MySQL中使用正则表达式进行数据查询和替换,以帮助读者更加高效地处理数据。
一、正则表达式概述正则表达式是一种用于匹配和处理文本的工具。
它通过定义一种规则模式来匹配符合某种模式的字符串,并进行相应的操作。
MySQL中,使用正则表达式可以在查询语句中实现更加复杂的数据匹配和替换。
二、使用正则表达式进行数据查询在MySQL中,我们可以使用REGEXP运算符来进行正则表达式的匹配。
下面是一个简单的例子:SELECT * FROM table_name WHERE column_name REGEXP 'pattern';其中,table_name是要查询的表名,column_name是要匹配的字段名,pattern 是所匹配的正则表达式模式。
例如,我们想要查询一个表中用户名为5位数字开头的数据,可以使用如下的查询语句:SELECT * FROM users WHERE username REGEXP '^[0-9]{5}';这个查询将返回用户名为5位数字开头的所有用户信息。
三、使用正则表达式进行数据替换在MySQL中,我们可以使用REGEXP_REPLACE函数来进行正则表达式的替换。
其语法如下:UPDATE table_name SET column_name = REGEXP_REPLACE(column_name, 'pattern', 'replacement');其中,table_name是要更新数据的表名,column_name是要更新的字段名,pattern是所匹配的正则表达式模式,replacement是替换的字符串。
js常用的正则表达式
js常用的正则表达式前言JavaScript中的正则表达式被广泛用于字符串的匹配和替换,可以让代码更加优雅和高效。
本文将介绍JS中常用的正则表达式及其用法,希望能对初学者有所帮助。
一、基本语法正则表达式由字面值和特殊字符两种类型组成。
字母、数字、空格等都表示字面值,而特殊符号则表示特定含义,例如/d代表数字,/s代表空格等。
正则表达式用斜杠“/”将其包裹起来。
二、常用正则表达式1. 匹配IP地址/^(\d{1,3}\.){3}\d{1,3}$/使用说明: \d表明是数字,{1,3}表明可以是一个到三个数字,\.表示点,^表示字符串开始,$表示字符串结束。
2. 匹配邮箱/^\w+([-+.]\w+)*@\w+([-.]\w+)*\.\w+([-.]\w+)*$/使用说明: \w表示字母数字下划线,[-+.]表示这些特殊字符中的一个,*表示出现零次或多次。
3. 匹配电话号码/^[1][3,4,5,7,8][0-9]{9}$/使用说明: [1]表示以1开头,[3,4,5,7,8]表示第二个数字只能是这些中的一个,[0-9]{9}表示后面必须跟九个数字。
4. 匹配URL地址/^(http|https):\/\/[a-zA-Z0-9]+[\.a-zA-Z0-9_-]*[a-zA-Z0-9]+(\/\S*)?$/使用说明: (http|https)表示http或https,\/\/表示两个斜杠,[a-zA-Z0-9]表示字母数字任意一个,+表示一个或多个,[\.a-zA-Z0-9_-]*表示出现零次或多次,\/表示斜杠,\S表示任意一个非空白字符。
5. 匹配HTML标签/<\/?[^>]+>/gi使用说明: \?表示出现零次或一次,[^>]表示不是大于号的字符,+表示一个或多个,/i使匹配忽略大小写,/g表示全局匹配。
6. 匹配中文字符/[\u4e00-\u9fa5]/使用说明: [\u4e00-\u9fa5]表示从\u4e00到\u9fa5这个区间的所有字符。
正则表达式实用语法大全
正则表达式实用语法大全正则表达式是一种强大的文本匹配和处理工具,它可以用来在字符串中查找、替换和提取特定的模式。
下面是一些常用的正则表达式实用语法:1. 字符匹配。
\d: 匹配数字。
\w: 匹配字母、数字、下划线。
\s: 匹配空白字符。
. : 匹配任意字符。
2. 重复匹配。
: 匹配前面的元素零次或多次。
+ : 匹配前面的元素一次或多次。
: 匹配前面的元素零次或一次。
{n} : 匹配前面的元素恰好n次。
{n,} : 匹配前面的元素至少n次。
{n,m} : 匹配前面的元素至少n次,至多m次。
3. 边界匹配。
^ : 匹配字符串的开头。
$ : 匹配字符串的结尾。
\b : 匹配单词的边界。
4. 分支条件。
| : 匹配多个表达式中的一个。
5. 分组。
( ) : 将表达式分组。
(?: ) : 只匹配不捕获分组。
(?<name> ) : 命名捕获分组。
6. 贪婪与非贪婪。
: 匹配前面的元素零次或多次,尽量少匹配。
+? : 匹配前面的元素一次或多次,尽量少匹配。
: 匹配前面的元素零次或一次,尽量少匹配。
{n,m}? : 匹配前面的元素至少n次,至多m次,尽量少匹配。
7. 反义。
\D : 匹配非数字。
\W : 匹配非字母、数字、下划线。
\S : 匹配非空白字符。
8. 转义字符。
\ : 转义特殊字符。
以上是一些常用的正则表达式实用语法,通过灵活运用这些语法,可以实现对文本的高效处理和匹配。
希望这些内容对你有所帮助。
正则表达式-语法大全
正则表达式-语法⼤全1. 正则表达式规则1.1 普通字符字母、数字、汉字、下划线、以及后边章节中没有特殊定义的标点符号,都是"普通字符"。
表达式中的普通字符,在匹配⼀个字符串的时候,匹配与之相同的⼀个字符。
,匹配结果是:成功;匹配到的内容是:"c";匹配到的位置是:开始于2,结束于3。
(注:下标从0开始还是从1开始,因当前编程语⾔的不同⽽可能不同),匹配结果是:成功;匹配到的内容是:"bcd";匹配到的位置是:开始于1,结束于4。
1.2 简单的转义字符⼀些不便书写的字符,采⽤在前⾯加 "/" 的⽅法。
这些字符其实我们都已经熟知了。
表达式可匹配/r, /n代表回车和换⾏符/t制表符//代表 "/" 本⾝还有其他⼀些在后边章节中有特殊⽤处的标点符号,在前⾯加 "/" 后,就代表该符号本⾝。
⽐如:^, $ 都有特殊意义,如果要想匹配字符串中 "^" 和 "$" 字符,则表达式就需要写成 "/^" 和 "/$"。
表达式可匹配/^匹配 ^ 符号本⾝/$匹配 $ 符号本⾝/.匹配⼩数点(.)本⾝这些转义字符的匹配⽅法与 "普通字符" 是类似的。
也是匹配与之相同的⼀个字符。
,匹配结果是:成功;匹配到的内容是:"$d";匹配到的位置是:开始于3,结束于5。
1.3 能够与 '多种字符' 匹配的表达式正则表达式中的⼀些表⽰⽅法,可以匹配 '多种字符' 其中的任意⼀个字符。
⽐如,表达式 "/d" 可以匹配任意⼀个数字。
虽然可以匹配其中任意字符,但是只能是⼀个,不是多个。
这就好⽐玩扑克牌时候,⼤⼩王可以代替任意⼀张牌,但是只能代替⼀张牌。
汉字、英文、数字、下划线、括号_正则表达式
汉字、英文、数字、下划线、括号正则表达式1. 引言概述:本文将详细介绍汉字、英文、数字、下划线和括号正则表达式的基本知识和应用。
正则表达式是一种强大的文本模式匹配工具,可以有效地检索、替换和验证字符串。
通过学习各种类型的正则表达式,读者将能够在实际的编程和文本处理任务中更加灵活地使用它们。
文章结构:本文共分为五个部分,分别介绍汉字、英文、数字、下划线和括号的正则表达式。
每个部分都包含基础知识的介绍、匹配方法的讲解以及实例与案例分析,以帮助读者更加深入地理解和应用这些正则表达式。
目的:通过阅读本文,读者将了解如何使用正则表达式来针对不同类型的字符进行匹配,并能够根据自己的需求设计相应的模式。
同时,读者还将通过实例与案例分析掌握如何在实际问题中应用不同类型的正则表达式,提高编程效率。
接下来,在第二部分“2. 汉字正则表达式”中,我们将深入探讨汉字正则表达式的基本介绍、匹配方法以及示例与应用。
2. 汉字正则表达式2.1 基本介绍汉字是中文的基本字符,它们在许多应用和场景中都是必不可少的。
为了有效地处理和匹配汉字,我们可以使用正则表达式。
2.2 匹配方法在正则表达式中,我们可以使用一些特殊的字符来匹配汉字。
以下是一些常用的匹配规则:- [\u4e00-\u9fa5]:这个匹配规则可以用于匹配所有的汉字。
它使用了Unicode 编码范围来表示汉字的范围,从\u4e00到\u9fa5。
- [一-龥]:这个匹配规则也可以用于匹配所有的汉字。
它使用了Unicode编码点来表示汉字的范围,从一到龥。
具体来说,这些规则可以用在正则表达式的字符集合([...])中作为一个选项。
例如,要查找一个字符串中是否包含任意一个汉字,我们可以使用类似于/[一-龥]/的正则表达式模式来实现。
2.3 示例与应用下面是一些示例和应用场景,展示了如何使用汉字正则表达式进行匹配:- 验证汉字:如果你想验证一个字符串是否只包含汉字,并且没有其他字符,可以使用/^[一-龥]+$/的正则表达式。
wps正则表达式
wps正则表达式WPS正则表达式是一种强大的文本处理工具,它可以用来匹配和替换文本中的特定字符或字符串。
正则表达式在日常工作中非常实用,尤其是在处理大量文本数据时,可以大大提高工作效率。
本文将介绍WPS正则表达式的基本概念、语法和应用。
一、正则表达式的基本概念正则表达式是一种描述文本模式的语言,它可以用来匹配和替换文本中的特定字符或字符串。
正则表达式是由特定的符号和字符组成的,这些符号和字符有特定的含义和作用。
正则表达式可以用来匹配文本中的单个字符、字符串、数字、空格等,还可以用来匹配一些特定的格式,如电子邮件地址、电话号码等。
二、正则表达式的语法正则表达式的语法比较复杂,但是掌握了基本的语法规则,就可以轻松地编写出各种复杂的正则表达式。
下面是一些常用的语法规则: 1.字符匹配字符匹配是正则表达式中最基本的元素之一,它用来匹配文本中的单个字符。
字符匹配可以使用普通字符、元字符和转义字符来表示,例如:a.普通字符:表示文本中的一个字母或一个数字,例如:匹配单个字母a:a匹配单个数字5:5b.元字符:表示一些特殊的字符或字符集合,例如:匹配任意字符:.匹配数字:d匹配非数字:D匹配空格:s匹配非空格:Sc.转义字符:用来表示一些特殊的字符或字符集合,例如:匹配正斜杠:匹配左括号:(匹配右括号:)2.字符集合字符集合用来匹配一组字符中的任意一个字符,例如:匹配元音字母:[aeiou]匹配数字和字母:[0-9a-zA-Z]3.重复匹配重复匹配用来表示一个字符或字符集合重复出现的次数,例如:匹配三个a:a{3}匹配至少两个数字:d{2,}匹配任意数量的字符:.*4.位置匹配位置匹配用来表示字符或字符集合出现的位置,例如:匹配行首:^匹配行尾:$匹配单词边界:b三、WPS正则表达式的应用WPS正则表达式可以应用于多种场景,例如:1.文本替换WPS正则表达式可以用来替换文本中的特定字符或字符串,例如:将文本中的所有空格替换为下划线:将“s”替换为“_”将文本中的所有数字替换为空格:将“d”替换为空格2.数据清洗WPS正则表达式可以用来清洗数据中的特定字符或字符串,例如:清除文本中的HTML标签:将“<.*?>”替换为空格清除文本中的非数字字符:将“D”替换为空格3.格式匹配WPS正则表达式可以用来匹配特定格式的文本,例如:匹配电子邮件地址:将“w+@w+.w+”用于匹配匹配电话号码:将“(d{3})-(d{8})”用于匹配总结:WPS正则表达式是一种非常实用的文本处理工具,它可以用来匹配和替换文本中的特定字符或字符串。
java正则表达式规则
java正则表达式规则Java正则表达式规则一、什么是正则表达式正则表达式(Regular Expression),简称正则,是一种用来匹配字符串的强大工具。
它可以用来判断一个字符串是否符合某个模式,或者从字符串中提取出符合某个模式的部分。
二、正则表达式语法1. 字符类字符类用来匹配一个字符,可以使用方括号[] 来指定字符的范围或多个字符的集合。
例如,[abc]可以匹配字符'a'、'b'或'c',[a-z]可以匹配任意小写字母。
2. 元字符元字符是正则表达式中具有特殊含义的字符。
常用的元字符有:- .:匹配任意单个字符,除了换行符。
- \d:匹配任意一个数字字符。
- \D:匹配任意一个非数字字符。
- \w:匹配任意一个字母、数字或下划线。
- \W:匹配任意一个非字母、数字或下划线。
- \s:匹配任意一个空白字符(包括空格、制表符、换行符等)。
- \S:匹配任意一个非空白字符。
- $:匹配字符串的结束位置。
3. 量词量词用来指定字符或字符类重复出现的次数。
常用的量词有:- *:匹配前一个字符或字符类出现0次或多次。
- +:匹配前一个字符或字符类出现1次或多次。
- ?:匹配前一个字符或字符类出现0次或1次。
- {n}:匹配前一个字符或字符类出现n次。
- {n,}:匹配前一个字符或字符类出现至少n次。
- {n,m}:匹配前一个字符或字符类出现至少n次、至多m次。
4. 分组和捕获使用小括号() 可以将一系列字符组成一个子表达式,方便进行分组和捕获。
例如,(abc)可以匹配字符串"abc"。
5. 贪婪与非贪婪正则表达式默认是贪婪模式,即尽可能多地匹配字符。
可以在量词后面加上?来使用非贪婪模式,即尽可能少地匹配字符。
6. 边界匹配边界匹配用来限定匹配字符串的边界。
常用的边界匹配符有:- \b:匹配单词的边界。
- \B:匹配非单词的边界。
- $:匹配字符串的结束位置。
正则表达式介绍
正则表达式介绍正则表达式是一种强大的文本处理工具,它用于匹配、查找和替换文本中的模式。
它是一种特殊的语法,可以用于描述字符串的结构和内容。
在日常工作中,我们经常需要处理各种各样的文本数据,比如文本文件、数据库中的数据、网页中的内容等。
而正则表达式正是将这些文本数据进行有效处理的利器。
正则表达式的语法非常丰富,包含了大量的元字符和语法规则。
下面我们就来介绍一些常见的元字符和语法规则。
元字符元字符是正则表达式中的基本单位,它用于表示某种特殊的文本字符或字符集。
下面是一些常见的元字符:1. . :用于匹配任意一个字符,除了换行符(\n)。
2. ^ :用于匹配字符串的开头。
3. $ :用于匹配字符串的结尾。
4. * :用于匹配前面的字符出现0次或多次。
5. + :用于匹配前面的字符出现1次或多次。
6. ? :用于匹配前面的字符出现0次或1次。
7. | :用于表示或者的关系。
语法规则除了元字符之外,正则表达式还包含了许多语法规则。
下面是一些常见的语法规则:1. 字符集:方括号([])内表示要匹配的字符集,可以使用连字符(-)表示范围。
比如[0-9]表示匹配0到9之间的任意数字。
2. 分组:用小括号()来把多个元字符组合起来,形成一个整体。
比如(ab)+表示匹配一个或多个连续的"ab"。
3. 反向引用:用反斜杠(\)加数字来引用前面的分组。
比如(\w)\1表示匹配出现两次的任意单词字符。
4. 贪婪/非贪婪:在元字符后面加上问号(?)可以实现非贪婪模式。
比如.*?表示匹配尽可能少的任意字符。
5. 零宽度断言:用于限定匹配的位置,但不会消耗任何字符。
比如正向预查(?=)表示必须跟着某个模式,但不包含该模式;负向预查(?!)表示必须不跟着某个模式。
应用实例下面我们通过一些实例来演示正则表达式的应用:1. 匹配手机号码:^(13\d|14[579]|15[^4\D]|17[^49\D]|18\d)\d{8}$2. 匹配IP地址:^([01]?\d\d?|2[0-4]\d|25[0-5])\.([01]?\d\d?|2[0-4]\d|25[0-5])\.([01]?\d\d?|2[0-4]\d|25[0-5])\.([01]?\d\d?|2[0-4]\d|25[0-5])$3. 匹配邮箱地址:^\w+([-+.]\w+)*@\w+([-.]\w+)*\.\w+([-.]\w+)*$4. 匹配HTML标签:<(?:"[^"]*"['"]*|'[^']*'['"]*|[^'">])+>结语正则表达式是一个非常强大的工具,可以用于各种各样的文本处理任务。
正则表达式实用语法大全
正则表达式基本符号:^ 表示匹配字符串的开始位置 (例外用在中括号中[ ] 时,可以理解为取反,表示不匹配括号中字符串)$ 表示匹配字符串的结束位置* 表示匹配零次到多次+ 表示匹配一次到多次 (至少有一次)表示匹配零次或一次. 表示匹配单个字符| 表示为或者,两项中取一项( ) 小括号表示匹配括号中全部字符[ ] 中括号表示匹配括号中一个字符范围描述如[0-9 a-z A-Z]{ } 大括号用于限定匹配次数如 {n}表示匹配n个字符 {n,}表示至少匹配n个字符{n,m}表示至少n,最多m\ 转义字符如上基本符号匹配都需要转义字符如 \* 表示匹配*号\w 表示英文字母和数字 \W 非字母和数字\d 表示数字 \D 非数字常用的正则表达式匹配中文字符的正则表达式: [\u4e00-\u9fa5]匹配双字节字符(包括汉字在内):[^\x00-\xff]匹配空行的正则表达式:\n[\s| ]*\r匹配HTML标记的正则表达式:/<(.*)>.*<\/\1>|<(.*) \/>/匹配首尾空格的正则表达式:(^\s*)|(\s*$)匹配IP地址的正则表达式:/(\d+)\.(\d+)\.(\d+)\.(\d+)/g //匹配Email地址的正则表达式:\w+([-+.]\w+)*@\w+([-.]\w+)*\.\w+([-.]\w+)*匹配网址URL的正则表达式:http://(/[\w-]+\.)+[\w-]+(/[\w- ./?%&=]*)?sql语句:^(select|drop|delete|create|update|insert).*$1、非负整数:^\d+$2、正整数:^[0-9]*[1-9][0-9]*$3、非正整数:^((-\d+)|(0+))$4、负整数:^-[0-9]*[1-9][0-9]*$5、整数:^-?\d+$6、非负浮点数:^\d+(\.\d+)?$7、正浮点数:^((0-9)+\.[0-9]*[1-9][0-9]*)|([0-9]*[1-9][0-9]*\.[0-9]+)|([0-9]*[1-9][0-9]*))$8、非正浮点数:^((-\d+\.\d+)?)|(0+(\.0+)?))$9、负浮点数:^(-((正浮点数正则式)))$10、英文字符串:^[A-Za-z]+$11、英文大写串:^[A-Z]+$12、英文小写串:^[a-z]+$13、英文字符数字串:^[A-Za-z0-9]+$14、英数字加下划线串:^\w+$15、E-mail地址:^[\w-]+(\.[\w-]+)*@[\w-]+(\.[\w-]+)+$16、URL:^[a-zA-Z]+://(\w+(-\w+)*)(\.(\w+(-\w+)*))*(\?\s*)?$ 或:^http:\/\/[A-Za-z0-9]+\.[A-Za-z0-9]+[\/=\?%\-&_~`@[\]\':+!]*([^<>\"\"])*$17、邮政编码:^[1-9]\d{5}$18、中文:^[\u0391-\uFFE5]+$19、电话号码:^((\d2,3)|(\d{3}\-))?(0\d2,3|0\d{2,3}-)?[1-9]\d{6,7}(\-\d{1,4})?$20、手机号码:^((\d2,3)|(\d{3}\-))?13\d{9}$21、双字节字符(包括汉字在内):^\x00-\xff22、匹配首尾空格:(^\s*)|(\s*$)(像vbscript那样的trim函数)23、匹配HTML标记:<(.*)>.*<\/\1>|<(.*) \/>24、匹配空行:\n[\s| ]*\r25、提取信息中的网络链接:(h|H)(r|R)(e|E)(f|F) *=*('|")?(\w|\\|\/|\.)+('|"| *|>)?26、提取信息中的邮件地址:\w+([-+.]\w+)*@\w+([-.]\w+)*\.\w+([-.]\w+)*27、提取信息中的图片链接:(s|S)(r|R)(c|C) *= *('|")?(\w|\\|\/|\.)+('|"| *|>)?28、提取信息中的IP地址:(\d+)\.(\d+)\.(\d+)\.(\d+)29、提取信息中的中国手机号码:(86)*0*13\d{9}30、提取信息中的中国固定电话号码:(\d3,4|\d{3,4}-|\s)?\d{8}31、提取信息中的中国电话号码(包括移动和固定电话):(\d3,4|\d{3,4}-|\s)?\d{7,14}32、提取信息中的中国邮政编码:[1-9]{1}(\d+){5}33、提取信息中的浮点数(即小数):(-?\d*)\.?\d+34、提取信息中的任意数字:(-?\d*)(\.\d+)?35、IP:(\d+)\.(\d+)\.(\d+)\.(\d+)36、电话区号:/^0\d{2,3}$/37、腾讯QQ号:^[1-9]*[1-9][0-9]*$38、帐号(字母开头,允许5-16字节,允许字母数字下划线):^[a-zA-Z][a-zA-Z0-9_]{4,15}$39、中文、英文、数字及下划线:^[\u4e00-\u9fa5_a-zA-Z0-9]+$。
c语言中的正则表达式
c语言中的正则表达式C语言中的正则表达式正则表达式是一种强大的模式匹配工具,常用于字符串的匹配、查找和替换。
在C语言中,我们可以使用正则表达式库来实现对字符串的高效处理。
本文将介绍C语言中的正则表达式的基本语法和用法,并通过示例代码展示其在实际应用中的作用。
一、正则表达式的基本语法C语言中的正则表达式使用的是POSIX标准的正则表达式语法。
下面是一些常用的正则表达式元字符和操作符:1. 字符类- []:匹配方括号中的任意一个字符,例如[abc]可以匹配字符a、b或c。
- [^]:匹配除方括号中的字符以外的任意一个字符,例如[^abc]可以匹配除了a、b和c以外的任意字符。
- -:表示字符范围,例如[a-z]表示匹配任意小写字母。
2. 重复次数- *:匹配前面的表达式零次或多次。
- +:匹配前面的表达式一次或多次。
- ?:匹配前面的表达式零次或一次。
- {n}:匹配前面的表达式恰好n次。
- {n,}:匹配前面的表达式至少n次。
- {n,m}:匹配前面的表达式至少n次但不超过m次。
3. 特殊字符- .:匹配任意一个字符。
- \:转义字符,用于匹配特殊字符本身,例如\.匹配点字符。
- ^:匹配行的开始位置。
- $:匹配行的结束位置。
二、C语言中的正则表达式库在C语言中,我们可以使用正则表达式库来实现对字符串的匹配、查找和替换。
常用的正则表达式库有POSIX标准库和PCRE库。
1. POSIX标准库POSIX标准库提供了一系列函数来处理正则表达式,包括编译正则表达式、执行匹配和释放资源等。
常用的函数有:- regcomp:编译正则表达式。
- regexec:执行正则表达式匹配。
- regfree:释放已编译的正则表达式。
下面是一个使用POSIX标准库的示例代码:```c#include <regex.h>#include <stdio.h>int main() {regex_t regex;int ret;// 编译正则表达式ret = regcomp(®ex, "a.*b", REG_EXTENDED); if (ret != 0) {printf("正则表达式编译失败\n");return -1;}// 执行匹配ret = regexec(®ex, "abc", 0, NULL, 0);if (ret == 0) {printf("匹配成功\n");} else if (ret == REG_NOMATCH) {printf("未匹配到结果\n");} else {printf("匹配失败\n");}// 释放资源regfree(®ex);return 0;}```2. PCRE库PCRE库是Perl Compatible Regular Expressions的缩写,是一个功能强大的正则表达式库,提供了更多的特性和功能。
c语言正则表达式规则
c语言正则表达式规则摘要:一、正则表达式的基本概念1.正则表达式的定义2.正则表达式的作用二、C语言中的正则表达式1.C语言正则表达式的基本语法2.C语言正则表达式的常见函数三、正则表达式的应用场景1.字符串匹配2.数据验证四、正则表达式的高级特性1.贪婪与懒惰匹配2.零宽断言3.反向引用五、正则表达式的使用注意事项1.字符集与量词2.特殊字符与元字符正文:一、正则表达式的基本概念正则表达式(Regular Expression),又称正规表达式、规则表达式,是一种用于描述字符或字符序列的抽象表达式。
它通过一定的语法规则来表示字符串的匹配模式,常用于文本搜索与匹配、数据验证等领域。
1.正则表达式的定义正则表达式是一种用来描述字符或字符序列的抽象表达式,通常由一系列字符、元字符和量词组成。
它用于表示一个字符串的模式,可以用来检查一个字符串是否符合某种规则,或者将符合规则的字符串提取出来。
2.正则表达式的作用正则表达式的主要作用是用于匹配和查找字符串。
它可以帮助程序员快速地检查字符串是否符合某种特定的模式,或者从大量的文本数据中提取出符合特定规则的字符串。
正则表达式在许多编程语言中都有应用,如C语言、Java、Python等。
二、C语言中的正则表达式C语言中,正则表达式的实现主要依赖于库函数。
常用的库函数包括`strlen()`、`strcmp()`、`strstr()`等。
此外,还有一些第三方库,如PCRE (Perl Compatible Regular Expressions),提供了更强大的正则表达式支持。
1.C语言正则表达式的基本语法在C语言中,正则表达式的基本语法包括字符集、元字符、量词等。
通过这些语法元素,可以组合成各种复杂的正则表达式模式。
2.C语言正则表达式的常见函数C语言中,常用的正则表达式函数包括`regexec()`、`regerror()`等。
这些函数可以帮助程序员实现正则表达式的编译、匹配等功能。
js 正则表达式校验规则
js 正则表达式校验规则正则表达式(Regular Expression)是一种用来匹配和处理文本的强大工具。
它可以通过定义一系列规则来校验和提取特定的文本模式。
本文将详细介绍正则表达式校验规则,并一步一步回答相关问题。
一、什么是正则表达式?正则表达式是一种用于匹配文本模式的字符序列。
它是在计算机科学领域广泛应用的工具,可以用来进行文本搜索、替换以及数据提取等操作。
二、为什么使用正则表达式?正则表达式具有以下几个优点:1.灵活性:正则表达式可以描述各种文本模式,包括字符串、数字、日期等。
2.高效性:正则表达式使用精确的规则来匹配文本,可以快速定位和提取所需数据。
3.跨平台性:正则表达式是一种通用的技术,可以应用于各种编程语言和操作系统。
4.可复用性:正则表达式的规则可以保存并复用,方便以后的使用。
5.代码简洁性:使用正则表达式可以简化繁琐的字符串处理过程,提高代码的可读性。
三、正则表达式的基本语法正则表达式由普通字符和元字符组成。
普通字符表示对应的字符,而元字符具有特殊的意义,用于描述特定的模式。
以下是常用的正则表达式元字符:1.点号`.`:用于匹配任意单个字符,除了换行符。
2.星号`*`:匹配前面的字符出现0次或多次。
3.加号`+`:匹配前面的字符出现1次或多次。
4.问号`?`:匹配前面的字符出现0次或1次。
5.竖线` `:用于匹配多个模式中的一个。
6.方括号`[]`:用于指定一个字符集合。
7.反斜杠`\`:用于转义特殊字符或表示特殊序列。
四、常见正则表达式校验规则1.校验手机号码^1[3-9]\d{9}该正则表达式通过限定手机号码的位数和格式来校验手机号码。
其中`^`表示字符串的开始,`1`表示手机号码的首位数字,`[3-9]`表示手机号码的第二位数字为3-9中的任意一个,`\d{9}`表示后面连续的9个数字,``表示字符串的结束。
2.校验邮箱地址^\w+([-+.]\w+)*\w+([-.]\w+)*\.\w+([-.]\w+)*该正则表达式通过匹配邮箱地址的格式来校验邮箱地址。
正则表达式语法或者符号语法
正则表达式语法或者符号语法正则表达式是一种用于匹配字符串的模式,通常用于文本搜索、替换和验证等操作。
它是由一些特殊字符和元字符组成的语法,用于描述字符串的结构和模式。
正则表达式的基本符号包括:1. 点号(.):匹配任意单个字符,除了换行符。
2. 加号(+):匹配前面的子表达式一次或多次。
3. 星号(*):匹配前面的子表达式零次或多次。
4. 问号(?):匹配前面的子表达式零次或一次。
5. 方括号([]):定义一个字符集合,匹配其中的任意一个字符。
6. 大括号({}):定义一个重复次数的范围,匹配指定次数的前面的子表达式。
7. 圆括号(()):将多个表达式组合成一个整体,用于分组或优先级控制。
8. 竖线(|):表示逻辑“或”,匹配左右两边的任意一个表达式。
9. 反斜杠(\):转义特殊字符,使其失去特殊含义。
10. 插入符号(^):匹配字符串的开头。
11. $符号:匹配字符串的结尾。
12. 百分号(%):匹配任意数量的非换行字符。
13. 数字符号(\d):匹配任意数字字符,等同于[0-9]。
14. 字母符号(\w):匹配任意字母、数字或下划线字符,等同于[A-Za-z0-9_]。
15. 空白符号(\s):匹配任意空白字符,包括空格、制表符、换行符等。
16. 非空白符号(\S):匹配任意非空白字符。
17. 单词边界符号(b):匹配单词的边界,即字母、数字或下划线字符与非字母、非数字、非下划线字符之间的边界。
18. Unicode属性符号(p{Property}):匹配Unicode属性,如汉字、字母等。
以上是正则表达式的一些基本符号,通过这些符号的组合可以构建出复杂的模式来匹配各种字符串。
以下是一些常用的正则表达式语法:1. 字符匹配:直接使用字符进行匹配,例如`a`可以匹配字符"a",`abc`可以匹配字符串"abc"。
2. 点号通配符:`.`可以匹配任何单个字符(除换行符外),`\.`可以匹配实际的点号字符。
正则表达式知识详解
正则表达式知识详解⼀、什么是正则表达式?1.定义:正则表达式(regular expression)描述了⼀种字符串匹配的模式,可以⽤来检查⼀个串是否含有某种⼦串、将匹配的⼦串做替换或者从某个串中取出符合某个条件的⼦串等。
构造正则表达式的⽅法和创建数学表达式的⽅法⼀样。
也就是⽤多种元字符与运算符可以将⼩的表达式结合在⼀起来创建更⼤的表达式。
正则表达式的组件可以是单个的字符、字符集合、字符范围、字符间的选择或者所有这些组件的任意组合。
2.组成:正则表达式是由普通字符(例如字符 a 到 z)以及特殊字符(称为"元字符")组成的⽂字模式。
模式描述在搜索⽂本时要匹配的⼀个或多个字符串。
正则表达式作为⼀个模板,将某个字符模式与所搜索的字符串进⾏匹配。
3.何时使⽤:验证——从头到尾完整匹配!查找——只要部分匹配即可!⼆、正则表达式的基本语法和规则1.备选字符集:规定某*⼀位字符*可⽤的备选字符的集合语法:[可选字符列表]强调:1. ⽆论备选字符集包含多少字符,只能选1个2. 必须选1个!⽐如:6位数字的密码[0123456789][0123456789][0123456789][0123456789][0123456789][0123456789]简化:1. 当备选字符连续时,可⽤-表⽰范围的区间⽐如:[0123456789]-->[0-9][0-9][0-9][0-9][0-9][0-9][0-9][a-z]-->1位⼩写字母[A-Z]-->1位⼤写字母[A-Za-z]-->1位字母,⼤⼩写都⾏[0-9a-zA-Z]-->1位字母或数字都⾏反选:[^不能选的字符列表]⽐如:[^47] 强调:^作“除了”使⽤时,只能放在开头2. 预定义字符集:为常⽤的字符集专门提供的简化写法!“\d”-->[0-9]-->1位数字“\w”-->[0-9a-zA-Z_]-->1位字母,数字或_“\s”-->1位空字符:匹配任何空⽩字符,包括空格、制表符、换页符等等。
以数字开头的正则表达式
以数字开头的正则表达式正则表达式是一种用来匹配字符串的强大工具,可以帮助人们快速准确地识别和提取符合特定格式的字符串。
其中,以数字开头的正则表达式是一种常见的匹配规则,可以用来匹配那些以数字开头的字符串。
以下是关于如何编写以数字开头的正则表达式的步骤:第一步:了解正则表达式的基本语法正则表达式是一种符号的组合,用来表示特定的规则,可以匹配字符串中的字符、数字、符号等各种元素。
其中,正则表达式的基本语法如下:1. 原义字符:匹配与之相同的字符。
2. 字符类:匹配某个类别中的任意一个字符。
3. 重复符:表示重复匹配前面的字符,可以指定匹配的次数。
4. 范围符:匹配某个范围中的任意一个字符。
5. 分组:将一组字符当作一个整体来匹配,方便重复使用。
第二步:写出以数字开头的基本匹配规则为了匹配以数字开头的字符串,我们需要编写一个以数字开头的基本匹配规则。
根据正则表达式的基本语法,我们可以写出以下规则:^[0-9]上述规则表示,以数字开头的字符串的第一个字符必须为数字。
第三步:匹配多个数字有时候,我们不仅需要匹配一个数字,还需要匹配多个数字。
这时,可以使用正则表达式中的重复符号表示重复匹配前面的字符。
例如:^[0-9]+上述规则表示,以数字开头的字符串的第一个字符为数字,后面跟着1个或多个数字。
第四步:添加限制条件如果我们需要在以数字开头的字符串中添加一些限制条件,例如字符串的长度必须为固定值,或者字符串中必须包含某些特定的字符,那么可以在正则表达式中使用特定的符号来指定这些限制条件。
例如:^[0-9]{5}$上述规则表示,以数字开头的字符串必须有5个数字,且字符串必须以数字结尾。
第五步:测试正则表达式完成以上步骤后,我们就可以使用开发工具(如Notepad++等)来测试这个正则表达式的匹配情况。
如果测试结果与预期相符,那么这个正则表达式就可以正式应用到实际的项目中。
以上是编写以数字开头的正则表达式的一些基本步骤,需要大家仔细操作和理解。
易语言正则表达式大全
易语言正则表达式大全【实用版】目录1.易语言正则表达式的概念和作用2.易语言正则表达式的语法规则3.易语言正则表达式的常用函数4.易语言正则表达式的应用实例正文一、易语言正则表达式的概念和作用易语言是一种以中文编程为特点的编程语言,其正则表达式是其中一个重要的功能。
正则表达式(Regular Expression,简称 regex)是一种强大的文本处理工具,可以用来检查文本是否符合某种模式、提取文本中的特定信息等。
在易语言中,正则表达式主要应用于字符串操作、文件处理等领域。
二、易语言正则表达式的语法规则易语言正则表达式的语法规则主要包括以下几个方面:1.字符集:用于匹配某一类字符- [abc]:匹配 a、b 或 c- [^abc]:匹配除方括号内字符以外的任意字符- [a-zA-Z]:匹配所有英文字母- d:匹配数字,等价于 [0-9]- D:匹配非数字,等价于 [^0-9]- s:匹配空白字符(空格、制表符、换行符等)- S:匹配非空白字符- w:匹配单词字符(字母、数字、下划线),等价于 [a-zA-Z0-9_] - W:匹配非单词字符2.量词:用于指定字符或字符类出现的次数-?:出现 0 次或 1 次- *:出现 0 次或多次- +:出现 1 次或多次- {n}:出现 n 次- {n,}:出现 n 次或多次- {n,m}:出现 n 到 m 次3.边界匹配符:用于指定匹配的位置- ^:匹配行的开始位置- $:匹配行的结束位置- b:匹配单词边界- B:匹配非单词边界4.分组和捕获:用于将正则表达式的一部分组合在一起,以便进行特定操作- (pattern):匹配 pattern 并捕获结果,可以通过1、2等引用- (?:pattern):匹配 pattern 但不捕获结果三、易语言正则表达式的常用函数易语言提供了一系列正则表达式相关的函数,如:1.RegExp_Create:创建一个正则表达式对象2.RegExp_Execute:执行正则表达式匹配3.RegExp_GetMatch:获取匹配结果4.RegExp_GetAllMatch:获取所有匹配结果5.RegExp_Replace:用替换字符串替换匹配到的内容四、易语言正则表达式的应用实例以下是一个易语言正则表达式应用实例,用于检查一个字符串是否为邮箱地址:```易语言var regex: RegExp;regex =RegExp_Create("^[a-zA-Z0-9._%+-]+@[a-zA-Z0-9.-]+.[a-zA-Z]{2,}$" );ifRegExp_Execute(regex,"****************")>0thenprint("是邮箱地址")elseprint("不是邮箱地址")end if```通过以上内容,我们可以了解到易语言正则表达式的概念、语法规则、常用函数以及应用实例。
正则表达式常用的规则和量词
正则表达式常用的规则和量词一、引言。
二、正则表达式的基本规则。
1. 字符匹配。
- 普通字符:在正则表达式中,大多数普通字符(如字母、数字)会按照字面意义进行匹配。
例如,正则表达式“abc”将匹配字符串中的“abc”字符序列。
这是最基本的匹配方式,就像在一堆文字中寻找特定的单词一样直观。
- 特殊字符转义:有些字符在正则表达式中有特殊含义,如“.”、“*”、“+”等。
如果要匹配这些字符本身,需要使用反斜杠“\”进行转义。
例如,要匹配一个句点“.”,正则表达式应该是“\.”。
这就好比在一种有特殊语法的语言中,如果要使用某个特殊符号的原本意义,就需要特殊的标记。
2. 字符类。
- 方括号表示法:可以使用方括号“[]”来定义字符类。
例如,“[abc]”将匹配字符“a”、“b”或“c”中的任意一个。
这类似于在一个小范围内进行选择,就像从一组颜色中选择特定的颜色一样。
- 范围表示法:还可以在方括号内使用范围表示法,如“[a - z]”将匹配所有小写字母,“[0 - 9]”将匹配所有数字。
这种表示法在处理字母或数字序列时非常方便,比如验证密码是否包含数字和字母时就可能用到。
3. 元字符。
- 点号“.”:点号是一个非常有用的元字符,它可以匹配除换行符以外的任意单个字符。
例如,正则表达式“a.c”可以匹配“abc”、“aac”等字符串。
这就像一个通配符,可以代表任何一个字符(除换行符外)。
- 星号“*”:星号是一个量词,表示前面的字符可以出现零次或多次。
例如,“a*”可以匹配空字符串、“a”、“aa”、“aaa”等。
它在处理可选元素时很有用,比如在匹配一个单词的复数形式(可能有多个“s”)时。
三、正则表达式的量词。
1. “+”量词。
- “+”表示前面的字符必须至少出现一次。
例如,正则表达式“a+”将匹配“a”、“aa”、“aaa”等,但不能匹配空字符串。
这与“*”量词有所不同,“+”更强调前面字符的存在性。
比如在匹配以字母开头的单词时,如果要求单词至少有一个字母,就可以使用“[a - z]+”。
c语言的正则表达式
c语言的正则表达式C语言的正则表达式正则表达式是一种用于描述和匹配字符串模式的工具,可以在C语言中使用正则表达式库来实现字符串的模式匹配和替换操作。
本文将介绍C语言中的正则表达式的基本语法和常见用法。
一、正则表达式的基本语法在C语言中,可以使用<regex.h>头文件中的函数来操作正则表达式。
正则表达式的基本语法如下:1. 字符匹配- 普通字符:可以直接使用普通字符进行匹配,如字符'A'匹配字符串中的'A'。
- 元字符:用于表示特殊含义的字符,如元字符'.'可以匹配任意字符,元字符'\n'可以匹配换行符。
- 转义字符:用于将特殊字符转义为普通字符,如'\.'可以匹配字符'.'。
2. 字符类- 方括号[]:用于指定一个字符集合,可以匹配其中的任意一个字符。
如[abc]可以匹配字符'a'、'b'或'c'。
- 范围表示:可以使用连字符-表示一个字符范围,如[a-z]可以匹配任意小写字母。
3. 重复匹配- '*':匹配前一个元素的零次或多次出现,如'a*'可以匹配零个或多个字符'a'。
- '+':匹配前一个元素的一次或多次出现,如'a+'可以匹配一个或多个字符'a'。
- '?':匹配前一个元素的零次或一次出现,如'a?'可以匹配零个或一个字符'a'。
- '{n}':匹配前一个元素恰好出现n次,如'a{2}'可以匹配两个字符'a'。
- '{n,}':匹配前一个元素至少出现n次,如'a{2,}'可以匹配两个或更多字符'a'。
常用正则表达式
常用正则表达式正则表达式是一种用于查找和替换文本字符串的强大工具,它能够有效地检测和处理字符串中的模式。
它们被广泛应用于编程语言、文本编辑器、网页开发器和其他软件工具中,以满足各种应用的需求。
正则表达式的出现使得我们可以快速查找和替换字符串中的特定模式。
它们可以简化搜索、提取、编辑和替换文本的工作,从而大大提高工作效率。
本文将针对正则表达式,深入讨论它的语法、用法和常见问题,并总结一些常用的正则表达式。
一、正则表达式语法正则表达式使用一种特殊的语法结构来表达文本字符串的模式,称为“正则表达式语法”。
语法结构由普通字符和“元字符”两部分组成,其中元字符用于指示文本字符串的模式,普通字符表示要查找的文本字符串。
正则表达式语法是由以下几个原则组成的:(1)普通字符。
普通字符会被原样匹配。
例如,在正则表达式中输入字符“a”将仅匹配文本中的“a”字符;(2)元字符。
元字符用于描述文本字符串的模式。
它们是正则表达式语法中最重要的部分,常用的元字符有“*”、“+”、“?”、“()”等符号;(3)字符组(Character Class)。
字符组用于指定一个字符集合,可以搜索任何在该字符集合中的字符,例如“[0-9]”将搜索任何数字;(4)字符范围(Character Ranges)。
字符范围用于指定一个连续的字符集合,例如“a-z”将搜索所有小写字母;(5)量词(Quantifiers)。
量词用于指定字符出现的次数,例如“*”表示字符可以出现任意次数,“+”表示字符至少要出现一次;(6)分组(Groups)。
分组可以将一个模式的不同部分分开,例如“(abc)”将abc分成三个模式;(7)反义(Anchors)。
反义用于指定非指定字符的模式,例如“^”表示任何非数字的字符;(8)转义(Escapes)。
转义符可以将特殊字符转换为普通字符,例如“”将使“”变为普通字符。
二、正则表达式用法正则表达式可以用于各种文本处理任务,如搜索、提取、编辑和替换等。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
正则表达式语法
正则表达式是一种文本模式,包括普通字符(例如,a 到 z 之间的字母)和特殊字符(称为“元字符”)。
模式描述在搜索文本时要匹配的一个或多个字符串。
正则表达式示例
常用正则表达式:
整数或者小数:^[0-9]+\.{0,1}[0-9]{0,2}$只能输入数字:"^[0-9]*$"。
只能输入n位的数字:"^\d{n}$"。
只能输入至少n位的数字:"^\d{n,}$"。
只能输入m~n位的数字:。
"^\d{m,n}$"
只能输入零和非零开头的数字:"^(0|[1-9][0-9]*)$"。
只能输入有两位小数的正实数:"^[0-9]+(.[0-9]{2})?$"。
只能输入有1~3位小数的正实数:"^[0-9]+(.[0-9]{1,3})?$"。
只能输入非零的正整数:"^\+?[1-9][0-9]*$"。
只能输入非零的负整数:"^\-[1-9][]0-9"*$。
只能输入长度为3的字符:"^.{3}$"。
只能输入由26个英文字母组成的字符串:"^[A-Za-z]+$"。
只能输入由26个大写英文字母组成的字符串:"^[A-Z]+$"。
只能输入由26个小写英文字母组成的字符串:"^[a-z]+$"。
只能输入由数字和26个英文字母组成的字符串:"^[A-Za-z0-9]+$"。
只能输入由数字、26个英文字母或者下划线组成的字符串:"^\w+$"。
验证用户密码:"^[a-zA-Z]\w{5,17}$"正确格式为:以字母开头,长度在6~18之间,只能包含字符、数字和下划线。
验证是否含有^%&',;=?$\"等字符:"[^%&',;=?$\x22]+"。
只能输入汉字:"^[\u4e00-\u9fa5]{0,}$"
验证Email地址:"^\w+([-+.]\w+)*@\w+([-.]\w+)*\.\w+([-
.]\w+)*$"。
验证InternetURL:"^http://([\w-]+\.)+[\w-]+(/[\w-
./?%&=]*)?$"。
验证电话号码:"^(\(\d{3,4}-)|\d{3.4}-)?\d{7,8}$"正确格式为:"XXX-XXXXXXX"、"XXXX-XXXXXXXX"、"XXX-XXXXXXX"、"XXX-XXXXXXXX"、"XXXXXXX"和"XXXXXXXX"。
验证11位的手机号:/^1[3|5][0-9]\d{4,8}$/
验证身份证号(15位或18位数字):"^\d{15}|\d{18}$"。
验证一年的12个月:"^(0?[1-9]|1[0-2])$"正确格式为:"01"~"09"和"1"~"12"。
验证一个月的31天:"^((0?[1-9])|((1|2)[0-9])|30|31)$"正确格式为;"01"~"09"和"1"~"31"。
匹配中文字符的正则表达式: [\u4e00-\u9fa5]。