如果今天不努力,明天也不努力,那么人生只是在重复而已。(心不定,难成事)

JavaScript正则表达式教程及学习总结

JavaScript Sam 265℃

正则表达式(Regular Expression)使用单个字符串来描述、匹配一系列符合某个句法规则的字符串
说简单就是按照某种规则去匹配符合规则的字符串

正则表达式工具:http://regexper.com
1、匹配字符串中单词
He is a good boy.
isn’t it?
This is a test.
匹配单词is 正则 \bis\b    \b单词边界
2、匹配首尾有特征字符串,匹配http协议的jpg文件的协议头
http://www.phpnote.cc/images/abc.jpg
https://www.phpnote.cc/images/absdsfeec.jpg
http://www.phpnote.cc/images/ddeff.png
https://www.phpnote.cc/images/8slsk.png
http:\/\/.+\.jpg  找出所有http协议以.jpg结尾的url
http:(\/\/.+\.jpg)  ()分组   分组里内容为$1
3、日期替换
2006/02/03
test/07/sd
1998-03-07
1234/22/22
^\d{4}[/-]\d{2}[/-]\d{2}$  匹配日期格式  ^开头  $结尾
^(\d{4})[/-](\d{2})[/-](\d{2})$  分组匹配年月日$1-$2-$3


JavaScript通过内置对象RegExp支持正则表达式,有两种方法实例化RegExp对象,分别是字面量、构造函数
字面量的例子:  var reg = /\bis\b/g;   g表示全局全文
构造函数的例子:var reg = new RegExp(‘\\bis\\b’,’g’);
var str = “He is a boy. This is a dog.”;     str.replace(reg, ‘IS’)
javascript修饰符
g: global 全文搜索,不添加,搜索到第一个匹配停止
i: ignore case 忽略大小写,默认大小写敏感
m: multiple lines多行搜索匹配


两节视频看完,涛哥喝口水休息下https://blog.kydbk.com


Javascript元字符
正则表达式由两种基本字符类型组成:原义文本字符元字符
元字符是在正则表达式中有特殊含义的非字母字符如( . * + ? $ ^ | \ () {} [])
元字符的字符及含义
\t  表示水平制表符
\v 表示垂直制表符
\n 换行符
\r 回车符
\0 空字符
\f 换页符
\cX 与X对应的控制字符(Ctrl+ X)
Javascript匹配某类字符,我们可以使用元字符[]来构建一个简单的类,比如表达式[abc]把字符a或b或c归为一类,表达式可以匹配这类字符
var reg = new RegExp(‘\[abc\]’,’g’);
var str = “He is a boy. This is a dog.”;     str.replace(reg, ‘888’)
JavaScript字符串取反,使用元字符^创建反向类/负向类,反向类的意思是不属于某类的内容,比如表达式[^abc]表示不是字符a或b或c的内容
var reg = new RegExp(‘\[^abc\]’,’g’);
var str = “He is a boy. This is a dog.”;     str.replace(reg, ‘888’)


Javascript范围类,使用字符类匹配数字[0123456789],比如
我们使用[a-z]表示从a到z的任意字符,这是个闭区间,也就是包含a和z本身
大小写字母[a-zA-z]类内部支持连写,a8b7S    Q8Q7Q
比如2018-02-14 [0-9]  AAAA-AA-AA   [0-9-]  AAAAAAAA


JavaScript预定义类来匹配常见的字符类,预定义类字符及含义如下:(大写表示取反)
字符             等价类                         含义
.                    [^\n\r]                          除了回车符和换行符之外的所有字符
\d                  [0-9]                             数字字符
\D                 [^0-9]                           非数字字符
\s                  [\t\n\x0B\f\r]                 空白符
\S                 [^\t\n\x0B\f\r]               非空白符
\w                [a-zA-Z_0-9]                 单词字符(字母、数字下划线)
\W               [^a-zA-Z_0-9]               非单词字符


正则表达式还提供了几个常用的边界匹配字符
字符            含义
^                  以xxx开始
$                  以xxx结束
\b                 单词边界
\B                非单词边界
‘@123@abc@’.replace(/@./g, ‘Q’)  结果为”Q23Qbc@”
‘@123@abc@’.replace(/^@./g, ‘Q’)  结果为”Q23@abc@”
‘@123@abc@’.replace(/.@/g, ‘Q’)  结果为”@12QabQ”
‘@123@abc@’.replace(/.@$/g, ‘Q’)  结果为”@123@abQ”
‘This is a boy’.replace(/is/g, ‘0’)    结果为”Th0 0 a boy”
‘This is a boy’.replace(/\bis\b/g, ‘0’)    结果为”This 0 a boy”
‘This is a boy’.replace(/\Bis\B/g, ‘0’)    结果为”Th0 is a boy”


JavaScript量词
字符                含义
?                      出现零次或一次(最多出现一次)
+                     出现一次或多次(至少出现一次)
*                     出现零次或多次(任意次)
{n}                 出现n次
{n,m}             出现n到m次
{n,}                至少出现n次


JavaScript正则贪婪模式与非贪婪模式
涛哥马上就要把js的正则完整过一遍了by 涛哥笔记https://blog.kydbk.com
贪婪模式
\d{3,6}  按最大尽可能多的匹配,最多6次
‘12345678’.replace(/\d{3,6}/g, ‘X’)  结果为”X78″
非贪婪模式
让正则表达式尽可能少匹配,一旦成功不再尝试
在量词后加上?即可
比如 ‘12345678’.replace(/\d{3,6}?/g,’X’)  结果为”XX78″


JavaScript分组
使用()可以达到分组的功能,使量词用于分组
比如 ‘a1b2c3d4’.replace(/([a-z]\d){3}/g, ‘X’) 结果为”Xd4″
JavaScript或
使用|可以达到或的效果
比如 Byron|Casper
‘ByronsperByrCasper’.replace(/Byr(on|Ca)sper/g, ‘X’)   结果为XX
JavaScript反向引用
比如要把2017-07-07 转成07/07/2017
‘2017-07-07’.replace(/(\d{4})-(\d{2})-(\d{2})/g, ‘$2/$3/$1’)
JavaScript忽略分组
不希望捕获某些分组,只需要在分组内加上?:就可以
比如:(?:phpnote.cc).(blog.kydbk.com)  前一个分组被忽略


JavaScript前瞻
正则表达式从文本头部向尾部开始解析,文本尾部方向,称为“前”
前瞻就是在正则表达式匹配到规则的时侯,向前检查是否符合断言,(js不支持)后顾/后瞻方向相反,文本头部
符合和不符合特定断言称为肯定/正向匹配和否定/负向匹配
名称                    正则                          含义
正向前瞻            exp(?=assert)
负向前瞻            exp(?!assert)
比如:
\w(?=\d)    匹配到单词的时侯向前看看,前面是不是数字
‘a2*3’.replace(/\w(?=\d)/g, ‘X’) 结果为 “X2*3”


JavaScript对象属性
g   global: 是否全文搜索,默认false
i    ignore case: 是否大小写敏感,默认是false
m  multiline: 多行搜索,默认值是false
lastIndex: 是当前表达式匹配内容的最后一个字符的下一个位置
source: 正则表达式的文本字符串
比如:
var reg1 = /\w/;
var reg2 = /\w/gim;
reg1.global  false
reg2.global   true
reg1.source      “\w”
reg2.source      “\w”
JavaScript的test和exec方法
test用于测试字符串参数中是否存在匹配正则表达式模式的字符串,如果存在则返回true,否则返回false
reg1.test(‘a’)         true
reg1.test(‘$’)         false
exec使用正则表达式模式对字符串执行搜索,并将更新全局regexp对象的属性以反映匹配结果,如果没有匹配的文本则返回ull,否则返回一个结果数组:- index 声明匹配文本的第一个字符的位置   – input 存放被检索的字符串string
非全局调用
调用非全局的RegExp对象的exec()时,返回数组
第一个元素是与正则表达式相匹配的文本
第二个元素是与RegExpObject的第一个子表达式相匹配的文本(如果有的话)
第三个元素是与RegExp对象的第二个子表达式相匹配的文本(如果有的话),以此类推
举个例子:
var reg3 = /\d(\w)(\w)\d/;
var reg4 = /\d(\w)(\w)\d/g;
var ts = ‘$1az2bb3cy4dd5ee’;
var ret = reg3.exec(ts);
console.log(reg3.lastIndex + ‘\t’ + ret.index + ‘\t’ + ret.toString());   结果为 0  1 1az2,a,z
while(ret = reg4.exec(ts)){
console.log(reg4.lastIndex + ‘\t’ + ret.index + ‘\t’ + ret.toString());
}
结果为
“5  1  1az2,a,z”
“11 7 3cy4,c,y”


JavaScript字符串对象方法search/match/split/replace
search()方法用于检索字符串中指定的子字符串,或检索与正则表达式相匹配的子字符串
方法返回第一个匹配结果index,查找不到返回-1
search()方法不执行全局匹配,它将忽略标志g,并且总是从字符串的开始进行检索
‘a1b2c3d1’.search(‘1’)    结果为 1
‘a1b2c3d1′.search(’10’)    结果为 -1
‘a1b2c3d1’.search(‘/1/’)    结果为 1
‘a1b2c3d1’.search(‘/1/g’)    结果为 1
match()方法将检索字符串,以找到一个或多个与regexp匹配的文本
regexp是否具有标志g对结果影响很大
非全局调用
如果regexp没有标志g,那么match()方法就只能在字符串中执行一次匹配
如果没有找到任何匹配的文本,将返回null
否则它将返回一个数组,其中存放了与它找到的匹配文本有关的信息
返回数组的第一个元素存在的是匹配文本,而其余的元素存放的是与正则表达式的子表达式匹配的文本
除了常规的数组元素之外,返回的数组还含有2个对象属性
index声明匹配文本的起始字符在字符串的位置
input声明对stringObject的引用
var ret = ts.match(reg3);
console.log(ret);
console.log(ret.index + ‘\t’ + reg3.lastIndex);
结果为:
[“la2”, “a”]
“1 0”
全局调用
没有找到任何匹配的子串,则返回null
如果找到了一个或多个匹配子串,则返回一个数组,数组元素中存放是所有匹配的子串,没有index和input属性,也没有分组信息
var ret = ts.match(reg4);
console.log(ret);
console.log(ret.index + ‘\t’ + reg3.lastIndex);
结果为:
[“la2”, “3c4”]
“undefiend 0”
split(reg)传入正则处理字符串
replace(str,replaceStr)
replace(reg,replaceStr)
replace(reg,function())

 

转载请注明:PHP笔记 » JavaScript正则表达式教程及学习总结

喜欢 (0)