在 ES2015 中,正则表达式已经得到了很大的改进,包括支持 Unicode、反向断言等特性。而在 ES2017 中,又新增了一种正则表达式标志符 y,用于解决全局匹配的一些问题。本文将详细探究 y 标志符的使用,并给出相关的示例代码。
y 标志符的作用
在正则表达式中,如果使用了全局匹配标志符 g,那么在执行正则表达式匹配时,会从上一次匹配的位置开始继续匹配。例如:
const str = 'ababab'; const regex = /a/g; console.log(regex.exec(str)); // ['a'] console.log(regex.exec(str)); // ['a'] console.log(regex.exec(str)); // ['a']
可以看到,使用 g 标志符后,每次匹配都是从上一次匹配的位置开始,而不是从字符串的开始位置。这种行为在某些场景下是不希望出现的,例如:
const str = 'ababab'; const regex = /a|b/g; console.log(regex.exec(str)); // ['a'] console.log(regex.exec(str)); // ['b'] console.log(regex.exec(str)); // ['a'] console.log(regex.exec(str)); // ['b'] console.log(regex.exec(str)); // ['a'] console.log(regex.exec(str)); // null
在上面的例子中,我们想要匹配字符串中所有的 a 或 b,但是由于 g 标志符的存在,每次匹配都是从上一次匹配的位置开始,导致匹配结果不符合预期。
而 y 标志符则可以解决这个问题。y 标志符表示粘连匹配,即匹配必须从字符串的当前位置开始,不能从上一次匹配的位置开始。例如:
const str = 'ababab'; const regex = /a|b/y; console.log(regex.exec(str)); // ['a'] console.log(regex.exec(str)); // ['b'] console.log(regex.exec(str)); // ['a'] console.log(regex.exec(str)); // null
可以看到,使用 y 标志符后,每次匹配都是从字符串的当前位置开始,而不是从上一次匹配的位置开始。
y 标志符的使用注意事项
虽然 y 标志符可以解决全局匹配的一些问题,但是它也有一些使用注意事项。
首先,y 标志符只能用于粘连匹配,即匹配必须从字符串的当前位置开始。如果正则表达式中含有 ^ 或 \b 等锚字符,则 y 标志符无效。例如:
const str = 'ababab'; const regex = /^a/y; console.log(regex.exec(str)); // null
在上面的例子中,正则表达式以 ^ 开头,表示匹配必须从字符串的开始位置开始。由于 y 标志符只能用于粘连匹配,因此这个正则表达式无法匹配到任何内容。
其次,y 标志符只能用于字符类、量词和断言等具有确定匹配宽度的元素中。如果正则表达式中含有分组或捕获等元素,则 y 标志符无效。例如:
const str = 'ababab'; const regex = /(a|b)/y; console.log(regex.exec(str)); // null
在上面的例子中,正则表达式中含有分组,即 (a|b),因此 y 标志符无效。
示例代码
下面给出一些示例代码,帮助读者更好地理解 y 标志符的使用。
示例 1:使用 y 标志符匹配单词
const str = 'hello world'; const regex = /\w+/y; console.log(regex.exec(str)); // ['hello'] console.log(regex.exec(str)); // ['world'] console.log(regex.exec(str)); // null
在上面的例子中,正则表达式 /\w+/y 表示匹配一个或多个单词字符。由于使用了 y 标志符,每次匹配都是从字符串的当前位置开始。
示例 2:使用 y 标志符匹配数字
const str = '123,456,789'; const regex = /\d{3}(,|$)/y; console.log(regex.exec(str)); // ['123,'] console.log(regex.exec(str)); // ['456,'] console.log(regex.exec(str)); // ['789'] console.log(regex.exec(str)); // null
在上面的例子中,正则表达式 /\d{3}(,|$)/y 表示匹配三个数字后面跟着逗号或字符串结尾。由于使用了 y 标志符,每次匹配都是从字符串的当前位置开始。
示例 3:使用 y 标志符匹配 IPv4 地址
const str = '192.168.0.1'; const regex = /(\d{1,2}|1\d{2}|2[0-4]\d|25[0-5])(\.|$)/y; console.log(regex.exec(str)); // ['192.'] console.log(regex.exec(str)); // ['168.'] console.log(regex.exec(str)); // ['0.'] console.log(regex.exec(str)); // ['1'] console.log(regex.exec(str)); // null
在上面的例子中,正则表达式 /(\d{1,2}|1\d{2}|2[0-4]\d|25[0-5])(.|$)/y 表示匹配 IPv4 地址中的每个数字和点号。由于使用了 y 标志符,每次匹配都是从字符串的当前位置开始。
总结
y 标志符是 ES2017 新增的正则表达式标志符,用于粘连匹配,即匹配必须从字符串的当前位置开始,不能从上一次匹配的位置开始。在使用 y 标志符时需要注意锚字符和分组等元素的影响,只有在字符类、量词和断言等具有确定匹配宽度的元素中才能使用 y 标志符。
来源:JavaScript中文网 ,转载请注明来源 https://www.javascriptcn.com/post/6568462ad2f5e1655d10e5a9