正则表达式是一种在计算机科学中常用的模式匹配工具。它可以用于字符串的匹配和搜索,也可以用于替换和处理字符串。 随着技术的发展,正则表达式的功能和性能一直在不断提高,ECMAScript 2021也加入了新的特性和增强,使得正则表达式的使用更加简单和高效。
正则表达式的新特性
ECMAScript 2021 增加了好几个特性来增强正则表达式的功能:
1. named capture groups
在早期的正则表达式版本中,我们只能通过使用数字来引用捕获组,例如 /(\d{4})-(\d{2})-(\d{2})/
可以匹配一个日期格式,我们通过 $1
来引用第一个组,$2
来引用第二个组,以此类推。但是,如果我们想要使用具有描述性别名称的命名组来进行匹配又怎么办呢?
在 ECMAScript 2021 中,我们可以使用命名捕获组来实现这个功能,例如: /date/(?<year>\d{4})-(?<month>\d{2})-(?<day>\d{2})/
。现在,我们可以使用名称引用,如 $<year>
代替 $1
引用第一个组,以此类推。
2. replace 方法中的 lookbehind
replace
方法在字符串中查找给定的模式,并将其替换为给定的字符串。在 ECMAScript 2018 中,我们看到了 positive lookbehind 的引入,使得我们可以在查找中指定任何前缀,并匹配后缀,同时只替换匹配模式中的文本。在 ECMAScript 2021 版本中,我们现在可以使用 negative lookbehind 来完成相同的任务,例如: /(?<!foo)bar/
。
3. Unicode 属性转义
过去,我们必须硬编码特定的 Unicode 值或使用 Unicode 转义序列来进行类型测试和匹配。ECMAScript 2021 允许我们更精确地描述 Unicode 字符属性,例如:
/^\p{Emoji_Presentation}+$/u
用于匹配所有 Emoji 表情符号。/^\p{ASCII}+$/u
用于匹配由 ASCII 字符组成的字符串。
4. dotAll 标志
在早期的版本中,.
只能匹配除换行符 \n 之外的任何单个字符。在 ECMAScript 2018 中,我们看到了 s
标志的引入,它允许我们将.
匹配任何字符,包括换行符。现在,在 ECMAScript 2021 版本中,s
标志已被替换为 dotAll
,它保留了前一个版本的功能并提供了更好的语义。现在,我们可以使用 /foo.bar(?s)/
来匹配 foo 和 bar 之间的所有字符,包括换行符。
正则表达式的性能提升
除了新的特性之外,ECMAScript 2021 也提高了正则表达式的性能:
1. 延迟解析
在 ECMAScript 2021 中,正则表达式引擎采用了延迟解析的技术来减少内存使用并提高解析速度。这意味着只有在需要时才会解析表达式,而不是在解析时直接分配内存并引用正则表达式的所有部分。这种技术还允许引擎在执行时动态修改已编译的表达式,从而提高执行效率。
2. 引擎优化
正则表达式引擎在 ECMAScript 2021 中也进行了优化,以进一步提高其性能和可靠性。优化包括:
- 改进了在字符串查找中的性能。
- 根据正则表达式代码的特定属性,修改引擎的执行策略。
- 优化了字符串操作和查找算法,从而提高了性能。
总结
在 ECMAScript 2021 中,正则表达式引擎增加了许多新的特性和提高了性能。这使得正则表达式的使用变得更加简单和高效,同时为我们提供了更多的工具来实现更复杂的正则表达式匹配和搜索。
示例代码:

来源:JavaScript中文网 ,转载请注明来源 https://www.javascriptcn.com/post/65a59611add4f0e0ffe25c06