Regex 在前端中提取子字符串，为什么会返回两个结果-JavaScript中文网-JavaScript教程资源分享门户

在前端开发中，经常需要从字符串中提取特定的信息。正则表达式是一种强大的工具，可以帮助我们轻松地实现这一目标。然而，在某些情况下，当我们使用正则表达式提取子字符串时，可能会意外地得到多个结果。

问题描述

假设我们有以下字符串：

const str = "这是一段测试文本，包含一些数字，例如：123456、789012。";

现在我们想要从该字符串中提取出所有的数字。我们可以使用正则表达式 /(\d+)/g 来实现：

const pattern = /(\d+)/g;
const matches = str.match(pattern);
console.log(matches);

期望的输出是一个包含所有数字的数组：[123456, 789012]。但是，实际上我们却得到了两个结果：

[ '123456', '789012' ]
index.js:4

为什么会出现这种情况呢？该如何解决？

造成这个问题的原因是正则表达式中的全局标志 g。当我们在正则表达式中添加 g 标志时，正则表达式对象会保留一个内部状态，用于跟踪匹配过程中的位置。

在上面的示例中，第一次调用 match() 方法的时候，正则表达式匹配了第一个数字 "123456"。由于添加了全局标志，正则表达式对象内部的状态被更新为匹配过程中下一个数字的位置。

接着，第二次调用 match() 方法时，正则表达式从上次匹配的位置开始继续搜索，找到了第二个数字 "789012"。

因此，我们得到了两个结果。

要解决这个问题，我们可以使用 exec() 方法代替 match() 方法，并将正则表达式对象重新创建为每个匹配都执行一遍：

const pattern = /(\d+)/g;
let matches;
while ((matches = pattern.exec(str)) !== null) {
  console.log(matches[1]);
}

在这个示例中，我们使用了一个 while 循环来不断执行 exec() 方法，直到没有更多的匹配项。这样做的好处是每次执行 exec() 方法时，都会重新创建一个新的正则表达式对象，从而防止出现上述问题。

当我们使用正则表达式提取子字符串时，要注意全局标志 g 的影响。如果需要多次执行匹配操作，请使用 exec() 方法，并避免重用同一个正则表达式对象。

来源：JavaScript中文网，转载请注明来源 https://www.javascriptcn.com/post/26536