codecamp

Javascript 模式中的反向引用:\N 和 \k<name>

我们不仅可以在结果或替换字符串中使用捕获组 ​(...)​ 的内容,还可以在模式本身中使用它们。

按编号反向引用:\N

可以使用 \N 在模式中引用一个组,其中 N 是组号。

为了弄清这有什么用,让我们考虑一个任务。

我们需要找到带引号的字符串:单引号 '...' 或双引号 "..." —— 应匹配这两种变体。

如何找到它们?

我们可以将两种引号都放在方括号中:['"](.*?)['"],但它会找到带有混合引号的字符串,例如 "...' 和 '..."。当一种引号出现在另一种引号内,比如在字符串 "She's the one!" 中时,便会导致不正确的匹配:

let str = `He said: "She's the one!".`;

let regexp = /['"](.*?)['"]/g;

// 不是我们想要的结果
alert( str.match(regexp) ); // "She'

正如我们所看到的,该模式找到了一个开头的引号 ",然后文本被匹配,直到另一个引号 ',该匹配结束。

为了确保模式查找的结束引号与开始的引号完全相同,我们可以将其包装到捕获组中并对其进行反向引用:(['"])(.*?)\1

这是正确的代码:

let str = `He said: "She's the one!".`;

let regexp = /(['"])(.*?)\1/g;

alert( str.match(regexp) ); // "She's the one!"

现在可以了!正则表达式引擎会找到第一个引号 (['"]) 并记住其内容。那是第一个捕获组。

在模式中 \1 表示“找到与第一组相同的文本”,在我们的示例中为完全相同的引号。

与此类似,\2 表示第二组的内容,\3 —— 第三分组,依此类推。

请注意:

如果我们在捕获组中使用 ?:,那么我们将无法引用它。用 (?:...) 捕获的组被排除,引擎不会记住它。

不要搞混了:在模式中用 ​\1​,在替换项中用:​$1

在替换字符串中我们使用美元符号:$1,而在模式中 —— 使用反斜杠 \1

按命名反向引用:\k<name>

如果一个正则表达式中有很多括号,给它们起个名字会便于引用。

要引用命名的捕获组,我们可以使用:\k<name>

在下面的示例中,带引号的组被命名为 ?<quote>,因此反向引用为 \k<quote>

let str = `He said: "She's the one!".`;

let regexp = /(?<quote>['"])(.*?)\k<quote>/g;

alert( str.match(regexp) ); // "She's the one!"


Javascript 捕获组
Javascript 选择 (OR) |
温馨提示
下载编程狮App,免费阅读超1000+编程语言教程
取消
确定
目录

第一部分 JavaScript 编程语言

第三部分 其他文章

关闭

MIP.setData({ 'pageTheme' : getCookie('pageTheme') || {'day':true, 'night':false}, 'pageFontSize' : getCookie('pageFontSize') || 20 }); MIP.watch('pageTheme', function(newValue){ setCookie('pageTheme', JSON.stringify(newValue)) }); MIP.watch('pageFontSize', function(newValue){ setCookie('pageFontSize', newValue) }); function setCookie(name, value){ var days = 1; var exp = new Date(); exp.setTime(exp.getTime() + days*24*60*60*1000); document.cookie = name + '=' + value + ';expires=' + exp.toUTCString(); } function getCookie(name){ var reg = new RegExp('(^| )' + name + '=([^;]*)(;|$)'); return document.cookie.match(reg) ? JSON.parse(document.cookie.match(reg)[2]) : null; }