ES8 中的 Unicode 运算符如何使用？-JavaScript中文网-JavaScript教程资源分享门户

ES8 引入了一些新的运算符，其中包括一些用于处理 Unicode 字符的运算符。这些运算符使得在处理字符串时可以更加方便地处理 Unicode 字符。本文将介绍 ES8 中的 Unicode 运算符的使用方法，并给出示例代码，帮助读者深入学习并且掌握这些新的运算符。

Unicode 字符串概述

在了解 Unicode 运算符之前，先要了解一下 Unicode 字符串的概念。Unicode 是一种国际编码方式，它为每个字符分配了一个唯一的数字代码点，这个代码点被称为 Unicode 码位（Unicode code point）。比如字母 A 的 Unicode 码位是 U+0041，中文字符“中”的 Unicode 码位是 U+4E2D。

JavaScript 中的字符串使用的是 UTF-16 编码方式。在 UTF-16 中，每个字符使用 16 位（两个字节）或 32 位（四个字节）来表示。对于 Unicode 码位在 U+0000 至 U+FFFF 范围内的字符，使用 16 位表示；对于 Unicode 码位在 U+10000 至 U+10FFFF 范围内的字符，使用 32 位表示。

现在我们有了一个基本的了解，接下来我们将介绍 ES8 中的 Unicode 运算符。

代码点在字符串中的表示

在 ES6 之前，表示 Unicode 字符串只能使用码位转义序列（Unicode code point escape sequence）来表示。比如，如果要表示字母 A，可以使用“\u0041”。如果要表示中文字符“中”，需要使用“\u4E2D”来表示。

在 ES6 中引入了码点表示法（code point escape notation）来表示 Unicode 字符串。码点表示法使用大括号包含码点（Unicode 码位）来表示 Unicode 字符。比如，要表示字母 A，可以使用“\u{41}”；要表示中文字符“中”，可以使用“\u{4E2D}”来表示。

接下来，我们将介绍 ES8 中的 Unicode 运算符。

ES8 中的 Unicode 运算符

Unicode 字符串正则表达式

ES8 引入了 Unicode 字符串正则表达式，它增加了一些修饰符，包括“u”修饰符，用于处理 Unicode 字符串。如果一个正则表达式用了“u”修饰符，那么它可以正确匹配 Unicode 字符串中的字符。比如，以下代码可以正确地匹配中文字符：

let str = "中文字符";
console.log(/^.$/.test(str)); // false
console.log(/^.$/u.test(str)); // true

codePointAt()

ES8 中新增的 codePointAt() 方法，它返回字符串中指定位置的 Unicode 码位（code point）。因为一个字符可能使用多个 UTF-16 编码单元表示，所以 codePointAt() 方法返回的是完整字符的码位。如果在一个位置只有一个 UTF-16 编码单元，则返回该单元的值。

比如，以下代码可以将“🐨”这个表情符号（该字符的 Unicode 码位为 U+1F428）拆成两个 UTF-16 编码单元，然后再从这两个编码单元解析出表情符号的码位：

let str = "🐨";
console.log(str.codePointAt(0)); // 129448

String.fromCodePoint()

ES8 中新增的 String.fromCodePoint() 方法，它可以根据 Unicode 码位创建字符串。它接收任意数量的参数，每个参数都是 Unicode 码位，返回对应的字符串。

这个方法与 String.fromCharCode() 方法很相似，但是它可以正确处理 Unicode 码位在 U+10000 至 U+10FFFF 范围内的字符。比如：

console.log(String.fromCharCode(0x20BB7)); // �
console.log(String.fromCodePoint(0x20BB7)); // 𠮷

字符串的 for...of 循环

ES8 中新增了字符串的 for...of 循环，该循环可以正确处理 Unicode 字符串中的字符。for...of 循环会按照字符顺序遍历字符串，因此可以正确处理组成一个字符的多个编码单元。

比如，以下代码可以正确地遍历“🐨”表情符号这个字符：

let str = "🐨";
for (let ch of str) {
    console.log(ch);
}

总结

ES8 中的 Unicode 运算符使得在 JavaScript 中处理 Unicode 字符串变得更加方便。本文介绍了 ES8 中的 Unicode 运算符，涵盖了 Unicode 字符串正则表达式、codePointAt() 方法、String.fromCodePoint() 方法和字符串的 for...of 循环等方面。

文章通过深入讲解每一个运算符的使用方法，引导读者深入学习并掌握这些运算符，在实际的开发中可以更加灵活地使用它们。

来源：JavaScript中文网，转载请注明来源 https://www.javascriptcn.com/post/654b2bf27d4982a6eb51cd00

ES8 中的 Unicode 运算符如何使用？

Unicode 字符串概述

代码点在字符串中的表示

ES8 中的 Unicode 运算符

总结

纠错反馈

程序员教程

程序员面试题库