npm 包 fast-xml-parser-seq 使用教程-JavaScript中文网-JavaScript教程资源分享门户

简介

fast-xml-parser-seq 是一个高性能的 XML 解析器，支持按序列读取 XML 文档。它适用于处理大型的 XML 文件。在前端领域，借助 fast-xml-parser-seq 可以实现一些需要处理 XML 数据的特定场景。

安装

fast-xml-parser-seq 是一个 npm 包，所以我们可以使用 npm 或者 yarn 进行安装：

npm install fast-xml-parser-seq --save

或者

yarn add fast-xml-parser-seq

使用

解析 XML

可以使用 Parser 类解析 XML。以下是一个例子：

-- -------------------- ---- -------
------ - ------ - ---- ----------------------

----- --------- - ----------------- --------------------------------

----- ------- - -
  -------------------- ---
  ----------------- ------
  --------------- ----
--

----- ------ - --- ----------------
----- ------- - ------------------------

--------------------- -- - ----- - ----- ----- ----- ---- ---- - -

在以上例子中，我们将一个 XML 字符串转换为 JSON 对象，从而方便我们在 JavaScript 中处理 XML 数据。

序列读取 XML

fast-xml-parser-seq 支持按照顺序读取 XML 元素节点。这可以用来处理大型的 XML 文件。以下是一个例子：

-- -------------------- ---- -------
------ - ------ - ---- ----------------------

----- --------- - -----------------------------

----- ------- - -
  ------------------------ ----- --------- -- ------------------------
  ------------------ ----- -------- -- -----------------------
--

----- ------ - --- ----------------

---------------------- ---------- -- -
  -------------------- ----- - --------------
---

-------------------- ---------- -- -
  -------------------- --- - --------------
---

--- --------- - -- - ---- - ----- -- -- --
--- ------ - -- -------------- - -----------------

----- -------------- - -- ------ -- ---------- -------------- -- ---------- -
  --- --- - ----------------------- ------ - -----------
  -----------------------
-

-------------
-------------------- ------------

在以上例子中，我们通过 fs.readFileSync 方法读取本地的 XML 文件。由于文件可能非常大，因此我们将文件拆成了 10MB 大小的 chunk，然后逐个 chunk 逐步解析 XML。

选项配置

可以通过 options 参数来传递一些配置选项，以便更好地解析 XML。以下是一些常用的选项：

attributeNamePrefix：该选项指定 XML 属性名称的前缀。
ignoreAttributes：该选项指定是否忽略 XML 属性。
parseNodeValue：该选项指定是否解析 XML 元素节点的值。
tagValueProcessor：该选项指定如何处理 XML 元素节点的值。
attributeValueProcessor：该选项指定如何处理 XML 属性值。

以下是一个使用选项的例子：

-- -------------------- ---- -------
----- --------- - ----------------- ------------------------------ --- -- --- ---------------------- -------------------------- ----------------------------- --- -- --------------------------- -- --------------------------------------

----- ------- - -
  -------------------- ---
  ----------------- ------
  --------------- -----
  ------------------ ----- -------- -- -
    -- -------- --- --------- -
      ------ - ----- --- --
    - ---- -
      ------ ----
    -
  --
  ------------------------ ----- --------- -- -
    -- --------- --- ----------- -
      ------ - ----- --- --
    - ---- -
      ------ ----
    -
  -
--

----- ------ - --- ----------------
----- ------- - ------------------------

---------------------

在以上例子中，我们使用了 tagValueProcessor 和 attributeValueProcessor 配置项来改变 JSON 对象的结构。

深度解读

fast-xml-parser-seq 的主要特点在于它的高性能和支持序列读取 XML。下面我们对它的源码作进一步解读。

元素节点的解析

fast-xml-parser-seq 采用了状态机模式（state machine）来解析 XML。其中，元素节点有如下 5 种状态：

BEGIN_NODE：表示开始解析该节点。
END_NODE：表示结束解析该节点。
SINGLE_NOTE：表示该节点不包括任何子节点。
IGNORE_NODE：表示该节点不需要被解析。
TEXT_NODE：表示该节点包括文本内容。

以下是一个关于元素节点解析的示意图：

在解析元素节点时，fast-xml-parser-seq 主要使用了两个数据结构：

stack：该数据结构用于存储元素节点。当一个元素节点开始解析时，它会被放入栈顶；当一个元素节点结束解析时，它会被弹出栈顶。
node：该数据结构用于存储当前解析的元素节点。当一个元素节点被放入栈顶时，该节点的信息也被存储在 node 中。

以下是一个关于 stack 和 node 的代码示例：

let stack = [];
let node = {
  name: "",
  attributes: {},
  children: [],
  value: ""
};

解析 XML 片段

fast-xml-parser-seq 支持解析 XML 片段。这是通过合并 XML 片段，并将合并后的字符串作为一个整体来解析来实现的。以下是代码示例：

function parse(xml) {
  this.parser.parseFragment(xml, { ... });
}

在解析片段时，要注意当前节点是否已经结束。若当前节点已经结束，那么需要弹出该节点，并递归调用 parseChunk 方法去处理下一个节点。以下是代码示例：

-- -------------------- ---- -------
-- ---------- -- -------------- -
  ----- ------ -
    -- ---------------------------------- -
      ----- ---------------- - ----------------- -- ------ --- -----------
      -- ----------------- -- -- -
        ----- - -------------- ------------------
        ---- - ---------------- - - - ---------------------- - -- - -----
        ------
      -
    - ---- -
      ---- - ------------
    -
  -
  -------------------------------
  ---------- - --------------------
  ---- - ------------------ - ---
  ------
  --------------------- -----
  ------ ------
-

迭代解析 XML

fast-xml-parser-seq 支持按顺序解析 XML。当解析一个节点时，fast-xml-parser-seq 不会一次性解析所有的子节点，而是先解析该节点的第一个子节点，并将其它子节点放入 stack 中，然后返回函数。函数再次被调用时，fast-xml-parser-seq 会从 stack 中取出下一个子节点，并继续解析。这种方式可以避免一次性解析太多节点而导致内存溢出。以下是代码示例：

-- -------------------- ---- -------
-- --------- --- ----------- -
  -- ------------------------------ - -- -
    ----------------------------------------------
    ------------
      ----- -----
      ------------- ------------ - -
    ---
    ----------- - --------------------------
    ------------ - --
    -------
  -
-

总结

fast-xml-parser-seq 是一个高性能的 XML 解析器，可以有效地解析大型的 XML 文件。它的解析算法采用了状态机和迭代解析方式，因此无论是在速度还是在性能方面都具有优异的表现。在前端领域，fast-xml-parser-seq 常常被用来解析 XML 接口返回的数据。

来源：JavaScript中文网，转载请注明来源 https://www.javascriptcn.com/post/60055d5681e8991b448db1be