npm 包 entitizer.core 使用教程

阅读时长 6 分钟读完

entitizer.core 是一个流行的 npm 包,它提供了一组用于实体识别和标记的工具。这个库允许您在文本中查找和标记属于特定文本类型的实体,并从中提取信息。

安装

要安装 entitizer.core,请使用以下命令:

这将下载依赖项并将 entitizer.core 添加到您的项目中。

使用

创建 entitizer.core 实例

在使用 entitizer.core 之前,首先要使用以下方式创建一个实例:

EntitizerCore 接收一个可选的配置对象,以允许您更改行为。这是其中一些常用的选项:

  • lexer:定义用于标记文本的lexer,它将文本拆分为单个单词。默认值为 whitespace-lexer
  • recognizerDefinitions:定义识别器包。这允许您拓展内置的识别器,或添加自己的。
-- -------------------- ---- -------
----- - -------------- --------------------- - - --------------------------
----- --------------- - --- ------------------------
---------------------------------- -
  -
    ----- ------------
    ------ ---------------------
  --
---
----- --------- - --- --------------- ---------------------- --------------- ---

监视文本

要使用 entitizer.core 监视文本,请使用以下方式:

-- -------------------- ---- -------
----- - ------------- - - --------------------------
----- --------- - --- ----------------

-- ----
--------------------- ---------

-- ------
------------------------ -----------

-- ---------
------------------

添加识别器

entitizer.core 附带一些内置的识别器。不过,您可能需要添加自定义识别器来更好的满足您的需求。

-- -------------------- ---- -------
----- - -------------- ---------- - - --------------------------
----- --------- - --- ----------------

-- -----
--------------------------- --------------------------- -
  -
    ----- ---------------
    ------ ----------------------------------------
  --
----

-- -------
--------------------------
  --- --------------------------- -
    -
      ----- ---------------
      ------ ----------------------------------------
    --
  ---
  --- ----------------------------- -
    -
      ----- ----------------
      ------ ---------------------------------------------
    --
  ---
---

-- -----
--------------------------------------------

-- -------
--------------------------------------------- --------------------

寻找实体

entitizer.core 会对您所提供的文本进行标记,标记的实体名称将根据设置的识别器而定。

-- -------------------- ---- -------
----- - -------------- ---------- - - --------------------------
----- --------- - --- ----------------

-- -----
--------------------------- --------------------------- -
  -
    ----- ---------------
    ------ ----------------------------------------
  --
----

-- ----
----------------- ------ -- -- ---------------

-- ---------
----- ------------ - ---------------------------------------

--------------------------

代码将打印以下内容:

-- -------------------- ---- -------
-
  -
    ------- ---------------
    -------- --- --------------
    -------- ---
    ------ ---
    ----------------- ----------------
    -------- -
  -
-

事件监听

entitizer.core 支持事件监听,让您可以实时获取信息。

-- -------------------- ---- -------
----- - ------------- - - --------------------------
----- --------- - --- ----------------

-- -----
---------------------- -------- -- -
  --------------------
---

-- ----
------------------ ------ -- -- -------------- --- ----- -- --------------------

以上代码将打印以下内容:

-- -------------------- ---- -------
-
  ------- ---------------
  -------- --- --------------
  -------- ---
  ------ ---
  ----------------- ----------------
  -------- -
-
-
  ------- ----------------
  -------- -------------------
  -------- ---
  ------ ---
  ----------------- ------------------
  -------- -
-

结论

entitizer.core 是一个强大的 npm 包,用于实体识别和标记。通过本文,您学习到了如何使用 entitizer.core,包括如何创建 entitizer.core 实例、添加识别器、监视文本以及使用事件监听。您可以在自己的项目中使用 entitizer.core 来更好地处理文本。

来源:JavaScript中文网 ,转载请注明来源 https://www.javascriptcn.com/post/6005552581e8991b448d25a4

纠错
反馈