entitizer.core 是一个流行的 npm 包,它提供了一组用于实体识别和标记的工具。这个库允许您在文本中查找和标记属于特定文本类型的实体,并从中提取信息。
安装
要安装 entitizer.core,请使用以下命令:
npm install entitizer.core --save
这将下载依赖项并将 entitizer.core 添加到您的项目中。
使用
创建 entitizer.core 实例
在使用 entitizer.core 之前,首先要使用以下方式创建一个实例:
const { EntitizerCore } = require('entitizer.core'); const entitizer = new EntitizerCore();
EntitizerCore 接收一个可选的配置对象,以允许您更改行为。这是其中一些常用的选项:
lexer
:定义用于标记文本的lexer,它将文本拆分为单个单词。默认值为whitespace-lexer
。
const { EntitizerCore, createWhitespaceLexer } = require('entitizer.core'); const lexer = createWhitespaceLexer(); // 创造一个标记分词器 const entitizer = new EntitizerCore({ lexer });
recognizerDefinitions
:定义识别器包。这允许您拓展内置的识别器,或添加自己的。
-- -------------------- ---- ------- ----- - -------------- --------------------- - - -------------------------- ----- --------------- - --- ------------------------ ---------------------------------- - - ----- ------------ ------ --------------------- -- --- ----- --------- - --- --------------- ---------------------- --------------- ---
监视文本
要使用 entitizer.core 监视文本,请使用以下方式:
-- -------------------- ---- ------- ----- - ------------- - - -------------------------- ----- --------- - --- ---------------- -- ---- --------------------- --------- -- ------ ------------------------ ----------- -- --------- ------------------
添加识别器
entitizer.core 附带一些内置的识别器。不过,您可能需要添加自定义识别器来更好的满足您的需求。
-- -------------------- ---- ------- ----- - -------------- ---------- - - -------------------------- ----- --------- - --- ---------------- -- ----- --------------------------- --------------------------- - - ----- --------------- ------ ---------------------------------------- -- ---- -- ------- -------------------------- --- --------------------------- - - ----- --------------- ------ ---------------------------------------- -- --- --- ----------------------------- - - ----- ---------------- ------ --------------------------------------------- -- --- --- -- ----- -------------------------------------------- -- ------- --------------------------------------------- --------------------
寻找实体
entitizer.core 会对您所提供的文本进行标记,标记的实体名称将根据设置的识别器而定。
-- -------------------- ---- ------- ----- - -------------- ---------- - - -------------------------- ----- --------- - --- ---------------- -- ----- --------------------------- --------------------------- - - ----- --------------- ------ ---------------------------------------- -- ---- -- ---- ----------------- ------ -- -- --------------- -- --------- ----- ------------ - --------------------------------------- --------------------------
代码将打印以下内容:
-- -------------------- ---- ------- - - ------- --------------- -------- --- -------------- -------- --- ------ --- ----------------- ---------------- -------- - - -
事件监听
entitizer.core 支持事件监听,让您可以实时获取信息。
-- -------------------- ---- ------- ----- - ------------- - - -------------------------- ----- --------- - --- ---------------- -- ----- ---------------------- -------- -- - -------------------- --- -- ---- ------------------ ------ -- -- -------------- --- ----- -- --------------------
以上代码将打印以下内容:
-- -------------------- ---- ------- - ------- --------------- -------- --- -------------- -------- --- ------ --- ----------------- ---------------- -------- - - - ------- ---------------- -------- ------------------- -------- --- ------ --- ----------------- ------------------ -------- - -
结论
entitizer.core 是一个强大的 npm 包,用于实体识别和标记。通过本文,您学习到了如何使用 entitizer.core,包括如何创建 entitizer.core 实例、添加识别器、监视文本以及使用事件监听。您可以在自己的项目中使用 entitizer.core 来更好地处理文本。
来源:JavaScript中文网 ,转载请注明来源 https://www.javascriptcn.com/post/6005552581e8991b448d25a4