在现代 web 开发中,我们经常需要从网页中提取结构化数据。而 Microformats 是一种普遍可用的方式,用于将 HTML 页面中嵌入的结构化数据标准化。npm 包 @commenthol/microformat 提供了一个强大的工具,用于提取符合 Microformats 标准的数据。
在本篇文章中,我们将深入探讨如何使用 @commenthol/microformat 包,从而提取 Microformats 数据。
安装
首先,你需要将 @commenthol/microformat 安装到你的项目中。你可以使用 npm 命令来安装 @commenthol/microformat:
npm install @commenthol/microformat
使用
使用 @commenthol/microformat 包来提取 Microformats 数据非常简单。我们首先需要加载这个包,并使用 parse
函数来解析我们想要提取数据的页面:
-- -------------------- ---- ------- ----- ------- - ----------------------------------- ----- ---- - - ------ ------ ------------------ --------------- ------- ------ ---- --------------- --- ------------------- -------- ---- ------------------ --------------- --------- ----- ---- ------------ -------- --- ------------------- -------- ---- ----------------- ------- -- ---------------------------- ---- ---------- -- ------------------------------ -- ----------------------- -- ------------------------------- ------ ------ ------ ------- ------- -- ----------------------- -- - ----------------------------- ---
在这个例子中,我们加载了 @commenthol/microformat 包,并将 HTML 字符串传给了 parse
函数。parse
函数返回一个 Promise,当解析完成后,返回一个包含了提取的数据的对象。
解析结果
解析结果对象 (result
) 包含了多个键值对,这些键值对表示了我们从页面中提取的数据。最重要的键值对是 items
,它包含了所有符合 Microformats 标准的数据。在上述例子中,items
包含了一个 h-card
类型的对象,表示一个名为 John Doe 的人:
-- -------------------- ---- ------- - ------- - -------- -- ------------- - ------- - ----- ---- -- -------- - -------------- -- ------ - - ------- - -------- -- ------------- - ------- - ----- ---- -- ----------- - - ------- - ------- -- ------------- - ----------------- - ---- ---- ------- -- ----------- - --------- -- --------- - ---- -- -------------- - ------- - - - - - - - - -
我们可以从这个对象中读取任何我们需要的数据。例如,要获取人名,我们可以使用以下代码:
console.log(result.items[0].properties.name[0]);
这将输出:
John Doe
总结
@commenthol/microformat 包提供了一个非常简单的方法,用于解析符合 Microformats 标准的数据。在本篇文章中,我们学习了如何安装和使用这个包,并深入了解了解析结果的组成结构。当你需要从页面中提取结构化数据时,这个包会非常有用。
来源:JavaScript中文网 ,转载请注明来源 https://www.javascriptcn.com/post/60065b4bc6eb7e50355dbffe