npm 包 GHU 使用教程

阅读时长 7 分钟读完

前言

作为一个前端开发者,日常工作中难免会有一些需要处理大量 HTML 的任务,如数据爬取、文本解析等。而我们常用的 jQuery 和正则表达式在这些场景下显得无力。这时候,一个强大的 HTML 解析工具就显得尤为重要了——GHU。

GHU 是一款基于 Node.js 的 HTML 解析工具,支持 HTML5 和各种浏览器的 DOM 标准。它可以通过选择器或自定义函数筛选出符合条件的 HTML 元素或文本内容,还可以操作元素的属性和修改文本内容。本文将详细介绍 GHU 的使用,以及如何将其应用于实际开发中。

安装

首先,我们需要在本地安装 GHU。在终端中挑选一个合适的目录,执行以下命令即可安装:

该命令会自动将 GHU 安装到全局环境中,使得我们可以在终端的任何位置通过 ghu 命令来使用它。

使用方法

GHU 的用法非常简单,其主要步骤如下:

  1. 加载 HTML 文件或字符串;
  2. 通过选择器或函数筛选元素;
  3. 操作已选定的元素或文本。

下面分别来介绍这三个步骤。

加载 HTML 文件或字符串

GHU 可以处理本地的 HTML 文件或来自网络的 HTML 页面,或者我们可以直接传入一个 HTML 字符串。下面是其中的三种形式:

加载本地文件

加载网络页面

直接传入字符串

选择器或函数筛选元素

在 GHU 中,可以通过两种方式来选择 DOM 元素:选择器和自定义函数。

选择器

GHU 支持大部分符合 CSS 选择器规范的选择器,如 id、class、标签名等。下面是一些例子:

-- -------------------- ---- -------
----- --- - ---------------
----- ---- - ----------------------------- ---------------------------------------------

-- ----- ---- --
----- -- - ------------------------------

-- ---- ----- - ------ - ---- --
----- ----- - ------------------------- 

-- ---- ---- --
----- -------- - ------------------

更多关于选择器的使用方法请参考 CSS 选择器文档

自定义函数

除了选择器外,GHU 还支持自定义函数的方式进行元素的筛选。自定义函数接收一个元素参数,返回一个 boolean 值,表示该元素是否符合条件。下面是一个例子:

-- -------------------- ---- -------
----- --- - ---------------
----- ---- - ----------------------------- ---------------------------------------------

-- ------------- ----- ---
-------- --------------------- -
  ------ -------------------------------
-

-- ---------
----- ---- - -----------------------------

操作已选定的元素或文本

在 GHU 中,操作元素或文本的方式也非常灵活,下面列出了一些主要的操作方法。

获取元素或文本

获取元素或文本其实就是一个大家熟悉的操作:.text().html().attr().val()。下面是各个方法的用法:

-- -------------------- ---- -------
----- --- - ---------------
----- ---- - ----------------- ---------------------------------------------------------

-- ---------
----- ---- - -------------------------------- -- -----

-- ----- ---- --
----- ----------- - -------------------------------- -- ---- ------------------------

-- --------
----- --------- - --------------------------------------- -- --------

-- --------
----- ---------- - ------------------------------- -- ----- ----

修改元素或文本

要修改元素或文本,我们需要使用 .set().remove().add() 等方法。这些方法的用法如下:

-- -------------------- ---- -------
----- --- - ---------------
----- ---- - ----------------- ------------------------------------------------------------ ----------- ------------- ----------- --------

-- ---------
--------------------------------- -------

-- ----- ---- --
--------------------------------------- --------------

-- ----
----------------------------------

-- -------------
-------------------------------------------------------------------

-- -------------
------------------------------------------------------------------ ---------

-- --------
--------------------------------- --------

示例代码

下面是一个简单的示例,演示了如何使用 GHU 完成数据爬取的过程。在这个例子中,我们将爬取一个网站上的所有文章标题和链接,保存为一个 JSON 格式的文件。

-- -------------------- ---- -------
----- --- - ---------------
----- -- - --------------

-- ----
----- ---- - -----------------------------------------

-- ---------
----- -------- - ------------------------------

-- ------------------------
----- ------ - -------------------- -- -
  ----- ----- - ----------------------------------
  ----- ---- - ---------------------------------
  ------ - ------ ---- --
---

-- ------ ---- --
--------------------------- ---------------------- ----- --- --- -- -
  -- ----- ----- ----
  ---------------------
---

总结

本文介绍了 GHU 的使用方法和示例代码,希望对大家有所帮助。在实际开发中,GHU 可以帮助我们快速高效地处理各种 HTML 相关的任务,如数据爬取、文本解析、模板渲染等,希望大家可以灵活地运用它。

来源:JavaScript中文网 ,转载请注明来源 https://www.javascriptcn.com/post/71195

纠错
反馈