npm 包 data-etl 使用教程

阅读时长 4 分钟读完

简介

data-etl 是一款基于 Node.js 的数据 ETL 工具,用于在数据仓库、数据湖、数据集市等场景下,对数据进行抽取、转换和派发,可自定义数据处理流程,简化数据处理任务流程。

安装

在项目根目录下使用 npm 进行安装:

使用

创建数据处理任务

在项目文件夹下创建一个名为 data_etl.js 的新文件,并使用 require 引入 data-etl 包:

创建数据处理任务并添加数据处理行为:

-- -------------------- ---- -------
----- ---- - ---------------------

-------------- ----- ----- -- -
  -- ---------
  ----- -------
---

-- ------------------
-------------- ----- ----- -- -
  -- --------- 
  ----- -------
---

执行数据处理任务

示例

任务创建及数据处理

-- -------------------- ---- -------
----- ------- - --------------------

----- ---- - ---------------------

-------------- ----- ----- -- -
  ----- ---- - --------- -- ----
  -- ---------
  -------- - -------- -- ----
  ----- -------
---

-------------- ----- ----- -- -
  ----- ---- - --------- -- ----
  -- ---------
  -------- - -------- -- ----
  ----- -------
---

-----------

数据格式与内容

示例数据如下:

-- -------------------- ---- -------
-
  -
    ----- --
    ------- -----
    ------ ---
    --------- ------
  --
  -
    ----- --
    ------- -----
    ------ ---
    --------- --------
  -
-

假设需要对该数据进行以下处理:

  • 对年龄大于 18 岁的进行筛选
  • 将名字转换为大写字母
-- -------------------- ---- -------
----- ------- - --------------------

----- ---- - ---------------------

-------------- ----- ----- -- -
  ----- ---- - ---------
  ----- ------- - ---------------- -- -------- - ----
  -------- - --------
  ----- -------
---

-------------- ----- ----- -- -
  ----- ---- - ---------
  ----- ------- - ------------- -- --
    --------
    ----- -----------------------
  ----
  -------- - --------
  ----- -------
---

-----------

得到的新数据如下:

总结

data-etl 是一款强大的数据处理工具,可以帮助我们处理大量、复杂的数据,加快数据处理效率。在使用过程中,需要充分理解其功能与用途,正确使用数据处理行为,并在实践中不断积累经验与技巧。

来源:JavaScript中文网 ,转载请注明来源 https://www.javascriptcn.com/post/600668e2d9381d61a3540996

纠错
反馈