前言
gulp-artoo 是一个让前端开发人员可以更加便捷的操控 dom 的 npm 包,它可以用于抽取 web 页面中的数据,并将其导出为 Excel 文件格式。gulp-artoo 通过 artoo.js 实现了对页面中 dom 元素的一个简单扩展,使得页面中的数据抽取变得非常方便。在本文中,将会介绍 gulp-artoo 的基本使用,并给出一些常用的例子。
安装
使用 npm 安装 gulp-artoo
npm install --save-dev gulp-artoo
基本使用
使用 gulp 来运行 gulp-artoo 并抽取数据。以下是一些基本的例子:
-- -------------------- ---- ------- ----- ---- - ---------------- ----- ----- - ---------------------- ----- ------ - ----------------------- -------------------- -- -- - ------ ----------------------------- ------------- -------- ----------------------------------------------- --------------------------------------------------------------------------------- ------- - ------ ---------------------- ------- -------- ------ ---------------------- -------- -------- -- --- ---------------------------- ---------------------------- ---
对页面进行抽取
gulp-artoo 可以对页面进行抽取,将指定的值抽取出来并导出为 Excel 文件。以下是一个例子:
artoo.scrape('.product .name', 'text');
这个例子会抽取位于 HTML 页面中 class="product" 并包含 class="name" 这个元素的文本信息。
执行脚本
在 gulp-artoo 的执行过程中,你也可以执行脚本。例如把所有的价格都乘以 2:
artoo(function($) { // 把价格乘以 2 $('.product .price').each(function() { $(this).text(parseFloat($(this).text()) * 2); }); });
定义回调
你也可以定义一个回调函数来处理数据输出:
.on('data', function(chunk) { console.log(chunk); });
当 stream 中有数据到达时,chunk 中包含的是当前正在处理的 buffer。
导出为 Excel 文件
使用 npm 包 gulp-rename
和 gulp.dest
将文件导出为 Excel 文件:
.pipe(rename('output.xlsx')) .pipe(gulp.dest('public/'));
结论
gulp-artoo 是一个高度便捷的 npm 包,它简化了 web 开发人员对数据的抽取工作,并且可以将数据导出为 Excel 文件。在本文中我们介绍了基本的使用方法和一些实际例子。希望这篇文章可以帮助你更好地开始使用 gulp-artoo。
来源:JavaScript中文网 ,转载请注明来源 https://www.javascriptcn.com/post/74536