使用 Serverless 架构实现数据分析和可视化

面试官:小伙子,你的数组去重方式惊艳到我了

Serverless 是一个相对较新且备受关注的云计算架构,它的主要特点是无须关注服务器硬件环境、操作系统和网络等基础设施,同时具有弹性、高可扩展性和运行成本低廉的优势。在此基础上,我们可以使用 Serverless 架构对数据进行分析和可视化,使得数据分析和产生见解的过程更加高效和便捷。本文将带大家深入了解使用 Serverless 架构实现数据分析和可视化的方法和步骤,并给出示例代码和实际应用案例。

准备工作

在开始本文所述的 Serverless 架构实现数据分析和可视化的过程之前,需要先准备好以下环境和工具。

  • Amazon Web Services (AWS) 或 Google Cloud Platform (GCP) 云平台账号
  • Python 编程语言(建议使用 Python 3.x)
  • AWS Lambda 或 Google Cloud Functions
  • AWS API Gateway 或 Google Cloud Endpoints
  • 数据库服务(如 Amazon RDS 或 Google Cloud SQL)
  • 数据分析和可视化工具(如 Pandas、Matplotlib、Plotly 等)

架构设计

Serverless 架构最重要的特点是把服务器管理交由云服务商,具体而言,我们可以使用 AWS Lambda 或 Google Cloud Functions 功能来实例化和管理我们的代码。这里我们以 AWS Lambda 为例进行介绍。

如上图所示,我们可以设计如下的 Serverless 架构来实现数据分析和可视化:用户访问前端网站,前端网站调用 AWS API Gateway 中的 RESTful API,RESTful API 调用 AWS Lambda 函数,AWS Lambda 函数调用后端数据库服务获取数据,将获取的数据进行分析可视化之后返回到前端网站。这里我们使用 Pandas 和 Plotly 进行数据分析和可视化。下文将分别介绍各部分的实现细节。

架构实现

1. 搭建 AWS RDS 数据库

对于需要进行数据分析和可视化的数据,我们需要先将其存储到数据库中,这里我们使用的是 Amazon RDS 服务。在此之前,我们需要先登录到 AWS 控制台,找到 RDS 服务页面,创建一个新的数据库实例。具体操作步骤如下:

  1. 登录到 AWS 控制台,找到 RDS 服务页面;
  2. 点击左侧菜单栏中的“数据库”按钮,选择“数据库实例”;
  3. 点击“创建数据库实例”按钮,选择需要使用的数据库引擎,这里我们使用的是 Postgres;
  4. 配置数据库实例的各项参数,包括实例规模、数据库版本、网络配置等;
  5. 设置数据库的认证名称和密码;
  6. 点击“创建数据库实例”按钮,等待数据库实例创建完毕。

2. 实现 AWS Lambda 函数

在本步骤中,我们将实现一个 AWS Lambda 函数,用于对数据库中的数据进行分析和可视化。代码实现细节如下:

- ---------
------ ------ -- --
------ ----------------- -- --
------ --------- -- ---
------ --------
---- -- ------ -------

- ---------
------- - --------------
------- - --------------
------- - --------------
----------- - ------------------
------- - --------------

- ---------
--- --------------------
    ---- - ------------------------------ ------------- --------------- ------------- ---------------------
    ------ ----

- ---------
--- -----------
    ---- - -------------------
    ----- - ---
        ------ --------- --------- --------
        ---- -----------
    ---
    ---- - ------------------ -----
    ------ ----

- ------------
--- -------------------
    - ----- ------ - ------ --------------
    ------ ---

- ------------
--- -------------------
    --------- - ---------
    -------------------- ---------- -------------
    ------ --------------------

- --- ------ ----
--- --------------------- ---------
    - ----
    ---- - ----------
    - ---------
    --- - ------------------
    - ------------
    --------- - ------------------
    - --------
    ------ -
        ---------- -
            --------------- -----------
        --
        ------------- ----
        ------- ---------
    -

在以上代码中,我们首先导入了需要使用的库和模块,分别是 Pandas、Plotly、psycopg2 和 BytesIO,其中 psycopg2 模块是 Python 与 PostgreSQL 数据库进行交互的标准模块。之后我们定义了一些常量,如数据库连接参数和数据库查询语句等,并实现了创建和数据库的连接、从数据库中获取数据、分析数据生成图表和将图表转换为二进制流数据的几个函数。其中,分析数据生成图表的细节因数据类型的不同而有所区别,可以根据实际情况进行调整。

最后我们实现了 AWS Lambda 函数的执行函数,执行函数会先调用获取数据的函数,随后根据数据分析和生成图表,将图表转换为二进制流数据,并返回二进制流数据。在本例中,我们将图表转换为 PNG 格式的二进制流数据,作为服务端的响应数据使用。

3. 实现 AWS API Gateway

在完成了 AWS Lambda 函数的实现之后,我们需要将其暴露为一个 RESTful API,这里我们使用 AWS API Gateway 来实现。具体步骤如下:

  1. 登录到 AWS 控制台,找到 API Gateway 服务页面;
  2. 点击左侧菜单栏中的“REST API”按钮,选择“新建 API”;
  3. 选择“REST API”并选择“HTTP API”,命名 API 并选择 HTTP API 协议;
  4. 在“整合 Lambda 函数”选项卡中,选择设置为新建的 Lambda 函数;
  5. 点击“创建”按钮,等待 API Gateway API 创建成功。

4. 实现前端网站

对于前端网站的实现,我们这里不进行深入讲解,参考者可以选择自己熟悉的前端框架来实现。在本例中,我们需要使用 RESTful API,因此需要掌握如何使用 JavaScript 或 Python 等语言来调用 RESTful API,并使用响应数据进行页面渲染。下文给出使用 Python 调用 RESTful API 并在 Web 页面中显示图表的示例代码。

- ---------
------ --------
------ ------
---- -- ------ -------
---- --- ------ -----
------ ----------------- -- ---

- -- --- ------- - ---
------- - ----------------------

- -- --- ------ ------------
--- -----------------
    -------- - ---------------------
    --------- - ----------------------------------
    --- - ------------------------------
    ------ ---

- - --- ----------
--- ------------
    --- - ----------------
    --- - ------------
    ---------------------
    --------------------
    ---------------
    ----------

在以上代码中,我们首先导入了需要使用的库和模块,分别是 requests、base64、BytesIO、PIL 和 matplotlib,其中 requests 模块是 Python 的网络请求库,PIL 是 Python 的图像处理库,matplotlib 是 Python 的绘图库。之后我们定义了一个常量,即 AWS Lambda 函数的 API Gateway 的 URL,并实现了两个函数,分别是调用 AWS Lambda 函数并获得图表数据的函数和在 Web 页面中绘制图表的函数。在本例中,我们使用了 matplotlib 绘制图表,并在 Web 页面中进行显示。

实际案例

在实现完以上 Serverless 架构实现数据分析和可视化的方法和步骤之后,我们可以考虑应用到实际的项目中。本节将介绍一个基于 Serverless 架构实现数据分析和可视化的实际案例:使用 AWS Lambda、API Gateway 和 RDS 服务对电子商务交易数据进行分析和可视化。

我们的目标是对电子商务交易数据进行分析,得出一些有用的商业见解,并可视化展现出来。对于电商数据,我们可以从平台商城或者第三方数据提供商获取。获取到数据后,我们将其存储到 AWS RDS 服务中,并使用 Serverless 架构进行数据分析和可视化,最终将结果呈现在一个 Web 页面中。下面是一些示例的电商数据,我们将其存储到 AWS RDS 中供后续使用。

我们将电商交易数据中的商品分类、商品销量和商品价格等信息进行了整理,并使用 Pandas 和 Plotly 进行图表生成和可视化展示。具体的图表和代码实现见下面的示例。在本例中,我们使用了 AWS Lambda 和 API Gateway 服务,并使用 Plotly 绘制图表,调用 RESTful API 并使用 Flask 框架作为前端 Web 应用。

示范代码

- ---------
------ ------ -- --
------ ----------------- -- --
------ --------- -- ---
---- -- ------ -------
------ --------

- -- ----- ----
---- ----- ------ ------ --------- ---------------

--- - ---------------

- ---------
------- - --------------
------- - --------------
------- - --------------
----------- - ------------------
------- - --------------

- ---------
--- --------------------
    ---- - ------------------------------ ------------- --------------- ------------- ---------------------
    ------ ----

- ---------
--- -----------
    ---- - -------------------
    ----- - ---
        ------ --------- ---------- -- ------ ---------- -- ---------
        ---- ---------------
        ----- -- --------
    ---
    ---- - ------------------ -----
    ------ ----

- ------------
--- -------------------
    ------ - -------------------------- ---------------- -------------
    ------ - ------------------------------ -------------------- --------- ------- -----------
    ------ - ----------
        ----------------- ----- ----------
        -----------
            -------------
        --
        ------------
            ---------- -------
            ---------------
            ------------
        -
    -
    --- - ----------------------- -------- --------------
    ------ ---

- ------------
--- -------------------
    --------- - ---------
    -------------------- ---------- -------------
    ------ --------------------

- ----- --- ---------
---------------
--- --------
    ------ -----------------------------

---------------------------
--- -------
    - ----
    ---- - ----------
    - ---------
    --- - ------------------
    - ------------
    --------- - ------------------
    - --------------------- --- ---------
    ------ ------------------- ---------------------

-- -------- -- -----------
    -------------------

在以上代码中,我们首先导入了需要使用的库和模块,包括 Pandas、Plotly、psycopg2、BytesIO 和 Flask 等。其中,Flask 是一个 Python Web 应用框架,可以用来实现前端网站和 Web API 等应用。之后我们定义了一些常量,如数据库连接参数和数据库查询语句等,并实现了创建和数据库的连接、从数据库中获取数据、分析数据生成图表和将图表转换为二进制流数据的几个函数。其中,分析数据生成图表的细节因数据类型的不同而有所区别,可以根据实际情况进行调整。

最后我们使用 Flask 进行 Web 应用框架的路由定义,即在 /api/plot.png 路径下暴露生成图片的 RESTful API,使用 index.html 文件作为前端首页模板。运行 Web 应用程序后可以在浏览器中输入 http://localhost:5000/ 访问我们的应用,最终结果是如下图所示的交易数据的可视化展示。

结论

本文介绍了使用 Serverless 架构实现数据分析和可视化的方法和步骤,并给出示例代码和实际应用案例。在此过程中,我们使用了 AWS Lambda、API Gateway 和 RDS 等服务,并使用 Pandas 和 Plotly 作为数据处理和可视化工具。在应用时,我们需要根据实际情况进行具体的架构设计和代码实现,结合前端框架和 Web 应用程序,实现通过 Serverless 架构实现高效、可扩展、低成本的数据分析和可视化。

来源:JavaScript中文网 ,转载请联系管理员! 本文地址:https://www.javascriptcn.com/post/66f4e387c5c563ced5664e84


猜你喜欢

  • 使用 Headless CMS 简化博客网站搭建

    在传统的博客网站搭建模式中,通常需要使用一个完整的 CMS 系统,如 WordPress 或 Joomla 等,它们提供了完整的前端和后端功能,包括用户管理、文章发布、样式自定义等。

    5 小时前
  • Cypress 错误解决:如何解决 No Such Element 错误

    Cypress 是一个基于 JavaScript 的前端自动化测试框架,它可以帮助我们高效地编写和运行自动化测试用例。然而,在使用 Cypress 进行测试的过程中,我们有时会遇到 No Such E...

    5 小时前
  • Mocha 测试中怎么样才能只执行部分测试用例?

    在使用 Mocha 进行测试时,你可能需要只运行部分测试用例而不是全部运行。这可能是因为你的测试套件非常大,或者你想只测试一部分代码。本文将介绍如何在 Mocha 中只执行部分测试用例,并提供一些示例...

    5 小时前
  • IOS 开发:如何优化本地存储

    本地存储是一种在移动应用程序和网站开发中常见的技术,它可以在用户离线时继续提供信息、内容和功能。在 IOS 开发中,使用本地存储的最佳方法是使用内置数据库 SQLite。

    5 小时前
  • TypeScript 中使用 let 和 const 定义变量和常量

    介绍 TypeScript 是一种静态类型检查器,它扩展了 JavaScript 并使其更易于使用和维护。在 TypeScript 中,我们可以使用 let 和 const 来定义变量和常量。

    5 小时前
  • 如何修复 CSS Reset 对滚动条样式的影响?

    在前端开发中,CSS Reset 是一个非常常见的技术。 它的原理是通过将浏览器的默认样式重置为一致的标准,以确保不同浏览器之间的样式相同。 但是 CSS Reset 常常会对浏览器滚动条样式造成影响...

    5 小时前
  • 在 Fastify 中构建 JWT 认证服务器

    引言 JWT(JSON Web Tokens)是一种用于安全交换信息的开放式标准,它可以在多个服务之间传递认证信息。在构建 Web 应用程序时,往往需要在请求和响应之间进行身份验证,JWT 作为一种有...

    5 小时前
  • 如何使用 ES6 中的数组方法简化代码

    如何使用 ES6 中的数组方法简化代码 随着 JavaScript 语言的发展,ES6 中新增的许多数组方法大大简化了开发人员的编程工作。这些方法可以让我们更容易地处理数据和操作数组,同时大大增加了代...

    5 小时前
  • SPA 开发中前后端分离的优缺点及应用实践

    单页应用(Single Page Application,SPA)是一种现代化的 Web 应用程序开发模式,它的一个特点就是前后端分离。本文将介绍 SPA 开发中前后端分离的优缺点,以及如何实践前后端...

    5 小时前
  • 使用 Enzyme + Jest 测试通过 HOC 形式创建的 React 组件

    在 React 中,高阶组件(Higher Order Component,简称 HOC)是一种非常常见的模式,它允许我们将组件逻辑重用在多个组件之间。使用 HOC 可以让我们更好地管理组件间的复杂度...

    5 小时前
  • PM2 与 Docker:构建可伸缩的 Node.js 应用程序

    前言 在开发现代 Web 应用程序时,Node.js 已成为最受欢迎的开发语言之一。Node.js 可以大力发挥其高度可扩展的架构,以构建高性能的 Web 应用程序。

    5 小时前
  • Material Design 中主题颜色的修改与自定义方法

    Material Design 是 Google 在 2014 年发布的一种全新的平面设计语言,旨在提供一个简洁、明晰、具有层次的用户界面设计风格。该设计语言使用明亮的色彩、深入的阴影效果、多种类型的...

    5 小时前
  • CSS Grid 布局问题集锦

    CSS Grid 布局是一种基于网格的布局系统,可以帮助前端开发人员更轻松地构建自适应、灵活且可复用的界面。尽管 CSS Grid 布局越来越普及,但是仍然存在一些问题需要面对和解决。

    5 小时前
  • 在 TailwindCSS 中实现无限滚动加载的技巧

    随着 Web 应用程序的普及,无限滚动加载成为了越来越流行的设计模式。它可以使用户感到更流畅,避免需要单击“下一页”按钮的情况。在 TailwindCSS 中实现无限滚动加载并不难,但是需要了解一些特...

    5 小时前
  • Redux 和 Immutable 数据结构的集成

    Redux 和 Immutable 数据结构的集成 储存和操作状态是前端应用程序的重要组成部分。Redux 和 Immutable 都是流行的前端技术,它们可以帮助处理状态,并提高应用程序的性能。

    5 小时前
  • ECMAScript 2021 和 React:优化性能的新方法

    前言 前端开发涉及到很多复杂的技术,而随着业界不断提升对用户体验的要求,性能优化也成为了前端开发的重点。ECMAScript 2021 和 React 的新功能在性能优化方面提供了一些新的方法,让开发...

    5 小时前
  • 10个ECMAScript 2019的新特性

    ECMAScript是JavaScript的标准规范,每年都会推出新的版本,提供新的特性和语法糖。2019版的ECMAScript已经发布,本篇文章将详细介绍10个新特性,对前端开发有指导意义。

    5 小时前
  • 如何实现无障碍访问依赖动态内容的应用程序?

    随着互联网技术的发展,越来越多的应用程序需要依赖动态内容来提供用户体验,例如 AJAX 加载、单页应用程序等。然而,这些应用程序往往会给残障人士造成访问困难,导致其无法充分利用这些服务。

    5 小时前
  • 构建高可用的 SPA 应用:浏览器兼容解决方案

    单页应用(Single Page Application,SPA)是现代 Web 开发技术的重要组成部分,它可以提供卓越的用户体验和高效的页面加载速度。但是,由于 Web 浏览器市场的多样性,有时候我...

    5 小时前
  • 在 SASS 中使用媒体查询的正确方法

    在SASS中使用媒体查询的正确方法 作为前端开发人员,我们经常需要针对不同的屏幕尺寸和设备类型来优化我们的网页布局和样式。这时候,媒体查询就成了我们必不可少的工具。

    5 小时前