在 K8s 环境下,应用监控是非常重要的一个环节。Kubernetes 作为容器编排和集群管理的标准,Prometheus 和 Grafana 作为重要的监控和可视化工具,成为了各大公司和社区热门的选择。
本文将详细介绍如何使用 Prometheus+Grafana 监控 Kubernetes 下的应用,并给出示例代码。
Prometheus 简介
Prometheus 是一款开源的监控系统,它以多维数据模型和灵活的查询语言 PromQL 为基础,采用 pull 模式从目标识别器(Exporter)收集时间序列数据,可以用于监控各种类型的系统,包括容器化应用。
Prometheus 的架构
Prometheus 的架构包含以下四个组件:
- Prometheus Server:负责收集指标数据、存储和查询数据;
- Exporter:暴露目标系统的指标数据,供 Prometheus Server 采集;
- Alertmanager:负责接收来自 Prometheus Server 的告警信息,并根据预定义的规则进行处理和发送;
- Pushgateway:用于存储临时数据,推送数据到 Prometheus Server。
Prometheus 的数据模型
Prometheus 的数据模型基于多维度度量(metric),每个度量由以下三部分组成:
- Metric 名称:标识一个指标;
- Labels:提供度量的附加信息,可以用于查询和区分不同的时间序列;
- Timestamp:度量的时间戳。
Prometheus 的数据由时间序列(time series)组成,每个时间序列包含对应的度量以及时间戳。
Prometheus 的查询语言
PromQL 是 Prometheus 的查询语言,它支持以下几种类型的操作:
- 查询特定的时间序列;
- 对时间序列进行聚合计算,如平均值;
- 对时间序列进行运算,如加减乘除;
- 返回时间序列的函数结果,如时间序列的数量。
Grafana 简介
Grafana 是一款开源的数据可视化工具,它支持多种数据源,包括 Prometheus、InfluxDB、Elasticsearch 等。Grafana 通过 Dashboard、Panel、Variable 等概念来组织展示的内容,可以实现丰富的图表展示、报表输出等功能。
在 Kubernetes 下使用 Prometheus+Grafana 监控应用
在 Kubernetes 下使用 Prometheus+Grafana 监控应用可以分为以下几个步骤:
- 安装 Prometheus Operator
- 创建 Prometheus 和 ServiceMonitor
- 安装 Grafana 和 Prometheus 数据源
- 创建 Dashboard
安装 Prometheus Operator
Prometheus Operator 是一款 Kubernetes 的扩展程序,通过自定义资源(Custom Resource Definitions,CRDs)来管理 Prometheus、Alertmanager、Thanos 等组件。
安装 Prometheus Operator 可以使用 helm,具体可参考官方文档或执行以下命令:
# 添加 stable 仓库 $ helm repo add stable https://kubernetes-charts.storage.googleapis.com/ # 安装 Prometheus Operator $ helm install prometheus-operator stable/prometheus-operator -n monitoring
创建 Prometheus 和 ServiceMonitor
Prometheus 和 ServiceMonitor 可以通过 Kubernetes 的 YAML 配置文件来创建。Prometheus 配置文件示例如下:
-- -------------------- ---- ------- ----------- ------------------------ ----- ---------- --------- ----- ---------- ------- ---- ---------- ----- ------------------- ---------- ----------------------- ------------ ----------------------------- ------------------- ---------- --------- ---- ---- ------- --- ------- ---- ---- ------- --- ------------- ------------ ----------- ---------- ---------- --- --------- - --------- -------------- - ---------- ---------- ----- ------------ ------------ -------------------- --------- ----- ---------- ----- ------------ - ------------- ---------- --------- -------- ----
ServiceMonitor 配置文件示例如下:
-- -------------------- ---- ------- ----------- ------------------------ ----- -------------- --------- ----- ----------- ------- ---- ----------- ----- --------- ------------ ---- --- ---------- - ----- ----
其中,ServiceMonitor 的 selector
用于通过 label 匹配需要监控的应用服务,endpoints
则用于指定需要采集的数据端点。
安装 Grafana 和 Prometheus 数据源
Grafana 可以通过 helm 安装,具体可以参考官方文档或执行以下命令:
# 安装 Grafana $ helm repo add grafana https://grafana.github.io/helm-charts $ helm install grafana grafana/grafana -n grafana --set persistence.enabled=true,persistence.size=10Gi # 安装 Prometheus 数据源插件 $ kubectl apply -f https://raw.githubusercontent.com/grafana/grafana-plugin-repository/main/repo/stable.yaml $ helm upgrade -i grafana --set "plugins.enableAlpha=true" grafana/grafana $ grafana-cli plugins install grafana-piechart-panel
安装完成后,可以访问 http://Grafana_IP:3000 进行登录和配置。
创建 Dashboard
创建 Dashboard 可以直接在 Grafana 中进行,也可以使用 JSON 配置文件导入。
以下是一个简单的 JSON 配置文件示例:
-- -------------------- ---- ------- - -------------- - ------- - - ------- --------- ------------- --- ------- ---- --------- ----- ------------ ---------- -------- ------------------------------------------- ------------- ------- ----- - - -- ----------- ----- --------- ----- --------------- -- ----- ----- -------- --- --------- - - ------------- ------------- -------------- - ----------- - --------- - ------ ---- ------- ------- -- ------- -------- ------------- - ------- ----------- -------- - - -------- -------- -------- ---- -- - -------- ------ -------- -- - - - -- ------------ -- -- ---------- - ---- -- ---- -- ---- -- ---- - -- ----- -- ---------- - ---------------------- ------ ----------------------- ---- -- ---------------- -------- ---------- - - ------- ---------------------------------------------------------------------- --------------- -------- - -- ----------- ----- ------------ ----- -------- ------- ------ - -- ---------------- --- -------- -------- ------- --- ------------- - ------- -- -- ------- - ------- ---------- ----- ----- -- ------------- --- ----------- --- -------- ---- ------------ ------ ------------ ---------- - -
以上示例配置文件中展示了一个指标 kube_pod_container_resource_requests_memory_bytes
的值,并通过阈值告警策略设置了告警规则。
更多配置和指标的展示方式可以参考官方文档和 Grafana 社区。
总结
本文通过介绍 Prometheus 和 Grafana 监控工具的基本概念和 Kubernetes 下应用监控的实现步骤,详细阐述了 Prometheus+Grafana 监控的相关技术要点,并给出了示例代码和配置文件。
相信本文对于需要实现 Kubernetes 下应用监控的开发者和运维人员具有一定的参考性和指导意义。
来源:JavaScript中文网 ,转载请注明来源 https://www.javascriptcn.com/post/652e16c07d4982a6ebf26aee