在 K8s 环境下,应用监控是非常重要的一个环节。Kubernetes 作为容器编排和集群管理的标准,Prometheus 和 Grafana 作为重要的监控和可视化工具,成为了各大公司和社区热门的选择。
本文将详细介绍如何使用 Prometheus+Grafana 监控 Kubernetes 下的应用,并给出示例代码。
Prometheus 简介
Prometheus 是一款开源的监控系统,它以多维数据模型和灵活的查询语言 PromQL 为基础,采用 pull 模式从目标识别器(Exporter)收集时间序列数据,可以用于监控各种类型的系统,包括容器化应用。
Prometheus 的架构
Prometheus 的架构包含以下四个组件:
- Prometheus Server:负责收集指标数据、存储和查询数据;
- Exporter:暴露目标系统的指标数据,供 Prometheus Server 采集;
- Alertmanager:负责接收来自 Prometheus Server 的告警信息,并根据预定义的规则进行处理和发送;
- Pushgateway:用于存储临时数据,推送数据到 Prometheus Server。
Prometheus 的数据模型
Prometheus 的数据模型基于多维度度量(metric),每个度量由以下三部分组成:
- Metric 名称:标识一个指标;
- Labels:提供度量的附加信息,可以用于查询和区分不同的时间序列;
- Timestamp:度量的时间戳。
Prometheus 的数据由时间序列(time series)组成,每个时间序列包含对应的度量以及时间戳。
Prometheus 的查询语言
PromQL 是 Prometheus 的查询语言,它支持以下几种类型的操作:
- 查询特定的时间序列;
- 对时间序列进行聚合计算,如平均值;
- 对时间序列进行运算,如加减乘除;
- 返回时间序列的函数结果,如时间序列的数量。
Grafana 简介
Grafana 是一款开源的数据可视化工具,它支持多种数据源,包括 Prometheus、InfluxDB、Elasticsearch 等。Grafana 通过 Dashboard、Panel、Variable 等概念来组织展示的内容,可以实现丰富的图表展示、报表输出等功能。
在 Kubernetes 下使用 Prometheus+Grafana 监控应用
在 Kubernetes 下使用 Prometheus+Grafana 监控应用可以分为以下几个步骤:
- 安装 Prometheus Operator
- 创建 Prometheus 和 ServiceMonitor
- 安装 Grafana 和 Prometheus 数据源
- 创建 Dashboard
安装 Prometheus Operator
Prometheus Operator 是一款 Kubernetes 的扩展程序,通过自定义资源(Custom Resource Definitions,CRDs)来管理 Prometheus、Alertmanager、Thanos 等组件。
安装 Prometheus Operator 可以使用 helm,具体可参考官方文档或执行以下命令:
# 添加 stable 仓库 $ helm repo add stable https://kubernetes-charts.storage.googleapis.com/ # 安装 Prometheus Operator $ helm install prometheus-operator stable/prometheus-operator -n monitoring
创建 Prometheus 和 ServiceMonitor
Prometheus 和 ServiceMonitor 可以通过 Kubernetes 的 YAML 配置文件来创建。Prometheus 配置文件示例如下:
// javascriptcn.com 代码示例 apiVersion: monitoring.coreos.com/v1 kind: Prometheus metadata: name: prometheus labels: app: prometheus spec: serviceAccountName: prometheus serviceMonitorSelector: matchLabels: app.kubernetes.io/managed-by: prometheus-operator resources: requests: cpu: 200m memory: 1Gi limits: cpu: 400m memory: 2Gi ruleSelector: matchLabels: prometheus: prometheus retention: 10d replicas: 1 alerting: alertmanagers: - namespace: monitoring name: alertmanager storageSpec: volumeClaimTemplate: metadata: name: prometheus spec: accessModes: - ReadWriteOnce resources: requests: storage: 10Gi
ServiceMonitor 配置文件示例如下:
// javascriptcn.com 代码示例 apiVersion: monitoring.coreos.com/v1 kind: ServiceMonitor metadata: name: app-monitor labels: app: app-monitor spec: selector: matchLabels: app: app endpoints: - port: http
其中,ServiceMonitor 的 selector
用于通过 label 匹配需要监控的应用服务,endpoints
则用于指定需要采集的数据端点。
安装 Grafana 和 Prometheus 数据源
Grafana 可以通过 helm 安装,具体可以参考官方文档或执行以下命令:
# 安装 Grafana $ helm repo add grafana https://grafana.github.io/helm-charts $ helm install grafana grafana/grafana -n grafana --set persistence.enabled=true,persistence.size=10Gi # 安装 Prometheus 数据源插件 $ kubectl apply -f https://raw.githubusercontent.com/grafana/grafana-plugin-repository/main/repo/stable.yaml $ helm upgrade -i grafana --set "plugins.enableAlpha=true" grafana/grafana $ grafana-cli plugins install grafana-piechart-panel
安装完成后,可以访问 http://Grafana_IP:3000 进行登录和配置。
创建 Dashboard
创建 Dashboard 可以直接在 Grafana 中进行,也可以使用 JSON 配置文件导入。
以下是一个简单的 JSON 配置文件示例:
// javascriptcn.com 代码示例 { "annotations": { "list": [ { "name": "Deploy", "datasource": "-- Grafana --", "enable": true, "iconColor": "#fc8d62", "query": "label_values(kube_pod_labels{app=\"app\"}, deployment)", "type": "tag" } ] }, "editable": true, "gnetId": null, "graphTooltip": 0, "id": null, "links": [], "panels": [ { "datasource": "prometheus", "fieldConfig": { "defaults": { "custom": { "min": "0", "unit": "short" }, "unit": "bytes", "thresholds": { "mode": "absolute", "steps": [ { "color": "green", "value": null }, { "color": "red", "value": 80 } ] } }, "overrides": [] }, "gridPos": { "h": 7, "w": 8, "x": 0, "y": 0 }, "id": 1, "options": { "showThresholdLabels": false, "showThresholdMarkers": true }, "pluginVersion": "7.3.6", "targets": [ { "expr": "sum(kube_pod_container_resource_requests_memory_bytes{app=\"app\"})", "legendFormat": "Memory" } ], "timeFrom": null, "timeShift": null, "title": "Memory Usage" } ], "schemaVersion": 26, "style": "light", "tags": [], "templating": { "list": [] }, "time": { "from": "now-10m", "to": "now" }, "timepicker": {}, "timezone": "", "title": "App Monitoring", "uid": "U6CVCCuMk", "version": 1 }
以上示例配置文件中展示了一个指标 kube_pod_container_resource_requests_memory_bytes
的值,并通过阈值告警策略设置了告警规则。
更多配置和指标的展示方式可以参考官方文档和 Grafana 社区。
总结
本文通过介绍 Prometheus 和 Grafana 监控工具的基本概念和 Kubernetes 下应用监控的实现步骤,详细阐述了 Prometheus+Grafana 监控的相关技术要点,并给出了示例代码和配置文件。
相信本文对于需要实现 Kubernetes 下应用监控的开发者和运维人员具有一定的参考性和指导意义。
来源:JavaScript中文网 ,转载请注明来源 本文地址:https://www.javascriptcn.com/post/652e16c07d4982a6ebf26aee