Kubernetes 是一个非常强大的容器编排工具,它支持高可用、自动伸缩、自动部署等特性,在大规模容器管理方面表现出色。但是,随着 Kubernetes 集群规模的增加以及应用的复杂度增加,监控 Kubernetes 集群变得越来越重要。kube-state-metrics 是一个开源的 Kubernetes 监控工具,它通过提供 k8s 集群资源的监控指标,帮助用户更好地了解集群状态,快速定位问题。
kube-state-metrics 简介
kube-state-metrics 是一个开源项目,它是一个 Kubernetes 控制器,会监听 Kubernetes API 服务器的资源变化,将资源的状态转换成可被 Prometheus 及其他监控系统采集的指标数据格式。kube-state-metrics 支持监控 k8s 集群的大部分资源,包括:pod、node、service、replicationController、deployment、daemonSet、job、statefulSet、persistentVolumeClaim 等。用户可以使用 Prometheus 监控系统监控并展示 kube-state-metrics 提供的 k8s 集群资源指标,进行异常告警,帮助用户更好地维护 Kubernetes 集群。
安装及配置 kube-state-metrics
kube-state-metrics 的安装非常简单,在 Kubernetes 集群中添加 kube-state-metrics 控制器及其服务,即可实现该工具的部署。下面是 kube-state-metrics 的部署例子:
-- -------------------- ---- ------- ----------- ------- ----- ---------- --------- ----- ------------------ ---------- ----------- ----- --------- ------------ ---- ------------------ --------- - --------- --------- ------- ---- ------------------ ----- ----------- - ----- ------------------ ------ ---------------------------------------- ---------------- ------------ ------ - -------------- ---- --- ----------- -- ----- ------- --------- ----- ------------------ ---------- ----------- ------------ --------------------- ------ ----- ----- --------- --------- ---- ------------------ ------ - ----- ------------ ----- ----
部署完成后,可以使用 kubectl get pods 命令查看 kube-state-metrics 的状态。
配置 kube-state-metrics 监控指标非常简单,只需要在 Prometheus 服务器的配置文件 prometheus.yml 中添加以下配置即可:
-- -------------------- ---- ------- --------------- - --------- --------------------- ------- ----- ----------- -------- -------------------------- ------------------ --------------------------------------------------- ---------------------- - ----- --------- ---------------- - -------------- ----------------------------- ------------------------------- ------------------------------------- ------- ---- ------ --------------------------------------- - --------- ------------------ --------------- - -------- ---------------------------
上述配置会将 kube-state-metrics 在 8080 端口的指标收集到 Prometheus 服务器中,为 Prometheus 提供用于监测 Kubernetes 集群的相关指标。
kube-state-metrics 监控指标
kube-state-metrics 为用户提供了大量的 k8s 集群资源指标,其中包括:
- Kubernetes 资源自身的指标,包括数量、状态、版本等
- 容器指标,包括 cpu 和内存使用率
- Kubernetes 对象指标,包括 pod 的重启次数、容器日志、events 等
用户可以根据自己的需求按需监控,下面介绍几个常用的指标。
Deployment 状态
Deployment 是 Kubernetes 用于进行应用自动化管理的重要对象,kube-state-metrics 会自动监控 Deployment 的状态,包括副本数目、当前可用的 Pod 数、更新版本等,以及每个 Deployment object 都有副本集的指标。通过监控这些指标,可以快速了解 Deployment 的状态变化及问题。
kube_deployment_status_replicas_available{deployment="", namespace=""} kube_deployment_status_replicas{deployment="", namespace=""} kube_deployment_status_replicas_updated{deployment="", namespace=""} kube_deployment_status_replicas_unavailable{deployment="", namespace=""}
Pod 状态
Pod 是 Kubernetes 中最基本的对象,kube-state-metrics 会监控 Pod 对象的状态,包括运行状态、生命周期状态、容器状态等,用户可以通过 Pod 状态指标查看 Pod 运行状态及异常情况,追踪 Pod 生命周期变化。
kube_pod_status_phase{namespace="", pod=""} kube_pod_container_status_restarts_total{container="", image="", name="", namespace="", pod=""} kube_pod_info{namespace="", pod="", host_ip="", ip=""} kube_pod_status_ready{namespace="", pod=""} kube_pod_container_status_running{container="", image="", name="", namespace="", pod=""} kube_pod_container_status_waiting{container="", image="", name="", namespace="", pod=""}
Node 状态
Node 是 Kubernetes 集群中最重要的对象之一,kube-state-metrics 可以监控 Node 对象的状态及运行时指标,包括 CPU、内存、磁盘及网络等方面的信息,用户可以实时掌握 Node 资源的使用情况。
kube_node_spec_unschedulable{node=""} kube_node_status_capacity{node="", resource=""} kube_node_status_allocatable{node="", resource=""} kube_node_status_condition{node="", condition=""} kube_node_status_ready{node=""} kube_node_status_allocatable_cpu_cores{node=""}
指标可视化
使用 Prometheus 监控 k8s 集群变得更加普及,通过 Grafana 可以将它们可视化。在 Grafana 中创建一个新的数据源,选择 Prometheus 数据源,填入 Prometheus 的地址即可。创建新的 dashboard,选择需要展示的指标,就可以快速构建一个完整的 k8s 集群状态监控面板,并且方便快捷地进行数据可视化。
下图是一个简单的 k8s 资源监控面板示例,包括 Deployment 、Pod、Node 等状态信息:
总结
通过使用 kube-state-metrics 监控 k8s 资源,我们可以快速了解 Kubernetes 集群状态,及时发现问题并采取措施来保证集群处于正常可用的状态。kube-state-metrics 的配置非常简单,且提供了丰富的监控指标,可以灵活地满足用户的需求。对于运维人员来说,掌握 Kubernetes 监控工具已经成为必备技能之一,能够使用 kube-state-metrics 监控 k8s 集群,将会是将来趋势的核心竞争力。
来源:JavaScript中文网 ,转载请注明来源 https://www.javascriptcn.com/post/64589671968c7c53b0aefb2f