Kubernetes 是目前最流行的容器编排系统之一,它提供了许多优秀的特性,其中之一就是调度器。调度器是 Kubernetes 集群中负责管理容器调度的组件,它的主要作用是将容器部署到合适的节点上以尽可能地利用资源。
本文将会对 Kubernetes 中调度器的工作流程进行分析,并且分享一些最佳实践以及示例代码。
调度器的概念及作用
调度器是 Kubernetes 中的一个核心组件,主要负责对集群中的容器进行调度,并将其分配到适当的节点上进行部署。
调度器在 Kubernetes 中的核心作用如下:
- 监听 API server 中 SchedulerConfigMap 和 SchedulerPolicyConfigMap 中的配置变更,从而调整调度策略;
- 监听 Pod 资源的创建和删除操作,调度尚未绑定到节点的 Pod 到合适的节点上;
- 监听节点的变化,例如节点宕机或新增节点,然后对相关 Pod 进行重新调度或或将其直接绑定到这些新节点上。
一个调度器通常由两部分组成:调度器本身和调度器算法(也称为 Predicates 和 Priorities)。
- 调度器本身:负责监听和响应 API server 的操作,并采用调度器算法确定要绑定到哪个节点上。
- 调度算法:是一些规则和策略,用于判断哪些节点可以绑定 Pod,并根据 Pod 的需求和节点的资源特性来确定最终的节点。调度算法中的两个重要部分是 Predicates 和 Priorities。
Predicates 和 Priorities
Predicates 和 Priorities 是 Kubernetes 调度算法中的两个重要组件,它们都是用于确定哪些节点可以绑定 Pod,并根据其特性和资源需求将 Pod 分派到合适的节点上。下面分别介绍。
Predicates
Predicates 是调度器算法的第一步,它用于从候选节点列表中过滤掉不符合条件的节点。通常情况下,Predicates 会根据诸如资源限制、亲和性、互斥等因素来确定哪些节点适合绑定 Pod。
Predicates 应该是轻量级和快速的,它们可能会在调度器算法的后续步骤中被多次调用。常见的 Predicates 如下:
- PodFitsResources:调度器会过滤掉资源不足的节点,例如内存或 CPU 小于需求量的节点;
- PodFitsHostPorts:调度器会过滤掉与 Pod 端口冲突的节点;
- PodMatchNodeSelector:调度器会过滤掉无法满足 Pod 标签选择器的节点;
- PodFitsHost:调度器会过滤掉不能满足 Pod 亲和性或互斥约束的节点。
Priorities
Priorities 是调度器算法的第二步,它用于从 Predicates 过滤后的候选节点列表中选择最优节点。根据优先级策略,调度器将从候选节点列表中选择某个节点将绑定 Pod。
Priorities 应该是相对较重的,因为它们通常仅在候选节点列表中选择前几个节点。常见的 Priorities 如下:
- SelectorSpreadPriority:调度器会尽可能将 Pod 分散到不同的节点上,以降低节点出现故障的概率;
- LeastRequestedPriority:调度器会选择可用资源最大的节点(也称为 best-fit);
- SelectorPreferencePriority:调度器将依据先前指定的标签选择器来选择节点。
调度器的工作流程
根据上述分析,我们可以开始分析调度器的工作流程了。一个简单的调度器工作流程如下:
图中省略的部分是:k8s_scheduler_config,其实是 kube-system namespace 内的 kube-scheduler ConfigMap。ConfigMap 的内容主要包含调度器的工作配置和算法。
从上图可以看出,调度器的工作流程包含以下几个步骤:
- Pod 创建:一个 Pod 对象被创建,并被提交到 Kubernetes 集群中的 API server 中。
- 调度器监听:调度器会监听到 Pod 创建事件,并检查 Pod 是否具有可以马上绑定到节点上的节点。
- Predicates 运行:调度器启动 Predicates (多个)POS(Parallel Optimal Scheduling)算法,以过滤掉无法满足 Pod 要求的节点。
- Priorities 运行:从 Predicates 过滤后的候选节点列表中选择最优节点,通过 Priorities 策略将 Pod 绑定到选定的节点上。
- 节点绑定:调度器将调度决策写入 API server 中的 PodBindings 对象,以便 Kubernetes 后续将 Pod 绑定到节点上。
- Pod 启动:Pod 会被 Kubernetes API server 内部的控制器管理器分配到节点上,并启动相应的容器。
示例代码
下面是一些使用 Kubernetes Python 客户端库的示例代码,该库提供了从 Python 访问 Kubernetes API server 的功能。
---- ---------- ------ ------- ------ ------ ---- ------------------------- - ------------- --- --- ---- --------------- -- -- ---- - ------------ - -- --- -- -- - ------------------ ---- - ----------------------------------- -------------------- ---------- -------- ------------ - -------------------
上述代码使用 YAML 文件定义 Pod,并将其提交到 Kubernetes API server。使用 Kubernetes Python 客户端库可以轻松地编写自定义调度器,并为 Kubernetes 添加一些自定义功能。
一些最佳实践
最后,我们还想分享一些最佳实践和设计约定,有助于将 Kubernetes 中的调度器优化到最佳状态。
资源请求和限制
当我们创建 Pod 时,我们应该明确地指定 Pod 的资源需求和限制。这将帮助调度器更好地使用可用资源,并将 Pod 分配到与其需求最匹配的节点上。
为了完成这项工作,我们可以使用 PodSpec 中的 resources 字段,例如:
----------- -- ----- --- --------- ----- ----- ----- ----------- - ----- ----- ------ ----- ---------- ------- ---- --- ------- ------- --------- ---- ------ ------- -------
上述 YAML 文件定义了一个名为 "nginx" 的 Pod,它要求 500m CPU 和 256Mi 内存,同时最多限制 1 CPU 和 512Mi 内存。
亲和性和互斥
Pod 在进行调度时,可以指定与某个或某个节点关联性(亲和性)或互斥性。这可以帮助我们使 Pod 与特定集群节点共生或排斥它们,并可以使用 Label 来指定关联规则。
例如:
----------- -- ----- --- --------- ------- ---- ----- ----- ----- ----- --------- ------------- ----------------------------------------------- ------------------ - ----------------- - ---- ---------------------- --------- -- ------- - ------- ----------- ------ ----- ----- ----- ------ - -------------- --
示例文件指定在计划 Pod 时,调度器只会寻找具有标签 kubernetes.io/hostname=my-node 的节点。这通常是将特定类型的工作负载绑定到特定节点的一种方法,以使集群更轻松地管理和平衡。
总结
Kubernetes 调度器是 Kubernetes 集群中一个重要的组成部分。它可以帮助我们将容器部署到合适的节点上,以便在集群中最大化利用资源。本文对 Kubernetes 中调度器的工作流程进行了详细的介绍,并且分享了一些最佳实践和设计约定。同时,我们还提供了一些使用 Kubernetes Python 客户端库的示例代码。
来源:JavaScript中文网 ,转载请联系管理员! 本文地址:https://www.javascriptcn.com/post/645d497c968c7c53b0fccb2c