kubelet状态更新机制

zx_8b49 · · 1580 次点击 · · 开始浏览

这是一个创建于的文章，其中的信息可能已经有所发展或是发生改变。

1.kubelet定期上报

--node-status-update-frequency 指定上报频率，默认10s

2.kube-controller-manager 定期检查

--node-monitor-period 定期检查kubelet状态，默认5s

3.node失联状态变更

ready-->notready
--node-monitor-grace-period 失联指定时间后，将readey变成为notready，默认40s
notready-->unhealthy
-node-startup-grace-period 失联指定时间后，判定为unhealthy状态，默认1m

4.删除node上pod

--pod-eviction-timeout 失联指定时间后，删除原node上的pod

5.kubelet状态失败重试

kubelet 在更新状态失败时、会进行nodeStatusUpdateRetry 次使用tryUpdateNodeStatus函数重试；
但kubelet使用了Golang中的http.Client()方法、但没有指定超时时间，即可能出现故障。
因此，实际上在nodeStatusUpdateRetry * --node-status-update-frequency时间后才会更新一次节点状态；

6.controller manager 对kubelet的检查和重试

同时，Kubernetes 的 controller manager 将尝试每--node-monitor-period时间周期内检查nodeStatusUpdateRetry次。在--node-monitor-grace-period之后，会认为节点 unhealthy，然后会在--pod-eviction-timeout后删除 Pod。
kube proxy 有一个 watcher API，一旦 Pod 被驱逐了，kube proxy 将会通知更新节点的 iptables 规则，将 Pod 从 Service 的 Endpoints 中移除，这样就不会访问到来自故障节点的 Pod 了。

7.参数配置

社区默认的配置

–node-status-update-frequency 10s
–node-monitor-period 5s
–node-monitor-grace-period 40s
–pod-eviction-timeout 5m

快速更新和快速响应

–node-status-update-frequency 4s
–node-monitor-period 2s
–node-monitor-grace-period 20s
–pod-eviction-timeout 30s
在这种情况下，Pod 将在 50s 被驱逐，因为该节点在 20s 后被视为Down掉了，--pod-eviction-timeout在 30s 之后发生，但是，这种情况会给 etcd 产生很大的开销，因为每个节点都会尝试每 2s 更新一次状态。

中等更新和平均响应

–node-status-update-frequency 20s
–node-monitor-period 5s
–node-monitor-grace-period 2m
–pod-eviction-timeout 1m
这种场景下会 20s 更新一次 node 状态，controller manager 认为 node 状态不正常之前，会有 2m60⁄205=30 次的 node 状态更新，Node 状态为 down 之后 1m，就会触发驱逐操作。

低更新和慢响应

–node-status-update-frequency 1m
–node-monitor-period 5s
–node-monitor-grace-period 5m
–pod-eviction-timeout 1m
Kubelet 将会 1m 更新一次节点的状态，在认为不健康之后会有 5m/1m*5=25 次重试更新的机会。Node为不健康的时候，1m 之后 pod开始被驱逐。

8.kubelet进程异常时Pod状态

8.1 Node状态变更为NotReady

8.2 pod 5分钟（–pod-eviction-timeout ）之内状态无变化，5分钟（–pod-eviction-timeout ）后

• Daemonset的Pod状态变为Nodelost
• Deployment、Statefulset和Static Pod的状态先变为NodeLost，然后马上变为Unknown
• Deployment的pod会recreate，但受到node selcector等的限制
• Static Pod和Statefulset的Pod会一直处于Unknown状态

有疑问加站长微信联系（非本文作者）

本文来自：简书

感谢作者：zx_8b49

查看原文：kubelet状态更新机制

入群交流（和以上内容无关）：加入Go大咖交流群，或添加微信：liuxiaoyan-s 备注：入群；或加QQ群：692541889

1580 次点击

加入收藏微博

收入我的专栏

上一篇：golang基础语法学习（二）

下一篇：Go 语言学习之基础数据类型

重试

定期检查

kubernetes

移除

0 回复

添加一条新回复（您需要登录后才能回复没有账号？）

请尽量让自己的回复能够对别人有帮助
支持 Markdown 格式, **粗体**、~~删除线~~、`单行代码`
支持 @ 本站用户；支持表情（输入 : 提示），见 Emoji cheat sheet
图片支持拖拽、截图粘贴等方式上传

kubelet状态更新机制

1.kubelet定期上报

2.kube-controller-manager 定期检查

3.node失联状态变更

4.删除node上pod

5.kubelet状态失败重试

6.controller manager 对kubelet的检查和重试

7.参数配置

社区默认的配置

快速更新和快速响应

中等更新和平均响应

低更新和慢响应

8.kubelet进程异常时Pod状态

8.1 Node状态变更为NotReady

8.2 pod 5分钟（–pod-eviction-timeout ）之内状态无变化，5分钟（–pod-eviction-timeout ）后

用户登录

今日阅读排行

一周阅读排行

关注我

1.kubelet定期上报

2.kube-controller-manager 定期检查

3.node失联状态变更

4.删除node上pod

5.kubelet状态失败重试

6.controller manager 对kubelet的检查和重试

7.参数配置

社区默认的配置

快速更新和快速响应

中等更新和平均响应

低更新和慢响应

8.kubelet进程异常时Pod状态

8.1 Node状态变更为NotReady

8.2 pod 5分钟（–pod-eviction-timeout ）之内状态无变化，5分钟（–pod-eviction-timeout ）后

kubelet状态更新机制

1.kubelet定期上报

2.kube-controller-manager 定期检查

3.node失联状态变更

4.删除node上pod

5.kubelet状态失败重试

6.controller manager 对kubelet的检查和重试

7.参数配置

社区默认的配置

快速更新和快速响应

中等更新和平均响应

低更新和慢响应

8.kubelet进程异常时Pod状态

8.1 Node状态变更为NotReady

8.2 pod 5分钟（–pod-eviction-timeout ）之内状态无变化，5分钟（–pod-eviction-timeout ）后

用户登录

今日阅读排行

一周阅读排行

关注我

给该专栏投稿 写篇新文章

收入到我管理的专栏 新建专栏

1.kubelet定期上报

2.kube-controller-manager 定期检查

3.node失联状态变更

4.删除node上pod

5.kubelet状态失败重试

6.controller manager 对kubelet的检查和重试

7.参数配置

社区默认的配置

快速更新和快速响应

中等更新和平均响应

低更新和慢响应

8.kubelet进程异常时Pod状态

8.1 Node状态变更为NotReady

8.2 pod 5分钟（–pod-eviction-timeout ）之内状态无变化，5分钟（–pod-eviction-timeout ）后

给该专栏投稿写篇新文章

收入到我管理的专栏新建专栏