文章预览
第133篇 Job 失败了怎么办? 上一节 讨论了 Job 执行成功的情况 ,如果失败了会怎么样呢? 修改 myjob.yml,故意引入一个错误: 先删除之前的 Job: 如果将 restartPolicy 设置为 OnFailure 会怎么样?下面我们实践一下,修改 myjob.yml 后重新启动。 运行新的 Job 并查看状态: 当前 SUCCESSFUL 的 Pod 数量为 0 ,查看 Pod 的状态: 可以看到有多个 Pod,状态均不正常。 kubectl describe pod 查看某个 Pod 的启动日志: 日志显示没有可执行程序,符合我们的预期。 下面解释一个现象:为什么 kubectl get pod 会看到这么多个失败的 Pod? 原因是:当第一个 Pod 启动时,容器失败退出,根据 restartPolicy: Never ,此失败容器不会被重启,但 Job DESIRED 的 Pod 是 1 ,目前 SUCCESSFUL
………………………………