文章预览
【导读】 本文对kubernetes日常巡检工作进行了整理,提供排查方法和排查思路、典型案例,帮助大家学会尽快发现问题,排查问题,解决问题。 【作者】 曹如熙, 高级运维leader,具有超过十年的互联网运维及五年以上团队管理经验,多年容器云的运维,尤其在docker和kubernetes领域非常精通。 Kubernetes集群主要通过kubectl命令行进行运维,OpenShift中使用oc命令行进行运维。两个命令行的参是相同的(OpenShift集群也提供kubectl命令行,但建议使用oc命令行)。 1 检查master 主要通过以下命令检查。 1.1 kubectl/oc 检查master状态 kubectl/oc get cs 通过以上方法,查看kube-scheduler, kube-controller-manager, etcd是否正常。在上图status列,Healthy表示健康,unhealthy表示有问题需要更详细的信息,可以使用kubectl/oc describe cs,输出更详细的信息。 systemctl status calico.service 检查calico网
………………………………