文章预览
转自: https://my.oschina.net/leejun2005/blog/1602482 工作中当你服务器CPU达到100%时,该如何排查异常故障呢?文章结尾分享一个shell脚本,可助你排查Linux 系统 CPU 100% 异常问题。 昨天下午突然收到运维邮件报警,显示数据平台服务器cpu利用率达到了98.94%,而且最近一段时间一直持续在70%以上,看起来像是硬件资源到瓶颈需要扩容了,但仔细思考就会发现咱们的业务系统并不是一个高并发或者CPU密集型的应用,这个利用率有点太夸张,硬件瓶颈应该不会这么快就到了,一定是哪里的业务代码逻辑有问题。 2、排查思路 2.1 定位高负载进程 pid 首先登录到服务器使用top命令确认服务器的具体情况,根据具体情况再进行分析判断。 通过观察load average,以及负载评判标准(8核),可以确认服务器存在负载较高的情况; 观察各个进程资源使用情况,可以看出进程id
………………………………