专栏名称: Java知音
专注于Java,推送技术文章,热门开源项目等。致力打造一个有实用,有情怀的Java技术公众号!
今天看啥  ›  专栏  ›  Java知音

"服务不可用"怎么排查?讲了100遍还是记不住?

Java知音  · 公众号  ·  · 2020-12-02 20:20

文章预览

作者:kingszelda cnblogs.com/kingszelda/p/9034191.html 一、发现问题 下面是线上机器的cpu使用率,可以看到从4月8日开始,随着时间cpu使用率在逐步增高,最终使用率达到100%导致线上服务不可用,后面重启了机器后恢复。 二、排查思路 简单分析下可能出问题的地方,分为5个方向: 1.系统本身代码问题 2.内部下游系统的问题导致的雪崩效应 3.上游系统调用量突增 4.http请求第三方的问题 5.机器本身的问题 三、开始排查 1.查看日志,没有发现集中的错误日志, 初步排除代码逻辑处理错误。 2.首先联系了内部下游系统观察了他们的监控,发现一起正常。 可以排除下游系统故障对我们的影响。 3.查看provider接口的调用量,对比7天没有突增, 排除业务方调用量的问题。 4.查看tcp监 ………………………………

原文地址:访问原文地址
快照地址: 访问文章快照
总结与预览地址:访问总结与预览