文章预览
1 为什么要使用Prometheus 1.1 背景 1.2 当前系统存在的问题 2 Prometheus简介 2.1 核心组成部分 2.2 四种上报类型 3 Prometheus如何保障业务系统的稳定运行 3.1 监控核心业务数据保证系统稳定性 3.2 提高故障响应和处理效率,保证系统稳定性 3.3 不同监控指标,监控力度不同 3.4 监控远程调用QPS和耗时保证系统稳定性 3.5 监控其它基础依赖指标保证系统的稳定性 4 总结 1 为什么要使用Prometheus 1.1 背景 回收系统本质做的是服务平台。对外交互多,例如与渠道商、回收商的接口交互。因此与回收商接口的交互情况需要记录。 回收系统的内部是通过大量MQ异步驱动运行的,复杂性很高。某一个MQ执行异常很容易引起流程中断。因此记录MQ的消费情况也很重要。 1.2 当前系统存在的问题 主动发现问题的能力不足。历史接入了一些企微通知,但数量不足,场景少,覆盖面窄
………………………………