文章预览
# 一分钟精华速览 # 为了应对业务快速增长带来的数据量激增,B站升级了监控2.0架构,旨在解决原有架构稳定性差、用户查询体验差和云上数据质量差的问题。新架构在数据来源、采集、存储和查询等方面进行了优化,实现了显著的成效。具体而言,新架构支持170w+采集对象,实现了1分钟内发现异常,指标告警异常降低了90%以上,此外,新架构的写入吞吐达到44M/s,查询吞吐为48k/s,P90查询耗时降低了10倍以上,降至ms级,显著提升了用户体验和运维效率。详细的解决策略和方法,请参阅文章正文。 作者介绍 哔哩哔哩资深研发工程师——鲍森乐 TakinTalks稳定性社区专家团成员。bilibili资深研发工程师。2021年加入B站,一直负责监控系统架构演进,指标平台迭代,VM集群稳定性,push链路等相关工作。完成监控2.0架构全面落地,新一代云 & 边缘监控架
………………………………