今天看啥  ›  专栏  ›  哔哩哔哩技术

亿级流量下的故障事前预防:B站如何从0-1构建变更防控体系?

哔哩哔哩技术  · 公众号  ·  · 2024-08-09 12:00

文章预览

一分钟精华速览 大约70%的故障都是由变更引起的,B站也深受其害。在经历了多起由变更引发的事故后,B站设计并实施了变更防控平台,从技术支撑能力、技术落地、跨领域赋能、组织文化建设等多方面入手,以期变被动应对为主动防御。目前,该平台已接入60+平台、400+场景,每天执行超过1000次变更检测,日拦截100+次潜在故障。自平台上线后,B站变更类事故占比得到有效下降,实现业务稳定性和效率的双重提升。详细的解决策略和方法,请参阅文章正文。 背景 在当下,变更防控为何备受关注?外部因素显而易见:行业故障数量持续上升,其背后原因错综复杂。在过去几年中,行业普遍追求成本效益和效率提升,却也带来了一些长期问题。随着稳定性运营能力的增强,我们开始发现并解决之前未曾察觉的问题。云原生和微服务技术的广泛应用 ………………………………

原文地址:访问原文地址
快照地址: 访问文章快照
总结与预览地址:访问总结与预览