今天看啥  ›  专栏  ›  InfoQ

一线实践揭秘:腾讯、蚂蚁、携程、B站的可靠性工程与 AIOps 之旅 | QCon

InfoQ  · 公众号  · 科技媒体  · 2024-09-10 14:37
    

文章预览

在技术迅猛发展的今天,软件系统的稳定性和可靠性已成为互联网公司的生命线。近年来,多家知名互联网公司遭遇的软件系统故障,不仅影响了用户体验,也暴露了在可靠性工程和业务连续性规划方面的不足。这些事件促使服务提供商、用户及整个行业开始深刻反思,并加强在这些领域的投入和改进。 软件系统的稳定性问题不仅给用户带来不便,还可能导致企业声誉和经济损失。随着对服务质量要求的提高,线上可靠性工程逐渐成为互联网公司的核心竞争力之一。 线上可靠性工程是代码发布到生产环境之后的技术运营过程,是代码产生使用价值的环节,很多公司的 SRE 工程师会围绕这个环节展开各类工作,例如 SLI/SLO 管理、故障应急、用户体验优化、618 之类的重大节点技术保障、容量管理及成本优化、混沌工程、综合算力调度、业务全生命周 ………………………………

原文地址:访问原文地址
快照地址: 访问文章快照
总结与预览地址:访问总结与预览