文章预览
本系列文章将详细介绍如何从0到1快速构建SRE团队具体实战内容,敬请关注。 上期文章 《 一文读懂 DevOps与SRE 的来龙去脉 》 "On-call"言下之意就是"随叫随到,待命"。on-call意味着在一定时间内随叫随到,并做好生产环境出现紧急情况的应对准备。SRE工程师经常被要求要轮值on-call,在on-call期间,SRE会根据需要对紧急情况进行诊断、环境、修复或升级事件;此外,SRE还要定期负责非紧急性生产任务 在Google,On-call是SRE的特点之一。SRE团队可以缓解事故、修复生产问题并自动执行运维任务。由于我们的大多数SRE团队尚未完全自动化所有运维任务,因此升级扔需要人工联系On-call工程师进行处理。根据所支持系统的重要程度或系统所处的开发状态,并非所有SRE团队都可能需要被on-
………………………………