专栏名称: 云技术实践
关注云计算,云技术,云运维,云存储,存储,分布式,OpenStack,SDN,Ceph,虚拟化,运维,分享在云计算/虚拟化/运维项目实施中的资讯、经验、技术,坚持干货。
目录
相关文章推荐
今天看啥  ›  专栏  ›  云技术实践

Google SRE最佳实践之On-Call

云技术实践  · 公众号  · 架构  · 2018-08-11 19:55

文章预览

本系列文章将详细介绍如何从0到1快速构建SRE团队具体实战内容,敬请关注。 上期文章 《 一文读懂 DevOps与SRE 的来龙去脉 》 "On-call"言下之意就是"随叫随到,待命"。on-call意味着在一定时间内随叫随到,并做好生产环境出现紧急情况的应对准备。SRE工程师经常被要求要轮值on-call,在on-call期间,SRE会根据需要对紧急情况进行诊断、环境、修复或升级事件;此外,SRE还要定期负责非紧急性生产任务 在Google,On-call是SRE的特点之一。SRE团队可以缓解事故、修复生产问题并自动执行运维任务。由于我们的大多数SRE团队尚未完全自动化所有运维任务,因此升级扔需要人工联系On-call工程师进行处理。根据所支持系统的重要程度或系统所处的开发状态,并非所有SRE团队都可能需要被on- ………………………………

原文地址:访问原文地址
快照地址: 访问文章快照
总结与预览地址:访问总结与预览