注册
登录
专栏名称:
云原生实验室
战略上藐视云原生,战术上重视云原生
我也要提交微信公众号
今天看啥
微信公众号rss订阅, 微信rss, 稳定的RSS源
微信公众号RSS订阅方法
B站投稿RSS订阅方法
微博RSS订阅方法
微博搜索关键词订阅方法
豆瓣日记 RSS订阅方法
目录
相关文章推荐
Python爱好者社区
·
两天私活,3w到手
·
昨天
Python爱好者社区
·
越来越多的人开始讨厌15薪。
·
4 天前
今天看啥
›
专栏
›
云原生实验室
一行超长日志引发的 “血案” - Containerd 频繁 OOM 背后的真相
云原生实验室
·
公众号
· · 2024-06-24 14:02
文章预览
案发现场:混沌初现 2024年6月10日,本应是平静的一天。但从上午 9 点开始,Sealos 公有云的运维监控告警就开始不停地响。北京可用区服务器节点突然出现大量 “not ready” 告警,紧接着,系统自动触发 004 节点重启,让服务暂时恢复了正常。 就在我以为这只是个小插曲的时候,7分钟后,广州可用区服务器也沦陷了!001 节点不得不重启以求自保。事情似乎并没有那么简单。 “发生什么事了?!” 运维同学们迅速登录服务器排查。 原本稳定运行在 30% 左右的内存使用率,在几分钟内飙升到 100%。 “看起来像是有新应用大量占用内存?” 问题排查:真相难明 “难道是底层机器的内存不足以支撑业务的增长?” 抱着姑且一试的态度,我们紧急升级了北京可用区服务器的配置,将内存容量直接翻倍。观察一段时间后,服务基本恢复稳定。“看来还是资源 ………………………………
原文地址:
访问原文地址
快照地址:
访问文章快照
总结与预览地址:
访问总结与预览
分享到微博
推荐文章
Python爱好者社区
·
两天私活,3w到手
昨天
Python爱好者社区
·
越来越多的人开始讨厌15薪。
4 天前
新浪科技
·
小红书再迎「离职潮」,618商业化不佳惹怒高管?|BUG
4 月前
王路在隐身
·
我写书的教训和转变
4 月前
ETF智选
·
风险都是跌出来的。。。
3 月前
凤凰网读书
·
如果可以,我想与树进行一场隐秘而盛大的交流
2 月前
中国畜牧业协会家禽业
·
2024年第42-43周猪、禽及相关产品价格
4 周前