今天看啥  ›  专栏  ›  字节跳动技术团队

运维效率大幅提升,字节跳动在OpenBMC可观测上的创新实践

字节跳动技术团队  · 公众号  · 科技自媒体  · 2024-09-10 16:10

主要观点总结

字节跳动在OCP开放计算中国峰会上获得开放计算最佳实践奖,代表其在推动开放计算发展方面的行业认可。此外,字节跳动的固件架构师分享了公司在BMC可观测技术方面的创新,特别是在开源OpenBMC方案基础上的技术进步。文章还详细阐述了字节跳动如何应对百万级别服务器管理运维的挑战,并介绍了与浪潮信息合作优化的成果。

关键观点总结

关键观点1: 字节跳动获得OCP开放计算最佳实践奖,代表其在推动开放计算领域的深厚实力。

字节跳动在数据中心基础设施领域具有强大的实力,其在推动开放计算发展方面得到了行业的认可。

关键观点2: 字节跳动固件架构师分享在BMC可观测技术方面的创新。

字节跳动在开源OpenBMC方案基础上,结合Perfetto和Kernel trace两种技术手段增强可观测性,以应对大规模服务器管理运维的挑战。

关键观点3: 传统BMC的缺陷和OpenBMC的优势。

传统BMC存在灵活性受限、交付周期长等缺点,难以满足业务交付需求。而OpenBMC具备架构灵活、兼容性强、安全稳定等特性,适合当下互联网与数字化的应用需求。

关键观点4: 字节跳动采用软硬件结合的方式提升故障排查效率。

通过引入Perfetto和Kernel trace,字节跳动实现了故障的可观测性,大幅缩减了运维时间和难度。问题定位分析时间由数小时乃至数天降低至平均1小时以下,问题一次定位分析准确率提升至80%以上。

关键观点5: 字节跳动的未来规划和行业影响。

字节跳动将持续推进OpenBMC的应用,并加强与浪潮信息等社区成员的合作与交流,共同推动整个行业的技术创新和应用。


文章预览

在日前举办的 2024 开放计算中国峰会上,字节跳动获得了 OCP 组织颁发的开放计算最佳实践奖,这代表了 OCP 乃至整个行业对于字节跳动在推动开放计算发展层面的认可,也侧面说明了字节跳动在数据中心基础设施领域的深厚实力。 提起字节跳动,许多人可能会直接联想到“抖音”或者“豆包”,如今这些应用已经深入我们的生活与工作,变得多彩和高效。但其实除了这两款应用之外,字节跳动也在不断推动更多好的、酷炫的创意应用落地,不断优化网友们的应用体验。这些应用之所以能够稳定、安全地运行,其中基础设施提供了坚实的技术支撑。 随着应用覆盖范围的进一步扩大、用户群体的持续增多,字节跳动需要维护的基础设施服务器数量已达百万级别,并且仍有不断增长的态势。在此情形下,怎样高效、稳定且安全地管理服务器,成为了系 ………………………………

原文地址:访问原文地址
快照地址: 访问文章快照
总结与预览地址:访问总结与预览