文章预览
本文介绍了字节跳动云原生可观测团队在构建 OneAgent 方面的探索,涉及数据模型、流程管道、编排调度和构建体系等方面,还分享了 OneAgent 在字节跳动内部的几个应用案例,展示了其在数据采集效率、资源消耗和系统稳定性方面的优势。 一、为什么需要 OneAgent? 字节跳动拥有海量的主机和微服务实例,涵盖物理机、虚拟机、容器等多种场景,每秒产生的千亿级别的可观测性数据,在可观测性数据采集和管道化处理等方面给技术团队带来了巨大挑战: 字节跳动内部存在多套可观测系统和多个数据采集组件,一台机器上往往需要部署多个遥测采集 Agent,造成了资源的浪费。这些采集组件来自不同的团队,有些已经年久失修无人维护,运维和排障非常困难; 内外一体逐渐成为集团业务开发的一个重点,很多业务使用开源 SDK,也想统一接入公司的可观
………………………………