文章预览
对于排查问题的小伙伴来说,最苦恼的莫过于: 只有问题,没有分析数据 。这种场景,只能先分析存储的故障快照数据(snapshot data),可是,受限于快照数据的数据量,它并不能提供足够多的信息帮助我们精准定位问题。如果问题还是偶发的类型,可以想象,排查问题的工程师有多苦恼。如果问题可以复现,把需要的信号log出来,会极大地提升问题定位和解决速度。可是, 现实往往是:很难复现问题 。有时,问题的复现还需要一些运气。 所以,没有数据分析,bug问题就可以"摆烂"吗?当然不能,不去努力挣扎一番,给出一个态度,怎么可以?本文,基于一个工程问题,聊一聊我是如何排查此类问题的。 1、问题描述 整车测试中,发现某网关节点(Gateway,Lin Master)报对应子节点(Lin Slave #1、 Lin Slave #2 )的通信丢失。其中,Lin从节点的供电受到
………………………………