文章预览
本文来源:智车科技 自去年以来,业界不断讨论和提及“BEV+Transformer”这一概念,即鸟瞰视图与基于自注意力机制的神经网络架构。卷了半年时间,今年,“端到端”这一概念又迅速成为人们热议的焦点。 这两个概念看似截然不同,实则在视觉路线建立的基于Transformer 的架构上有着共通之处,也共同印证了人工智能技术从深度学习向多模态大模型演进的趋势。 汽车领域始终处于自动驾驶技术革新的前沿。 BEV+Transformer: 鸟瞰视角下的感知革命 BEV+Transformer技术如同为自动驾驶汽车安装了一双“慧眼”,能够清晰地“看到”周围的环境和障碍物,并做出更加准确的判断。 如果说端到端大模型是自动驾驶领域新晋的“顶流”,那么 BEV+Transformer 可以算得上是它的“前辈”。两者都是在视觉路线建立了基于Transformer 的架构。ChatGPT,其中的“T”即代表了
………………………………