文章预览
↑ 点击 蓝字 关注极市平台 作者丨CVer 来源丨CVer粉丝投稿 编辑丨极市平台 极市导读 由清华大学和腾讯提出了一个新型多功能多模态框架GrootVL,通过动态生成树形拓扑结构来优化状态空间模型的特征传播,显著提升了视觉和文本任务的性能。 >> 加入极市CV技术交流群,走在计算机视觉的最前沿 GrootVL: Tree Topology is All You Need in State Space Model 论文: https://arxiv.org/pdf/2406.02395 代码(已开源): https://github.com/EasonXiao-888/GrootVL 【Highlight】: 使用递归范式传播特征的状态空间模型展示了与 Transformer 模型相当的强大表征能力和卓越的推理效率。然而,受序列固有几何约束的限制,它在建模远程依赖方面稍显不足。为了解决这个问题,我们提出了 GrootVL 网络,它首先基于空间关系和输入特征动态生成树形拓扑结构。然后,基于该无环图执行特征传播,
………………………………