为什么我还是无法理解transformer？

深度学习与NLP · 知乎回答 · AI · 2024-07-15 12:14

文章预览

来源 | 新智元 ID | AI-era 「因果推理」绝对是当前GenAI热潮下的小众领域，但是它有一个大佬级的坚定支持者——Yann LeCun。他在推特上的日常操作之一，就是炮轰Sora等生成模型，并为自己坚信的因果推理领域摇旗呐喊。甚至，早在2019年VentureBeat的采访中，他就表达过这一观点：我们需要在深度学习模型中引入事件的因果关系，才能增强泛化能力，减少训练数据使用。对于当前最流行的模型架构Transformer，我们能教它因果推理吗？最近，来自微软MIT等机构的研究人员提出了一种训练大模型新范式——公理框架（Axiomatic Framework）。论文中，作者从头开始训练了6700万参数的模型，仅使用了简单的因果链作为训练数据。令人惊讶的是，在推断复杂图表中的因果关系时，67M模型的表现超越了十亿级参数LLM，甚至可以与GPT-4相媲美。论文地址： https:// arxiv ………………………………

原文地址：访问原文地址
快照地址：访问文章快照
总结与预览地址：访问总结与预览

分享到微博

推荐文章

机器之心 · 2025英伟达奖学金出炉，7位华人博士生入选，上交、中科大、浙大校友在列

昨天

宝玉xp · Gemini 也有推理模型了，在 ai studio 可以试用。-20241220011017

昨天

宝玉xp · 转发微博-20241219152048

2 天前

Datawhale · 提供实习证明！第二期AI冬令营助教招募ing！

3 天前

Datawhale · 提供实习证明！第二期AI冬令营助教招募ing！

3 天前

宝玉xp · 真的很好玩-20241218010049

3 天前

东方国际集团 · 高质量发展 | 东方国际集团荣恒公司顺利完成企业碳盘查并获权威认证

4 月前

光华CDC · 第二届全国大学生职业规划大赛·北京大学校赛报名启动！

1 月前