今天看啥  ›  专栏  ›  机器之心

「LLM」这个名字不好,Karpathy认为不准确、马斯克怒批太愚蠢

机器之心  · 公众号  · AI  · 2024-09-15 13:06

文章预览

机器之心报道 编辑:陈陈 LLM 应该改名吗? 你怎么看。 在 AI 领域,几乎每个人都在谈论大型语言模型,其英文全称为 Large Language Models,简写为 LLM。 因为 LLM 中有「Language」一词,因此,大家默认这种技术和语言密切相关。 然而,知名 AI 大牛 Andrej Karpathy 却对此有着独特的见解: 「大型语言模型(LLM)名字虽然带有语言二字,但它们其实与语言关系不大,这只是历史问题,更确切的名字应该是自回归 Transformer 或者其他。 LLM 更多是一种统计建模的通用技术,它们主要通过自回归 Transformer 来模拟 token 流,而这些 token 可以代表文本、图片、音频、动作选择、甚至是分子等任何东西。因此,只要能将问题转化为模拟一系列离散 token 的流程,理论上都可以应用 LLM 来解决。  实际上,随着大型语言模型技术栈的日益成熟,我们可能会看到越来越多的问 ………………………………

原文地址:访问原文地址
快照地址: 访问文章快照
总结与预览地址:访问总结与预览