文章预览
文 | 王启隆 出品丨AI 科技大本营(ID:rgznai100) 在当前火热的 AI 浪潮中,开源模型已经从几年前的“无人问津”变成了如今竞争不断。前有出道即霸榜 Hugging Face 的国产最强 Qwen2 ,后有英伟达老黄今天刚放出来的“开源巨兽” Nemotron-4 340B ,之前说好要发布 400B 模型的“前任最强” Llama 3 ,现在如何了呢? 在北京智源大会 6 月 14 日下午的“大语言模型”分论坛上,Meta 研究科学家,Llama2、3 作者 Thomas Scialom 带来了一场关于大语言模型(LLMs)的过去、 现在与未来的精彩演讲,以及随后的现场问答环节,涉及技术进展、应用前景及对行业未来的展望。 过去: OpenAI 和 DeepMind 螳螂捕蝉,Llama 黄雀在后。谁才能找到 Scaling Law 的秘密? 现在:随着 RLHF ( 基 于人类反馈的强化学习 )广泛使用, 模型居然能在某些任务上超越人类,甚至
………………………………