高能力全透明双语大语言模型MAP-Neo完全开源，开放所有细节！

魔搭ModelScope社区 · 公众号 · · 2024-05-30 21:01

文章预览

01 引言近年来，大型语言模型 (LLMs) 在各种任务中取得了前所未有的性能提升。然而，由于商业利益，最强大的模型（如 GPT、Gemini 和Claude）只能通过API访问，并未公开训练细节。最近，许多机构开源了一些与现有闭源 LLM 相媲美的LLM，例如LLaMA-3，大大推动了开源 LLM 社区的发展。然而，大多数情况下的开源仅提供模型权重，而详细的中间Checkpoint、预训练语料库和训练代码等信息并未披露。为了提高 LLM 的透明度，研究界已经形成了开源真正开放的 LLM（例如Pythia、Amber 和OLMo）的趋势，这些模型提供了更多的详细信息（例如预训练语料库和训练代码）。这些模型大大推进了对这些大模型的科学研究，包括它们的优势、劣势、偏见和风险。然而，M-A-P社区观察到现有的真正开放的 LLM 在推理、知识和编码任务上仍然不如具有类似模型大小的最先进的 L ………………………………

原文地址：访问原文地址
快照地址：访问文章快照
总结与预览地址：访问总结与预览

分享到微博

推荐文章

吃什么情报局 · 这口甜瓜我等了整整一年！！头茬现摘现发，籽少肉厚，连皮都是甜的，解渴又清爽~

15 小时前

下厨房 · 喉咙不舒服？这碗下肚立马救活了！润燥止咳贼清甜，比雪梨管用！

23 小时前

每天学点做饭技巧 · 刷马桶不脏手，用一次马桶刷防污一周，这个马桶刷太好用了8

2 天前

吃什么情报局 · 懒人早餐天花板！一个鸡蛋、一块火腿，5分钟奶香扑鼻，好吃到转圈！

2 天前

润农畜牧报价 · 2025年2月10日山东到车辆276车，锦州港集港量上量增加，合同粮为主！

2 天前

产品刘 · 互联网大厂都在用的用户分析方法

4 月前

工信微报 · 前三季度我国电信业务收入、总量同比分别增长2.6%和10.7%

3 月前

火蝠电商资讯 · 火蝠案例 | 抖店爆单秘籍：家居店铺商品卡从0-1引爆流量，GMV激增870%！

3 月前