专栏名称: 夕小瑶科技说

这里有自然语言处理、机器学习、算法的入门指导、科普与深度干货，有小夕的回忆与日常，还有最重要的：萌！气！

我也要提交微信公众号

今天看啥

微信公众号rss订阅, 微信rss, 稳定的RSS源

微信公众号RSS订阅方法

B站投稿RSS订阅方法

雪球动态RSS订阅方法

微博RSS订阅方法

微博搜索关键词订阅方法

豆瓣日记 RSS订阅方法

相关文章推荐

北京大学百周年纪念讲堂 · 3.9【李莹厅】基因三重奏合作二十年｜贝多芬 ... · 21 小时前

小强热线浙江教科 · 知名歌手突然病逝，年仅39岁！警惕：这个病越 ... · 昨天

大皖新闻 · 知名歌手自曝患抑郁症 · 昨天

金华晚报 · 再次道歉！全额退款 · 2 天前

温州都市报 · 董宇辉个人单曲上线，网友：期待出演偶像剧 · 2 天前

今天看啥 › 专栏 › 夕小瑶科技说

大模型“脑回路”统一了？LLMs竟然能正确回答其他模型虚构的题目

夕小瑶科技说 · 公众号 · · 2024-08-04 15:08

文章预览

夕小瑶科技说原创作者 | 谢年年最近开源模型Llama3.1上线，其405B模型竟超越闭源GPT-4o，一夜之间成最强大模型！然而榜首的位置还没坐热，仅隔一天，Mistral AI团队发布Mistral Large 2 ，最强开源再易主！大模型之间的竞争异常激烈,榜单的分数也是越刷越高，你解决不了的问题，对我来说so easy！比如问倒一众模型的问题：3.9和3.11哪个大？Mistral Large 2模型居然答对了！ LLMs之间的规模和能力或许各不相同，但在chatgpt之后的LLMs，无论在架构、训练方式、数据方面都高度统一：比如都使用仅解码器的 transformer的结构，以及都有位置嵌入设计，预训练语料库由书籍、互联网文本和代码组成，使用基于随机梯度下降（SGD）进行优化，以及在预训练后进行指令调优和对齐的类似程序等等。 Salesforce AI团队最近就发现：不同的大模型家族之间，无论是闭 ………………………………

原文地址：访问原文地址
快照地址：访问文章快照
总结与预览地址：访问总结与预览

分享到微博

推荐文章

北京大学百周年纪念讲堂 · 3.9【李莹厅】基因三重奏合作二十年｜贝多芬钢琴三重奏系列音乐会1继往开来的先声

21 小时前

小强热线浙江教科 · 知名歌手突然病逝，年仅39岁！警惕：这个病越来越年轻化

昨天

小强热线浙江教科 · 知名歌手突然病逝，年仅39岁！警惕：这个病越来越年轻化

昨天

大皖新闻 · 知名歌手自曝患抑郁症

昨天

金华晚报 · 再次道歉！全额退款

2 天前

温州都市报 · 董宇辉个人单曲上线，网友：期待出演偶像剧

2 天前

温州都市报 · 董宇辉个人单曲上线，网友：期待出演偶像剧

2 天前

上海发布 · 【滋味】蹄筋与年糕的相遇，是慢火细炖的软糯醇厚！

5 月前