专栏名称: 金融与数字经济法律研究

我们专注于金融和数字经济领域的法律理论与实务研究，聚焦证券银行、资产管理、场外衍生品以及面向数字经济的数字金融、数据合规问题；秉承以专业研究引领带动法律服务、非诉与争议解决相结合的法律服务理念，参与到中国法治社会建设的历史进程中！

我也要提交微信公众号

今天看啥

微信公众号rss订阅, 微信rss, 稳定的RSS源

微信公众号RSS订阅方法

B站投稿RSS订阅方法

雪球动态RSS订阅方法

微博RSS订阅方法

微博搜索关键词订阅方法

豆瓣日记 RSS订阅方法

大模型的开源与闭源，敢问路在何方 | 同言

金融与数字经济法律研究 · 公众号 · · 2024-06-17 10:06

文章预览

全文长约 4500 字，阅读大约需要 15 分钟 01 Llama 3：闭源模型的有力竞争者 4月18日，Meta 推出了 Llama 3 1 系列开源大模型，发布了参数量 2 为 80亿（8B）和 700亿（70B）的两个版本，并将4,000亿参数以上的版本提上了日程。相比上一个版本 Llama 2，Llama 3 扩展了模型“词典”，引入了分组查询注意力技术，并扩大了模型训练数据量，从而显著提升了模型编码语言和处理长文本、进行逻辑推理的能力。从模型能力上看，仅仅 700 亿参数版本的 Llama 3 在各项指标上就已经能和目前最领先的闭源模型 Google Gemini 1.5 Pro 3 、Claude 3 4 相抗衡，即使对敌 GPT-4 5 ，在各项基准指标上比较也已经非常接近。况且，用于测试的 Llama 3 还未进行微调，后续仍有很大的提升空间。图 1：截至 2024 年 5 月 19 日，LLM Arena Leaderboard 6 （浅红色底色为开源模型） 02 开源： ………………………………

原文地址：访问原文地址
快照地址：访问文章快照
总结与预览地址：访问总结与预览

分享到微博

推荐文章

钱江晚报 · 太意外！他突然退役！“挣扎了近一年”

昨天

杭州交通918 · 承认抄袭了！紧急下架、致歉！

昨天

杭州交通918 · 确认了！王子突然去世

昨天

FM93交通之声 · 韩军公布战机误炸事故初步调查结果

2 天前

钱江晚报 · 多地已实现！这笔钱直接发给个人

2 天前

财政部 · 财政部发行2024年记账式贴现（五十四期）国债（28天）

5 月前

深度学习与NLP · 下载量10w+！LLM新书《大型语言模型：语言理解和生成》pdf免费分享

4 月前

果壳 · 热搜频频暴雷的卫生巾，你竟然还敢用？

3 月前