注册登录

专栏名称: 魔搭ModelScope社区

阿里巴巴达摩院模型开源社区ModelScope官方账号

我也要提交微信公众号

今天看啥

公众号rss, 微信rss, 微信公众号rss订阅, 稳定的RSS源

微信公众号RSS订阅方法

B站投稿RSS订阅方法

雪球动态RSS订阅方法

微博RSS订阅方法

微博搜索关键词RSS订阅方法

知网期刊RSS订阅方法

目录

相关文章推荐

深圳应急管理 · 快来投递您的作品吧！短视频创作大赛火热征集中→ · 20 小时前

新腕儿 · 4月第3周免费短剧热度榜：《心动还请告诉我》第一 · 22 小时前

新腕儿 · 4月第3周免费短剧热度榜：《心动还请告诉我》第一 · 22 小时前

今天看啥 › 专栏 › 魔搭ModelScope社区

Llama 3.3开源！70B媲美405B性能，支持128K上下文

魔搭ModelScope社区 · 公众号 · · 2024-12-10 21:35

文章预览

01 引言近期，Meta开源了Llama 3.3 多语言大型语言模型（LLM），Llama 3.3 是一个预训练并经过指令调优的生成模型，参数量为70B（文本输入/文本输出）。Llama 3.3 指令调优的纯文本模型针对多语言对话用例进行了优化，并在常见的行业基准测试中优于许多可用的开源和闭源聊天模型。 Llama 3.3 是一个使用优化后的Transformer架构的自回归语言模型。调优版本使用监督微调（SFT）和基于人类反馈的强化学习（RLHF）来与人类对有用性和安全性的偏好保持一致。训练数据：新的公开在线数据混合集参数量：70B 输入模态：多语言文本输出模态：多语言文本和代码上下文长度：128K GQA：是训练tokens：15T+（仅指预训练数据）知识截止日期：2023年12月支持的语言: 英语、德语、法语、意大利语、葡萄牙语、印地语、西班牙语和泰语 *注：Llama 3.3 的训练数据集包含 ………………………………

原文地址：访问原文地址
快照地址：访问文章快照
总结与预览地址：访问总结与预览

分享到微博

推荐文章

深圳应急管理 · 快来投递您的作品吧！短视频创作大赛火热征集中→

20 小时前

新腕儿 · 4月第3周免费短剧热度榜：《心动还请告诉我》第一

22 小时前

新腕儿 · 4月第3周免费短剧热度榜：《心动还请告诉我》第一

22 小时前

连云港招生考试 · 【高考信息】2024高考生必看！高考录取期间十大注意事项

9 月前

嗨皮士旅行 · 暑假，你怎么能不去南疆？！

9 月前

电脑吧评测室 · 真正的大船固态近期大船推荐

5 月前

大皖新闻 · 一图速览《实施弹性退休制度暂行办法》

3 月前

关于移动版 · Py中国 · RSS之家 · CodingPro · Code · Link之家 · 卧龙AI搜索 · 小百科 · 51好读 · 小百科（海外） · Link管理

今天看啥 - 公众号rss, 微信rss, 微信公众号rss订阅, 稳定的RSS源

© 2024 ~ 沪ICP备11025650号