注册登录

专栏名称: NewBeeNLP

一个自然语言处理&人工智能的原创杂货铺子，希望能找到你喜欢的小玩意儿

我也要提交微信公众号

今天看啥

微信公众号rss订阅, 微信rss, 稳定的RSS源

微信公众号RSS订阅方法

B站投稿RSS订阅方法

雪球动态RSS订阅方法

微博RSS订阅方法

微博搜索关键词订阅方法

豆瓣日记 RSS订阅方法

目录

相关文章推荐

三联生活周刊 · 北京最治愈的咖啡店里，它们终于找到了“灵魂伴侣” · 昨天

三联生活周刊 · 外号，会不会在我们孩子这一代终结 · 2 天前

三联生活周刊 · 我本就是珍宝，值得这世间所有美好 · 4 天前

今天看啥 › 专栏 › NewBeeNLP

Llama-3-SynE：实现有效且高效的大语言模型继续预训练

NewBeeNLP · 公众号 · · 2024-07-31 11:05

文章预览

© 作者｜陈杰 ‍ ‍ ‍ 机构｜中国人民大学研究方向｜自然语言处理、大语言模型继续预训练是使语言模型适应特定领域或任务的一种重要方法。为了使继续预训练更具可追溯性，本研究展示了一份技术报告，通过继续预训练显著增强了 Llama-3（8B）的中文语言能力和科学推理能力。为了在增强新能力的同时保持原有能力，我们利用现有数据集并合成高质量数据集，设计了特定的数据混合和数据课程策略。我们将继续预训练后的模型命名为 Llama-3-SynE（ Syn thetic data E nhanced Llama-3）。论文题目：Towards Effective and Efficient Continual Pre-training of Large Language Models 论文链接：https://arxiv.org/abs/2407.18743 GitHub链接：https://github.com/RUC-GSAI/Llama-3-SynE 引言大语言模型（large language model，LLM）相关研究在推动人工智能发展方面取得了重大进展，但在特定场景中仍然存 ………………………………

原文地址：访问原文地址
快照地址：访问文章快照
总结与预览地址：访问总结与预览

分享到微博

推荐文章

三联生活周刊 · 北京最治愈的咖啡店里，它们终于找到了“灵魂伴侣”

昨天

三联生活周刊 · 外号，会不会在我们孩子这一代终结

2 天前

三联生活周刊 · 我本就是珍宝，值得这世间所有美好

4 天前

医药代表 · 飞利浦更换大中华区总裁

4 月前

远川研究所 · 一条减速带，绊倒了多少无人车？

4 月前

花粉监测预报 · 花粉监测预报（2024-8-8）

3 月前

MAOLivehouse广州太古仓店 · 11.24 今晚开票 | Dove鸽子「D Day」2024巡演广州站

1 月前

半导体行业观察 · 存储没有那么惨，也不好！

1 月前

关于移动版 · Py中国 · RSS之家 · CodingPro · Code · Link之家 · 卧龙AI搜索 · 小百科

今天看啥 - 微信公众号rss订阅, 微信rss, 稳定的RSS源

© 2024 ~ 沪ICP备11025650号