专栏名称: PaperWeekly

PaperWeekly是一个推荐、解读、讨论和报道人工智能前沿论文成果的学术平台，致力于让国内外优秀科研工作得到更为广泛的传播和认可。社区：http://paperweek.ly | 微博：@PaperWeekly

我也要提交微信公众号

今天看啥

微信公众号rss订阅, 微信rss, 稳定的RSS源

微信公众号RSS订阅方法

B站投稿RSS订阅方法

微博RSS订阅方法

微博搜索关键词订阅方法

豆瓣日记 RSS订阅方法

从啥也不会到DPO：大模型微调（Fine-Tuning）实践经验最全总结

PaperWeekly · 公众号 · 科研 · 2024-05-28 12:42

文章预览

OpenAI GPT-4o，Google Gemini，Meta Llama3...... 无论闭源还是开源，大模型技术的发展今年是你方唱罢我登场，而且迭代速度飞快，在短短一年间就有了大幅度的技术迭代更新， LoRA 、模型压缩、QLoRA、DeepSpeed、Megatron-LM、 Flash Attention 、 RLHF 、DPO 等等，几乎每天都有新的发展。我们总结了算法工程师需要掌握的大模型微调技能，并制作了大模型微调技能图谱，希望可以帮助大家将知识体系梳理清楚，为未来在大模型的工作与科研道路上节省时间，提高效率！作为算法工程师，面对如此庞大又在飞速迭代的大模型技术体系，您是否有感觉自己的学习步伐有点跟不上技术的发展？或者对这些新兴技术的理解仅仅停留在应用层面上，实际上对背后的原理并没有深入剖析过？如果您希望在大模型赛道上持续保持竞争壁垒，对技术本身的深入理解是很必要的选项。 ………………………………

原文地址：访问原文地址
快照地址：访问文章快照
总结与预览地址：访问总结与预览

分享到微博

推荐文章

实验万事屋 · 看到人家硕士生，就发了10.7分的SCI，我焦虑了！这重庆医科大的文章，做了能量代谢和ROS，只是逻辑上还有点瑕疵……

昨天

研之成理 · 上海交通大学张万斌教授团队JACS：镍催化不对称氢化合成手性β2-氨基膦衍生物

2 天前

募格学术 · 高校强迫全校学生4h速成论文并发表，QS排名从野鸡学校飞升全球第二！

2 天前

PKU创新学社 · 赛事推荐｜中关村科学城·第十二届“东升杯”国际创业大赛全球招募正式启动！

5 月前

新浪科技 · 【#工商银行APP提前还房贷起步金额上调至5万# 工作人员：消息-20240903074027

4 月前

花生十三 · 花生十三片段阅读600题，火热销售中！

3 周前