Qwen2.5思维链微调代码实操 + 多卡Lora微调完整代码

自动驾驶之心 · 公众号 · · 2024-12-21 00:00

文章预览

作者 | chenshaohon 编辑 | 自动驾驶之心原文链接：https://zhuanlan.zhihu.com/p/12684234698 点击下方卡片，关注“ 自动驾驶之心 ”公众号戳我-> 领取自动驾驶近15个方向学习路线 >> 点击进入→ 自动驾驶之心『大语言模型』技术交流群本文只做学术分享，如有侵权，联系删文作者：情感机器团队-陈少宏邮箱：shaohon_chen@115lab.club 最近对于Scaling Law的讨论异常火热。包括ilya大神自己都下场演讲关于大模型数据规模碰壁的问题（参考：机器之心官网发文）。直觉上，现在大模型思维的过程更像是人对一件事情直觉的反应，而不是多步思考和迭代思考的过程。正如下图ilya的PPT中的一张图，10层神经网络可以干人在0.1秒干的事情。而现在大模型上十亿的参数也可能只是解决人经过一分钟思考的回答。像OpenAI o1或者强化对齐可能是通往AGI的方法之一。刚好 ………………………………

原文地址：访问原文地址
快照地址：访问文章快照
总结与预览地址：访问总结与预览

分享到微博

推荐文章

环保人 · 危废标签软件免费！联网危废平台免费！三合一打印机1000

昨天

环保人 · 稀硫酸不挥发可为啥酸洗还有酸味？酸雾计算不能用那个老公式？环境部文件明确规定。该咋算？

2 天前

环保人 · 环评大气预测资料2000，一键智能填报排污许可季报、自行监测、执行报告等

3 天前

环保人 · 改扩建项目现有污染源测2天3次的依据是什么？能只测1天1次？请看环境部文件明确依据

3 天前

环保人 · 危废标签软件免费！联网危废平台免费！三合一打印机1000

3 天前

HR转型突破 · 叫不叫“兄弟”不重要，“躺着”肯定过不了冬

10 月前

量化智投 · 期指远月合约贴水幅度均加深，IC主动对冲策略表现优异【国金金工高智威团队】

10 月前

光伏們 · 河南：分布式风、光10(6)千伏以上电压并网参与调峰，低压逐步纳入

7 月前