注册登录

专栏名称: 黄建同学

数码博主超话主持人（ChatGPT超话）头条文章作者我的学习笔记，关注AI+新能源

今天看啥

微信公众号rss订阅, 微信rss, 稳定的RSS源

微信公众号RSS订阅方法

B站投稿RSS订阅方法

雪球动态RSS订阅方法

微博RSS订阅方法

微博搜索关键词订阅方法

豆瓣日记 RSS订阅方法

目录

相关文章推荐

量子位 · 01年实习生被曝负责字节RL核心算法！系字节 ... · 7 小时前

新智元 · 被谷歌点名感谢！杭州六小龙开源黑科技，让机器 ... · 13 小时前

宝玉xp · Satya: Microsoft 365 ... · 2 天前

爱可可-爱生活 · 【[323星]PrunaAI/pruna：为 ... · 2 天前

新智元 · 刚刚，o1/o3后训练掌门人出走创业，Ope ... · 2 天前

今天看啥 › 专栏 › 黄建同学

大型语言模型的后训练综述（A Survey on Post-tr-20250318123200

黄建同学 · 微博 · AI · 2025-03-18 12:32

文章预览

2025-03-18 12:32 本条微博链接大型语言模型的后训练综述（A Survey on Post-training of Large Language Models）摘要：大型语言模型 (LLM) 的出现从根本上改变了自然语言处理，使它们在从对话系统到科学探索等领域都不可或缺。然而，它们的预训练架构通常会在专业环境中暴露出局限性，包括推理能力受限、道德不确定性和领域特定性能不佳。这些挑战需要先进的后训练语言模型 (PoLM) 来解决这些缺点，例如 OpenAI-o1/o3 和 DeepSeek-R1（ ………………………………

原文地址：访问原文地址
快照地址：访问文章快照
总结与预览地址：访问总结与预览

分享到微博

推荐文章

量子位 · 01年实习生被曝负责字节RL核心算法！系字节LLM攻坚小组成员

7 小时前

新智元 · 被谷歌点名感谢！杭州六小龙开源黑科技，让机器人瞬间「悟透」3D世界

13 小时前

宝玉xp · Satya: Microsoft 365 Copilot 能大幅-20250319010918

2 天前

爱可可-爱生活 · 【[323星]PrunaAI/pruna：为开发者设计的模型优化-20250318123845

2 天前

新智元 · 刚刚，o1/o3后训练掌门人出走创业，OpenAI鼎力支持押注AI材料！曾师从Bengio

2 天前

offer先生 · 京东价格战升级！诞生全新营销IP，京东是要硬刚拼多多？

8 月前

中铁十局集团 · 一图读懂《中共中央关于进一步全面深化改革、推进中国式现代化的决定》

8 月前

伯虎财经 · 《黑神话：悟空》刷屏，带火山西文旅?

6 月前

悦读文摘 · 每天思考一段话

4 月前

关于移动版 · Py中国 · RSS之家 · CodingPro · Code · Link之家 · 卧龙AI搜索 · 小百科 · 51好读 · 小百科（海外） · Link管理

今天看啥 - 微信公众号rss订阅, 微信rss, 稳定的RSS源

© 2024 ~ 沪ICP备11025650号