专栏名称: 麻省理工科技评论
《麻省理工科技评论》杂志官方微博 源自麻省理工学院,关注即将商业化的创新,聚焦即将资本化的创业。
今天看啥  ›  专栏  ›  麻省理工科技评论

【合成数据的突破: 从降低迎合性偏差到认知自主性的重构】马来西亚-20250104102022

麻省理工科技评论  · 微博  ·  · 2025-01-04 10:20
    

文章预览

2025-01-04 10:20 本条微博链接 【合成数据的突破: 从降低迎合性偏差到认知自主性的重构】 马来西亚思特雅大学博士生王立博,近两年来主要研究大语言模型。起初,王立博做这类研究也是被 #大语言模型# 给逼的,因为日常总得提防其“献媚(Sycophancy)”,这是由基于人类反馈的强化学习调优策略导致的固有缺陷。 因此,他致力于设计能够自主学习、思考和推理的 #人工智能# ,而不是人工宠物。 引入 #强化学习# 的训 ………………………………

原文地址:访问原文地址
快照地址: 访问文章快照
总结与预览地址:访问总结与预览