专栏名称: 专知
专知,为人工智能从业者服务,提供专业可信的人工智能知识与技术服务,让认知协作更快更好!
目录
相关文章推荐
今天看啥  ›  专栏  ›  专知

大语言模型对齐研究综述

专知  · 公众号  ·  · 2024-08-02 14:00
    

文章预览

随着人工智能技术的飞速发展,大语言模型已在众多领域得到了广泛应用。然而,大语言模型可能 会生成不准确、有误导性甚至有害的内容,这引发了人们对大语言模型可靠性的担忧,采用对齐技术来确保 大语言模型的行为与人类价值观一致已经成为一个亟待解决的问题。对近年来大语言模型对齐技术的研究进 展进行综述。介绍了常用的指令数据收集方法和人类偏好数据集,概述了监督调整和对齐调整的相关研究, 讨论了模型评估常用的数据集和方法,总结并展望了未来的研究方向。 近年来,大语言模型(如 OpenAI 的 Chat‐ GPT)[1] 的迅猛发展引发了人们对人工智能的浓 厚兴趣和高度期望,同时也引发了人们的广泛探 讨。大语言模型不仅展现出卓越的自然语言处理 能力,还在数学、推理和编程等多个领域中接近 甚至超越普通人类的水平[2] 。这 ………………………………

原文地址:访问原文地址
快照地址: 访问文章快照
总结与预览地址:访问总结与预览