2024-09-03 05:44
本条微博链接
通过审视偏好的描述性与规范性局限,呼吁AI对齐社群超越偏好,转向对人类价值观与规范推理的建模,以及以角色规范和公平协商为基础的对齐目标。
[LG]《Beyond Preferences in AI Alignment》T Zhi-Xuan, M Carroll, M Franklin, H Ashton [MIT UC Berkeley University College London University of Cambridge] (2024)
………………………………