文章预览
Possible principles for aligned structure learning agents https://arxiv.org/pdf/2410.00258? 摘要 本文提出了一条从 自然智能的基本原理描述出发 ,开发可扩展且 对齐的人工智能 (AI)的路线图。简而言之, 实现可扩展且对齐的AI的一条可能路径是,使人工智能体能够学习一个包含我们偏好模型的良好世界模型 。为此,主要目标是创建能够 表示世界和其他智能体的世界模型的人工智能体 ;这是一个属于 结构学习(又称因果表示学习) 范畴的问题。本文在明确这一目标的前提下,揭示了 结构学习和对齐问题 ,以及指导我们前进的原则,综合了 数学、统计学和认知科学中的各种思想 。1) 我们讨论了 核心知识、信息几何和模型简化在结构学习中的关键作用 ,并建议学习 核心结构模块以掌握广泛的自然世界 。2) 我们概述了通过 结构学习和心智理论实现智能体对齐的
………………………………