Llama3比GPT-4o更爱说谎，首个大模型“诚实性”评估基准来了 | 上海交大

量子位 · 公众号 · AI · 2024-07-11 11:47

文章预览

Pengfei Liu 投稿量子位 | 公众号 QbitAI 评估大模型是否诚实的基准来了！上海交通大学生成式人工智能实验室（GAIR Lab）推出了一项开创性的评估基准——BeHonest，旨在全面评估大模型的诚实性，为安全透明的AI研发和应用提供重要参考。在人工智能（Artificial Intelligence, AI）飞速发展的今天，大语言模型（Large Language Models, LLMs）的崛起不仅带来了令人兴奋的新体验，也引发了对其安全性和可靠性的深度思考。在众多AI安全问题中，大模型的诚实性问题具有根本性的意义。不诚实的AI模型可能在不知道答案的情况下编造信息，隐藏自身能力，甚至故意误导用户。这种不诚实的行为不仅会引发信息传播的混乱和安全隐患，还会严重阻碍AI技术的进一步优化和健康发展。如果大模型不能真实地展示其能力和局限，开发者就难以精确地进行改进。因此，确 ………………………………

原文地址：访问原文地址
快照地址：访问文章快照
总结与预览地址：访问总结与预览

分享到微博