OpenAI o1的安全测试

Hacking就是好玩 · 公众号 · · 2024-09-14 00:03

文章预览

昨天OpenAI 正式公开一系列全新 AI 大模型，新模型可以实现复杂推理，解决比此前的科学、代码和数学模型能做到的更难的问题。在之前测试了问题, 几乎没有模型能够回答包括gpt4，但是如果让gpt4写代码解决这个问题，它能够运行。一个密码锁是三位，有大写字母组成。输入ABC，其中一个号码正确，而且位置正确。输入AEF，其中一个号码正确，但位置不正确。输入CKA，其中两个号码正确，但位置都不正确。输入DEB，没一个号码正确。输入BDK，其中一个号码正确，但位置不正确。请问正确密码是多少？今天用新的gpt o1模型测试，相比之前，gpt在经过思考后就能给出答案。同时还发布了一篇文章讲述了进行的安全工作，包括外部红队测试、前沿风险评估，以及为应对关键风险领域而内置的缓解措施的概述:https://cdn.openai.com/gpt-4o-system-card.pdf 本文 ………………………………

原文地址：访问原文地址
快照地址：访问文章快照
总结与预览地址：访问总结与预览

分享到微博