今天看啥  ›  专栏  ›  Hacking就是好玩

OpenAI o1的安全测试

Hacking就是好玩  · 公众号  ·  · 2024-09-14 00:03

文章预览

昨天OpenAI 正式公开一系列全新 AI 大模型,新模型可以实现复杂推理,解决比此前的科学、代码和数学模型能做到的更难的问题。 在之前测试了问题, 几乎没有模型能够回答包括gpt4,但是如果让gpt4写代码解决这个问题,它能够运行。 一个密码锁是三位,有大写字母组成。 输入ABC,其中一个号码正确,而且位置正确。 输入AEF,其中一个号码正确,但位置不正确。 输入CKA,其中两个号码正确,但位置都不正确。 输入DEB,没一个号码正确。 输入BDK,其中一个号码正确,但位置不正确。 请问正确密码是多少? 今天用新的gpt o1模型测试,相比之前,gpt在经过思考后就能给出答案。 同时还发布了一篇文章讲述了进行的安全工作,包括外部红队测试、前沿风险评估,以及为应对关键风险领域而内置的缓解措施的概述:https://cdn.openai.com/gpt-4o-system-card.pdf 本文 ………………………………

原文地址:访问原文地址
快照地址: 访问文章快照
总结与预览地址:访问总结与预览