专栏名称: 环球科学
《科学美国人》独家授权中文版—《环球科学》杂志—www.huanqiukexue.com
今天看啥  ›  专栏  ›  环球科学

OpenAI公布新一代AI推理模型o3,几分钟解决人类数学家耗时数天的难题,某些条件下接近通用人工智能 | 环球科学要闻

环球科学  · 公众号  · 科学  · 2024-12-23 12:19
    

主要观点总结

本文报道了科学领域的最新进展,包括人工智能、物理、医学以及航天等方面的消息。其中,OpenAI公布了新的AI推理模型o3,其在ARC-AGI评估和EpochAI Frontier Math测试中表现出色;物理领域关注氢化物超导研究的争议;医学领域,礼来公司的减肥药物Zepbound获FDA批准用于治疗阻塞性睡眠呼吸暂停;美国物理学会公布了2024年度亮点工作,包括无需样本测量血糖、观测太阳中微子雾等。同时,我国宇航员创造了单次出舱活动时长的新世界纪录。

关键观点总结

关键观点1: OpenAI公布新的AI推理模型o3,在评估测试中表现优异

OpenAI发布了新的AI推理模型o3和o3 mini,作为o1模型之后的下一代AI模型,o3在软件工程、编写代码、竞赛数学和掌握人类博士级别科学知识能力等方面均强于o1。o3在ARC-AGI评估中获得破纪录分数,达到代表人类水平的门槛,并且在EpochAI Frontier Math测试中解决了25.2%的问题。

关键观点2: 氢化物超导研究引起争议,物理领域专家发表评论文章审查该领域的关键性论文

过去几年里,高压氢化物一直是超导研究领域的一个研究热点。最近,一篇评论文章审查了该领域的6篇关键性论文,得出结论认为氢化物具有超导性的证据大量存在。但这一领域也存在争议,涉及科学欺诈问题。专家团队由从未直接研究氢化物超导的研究人员组成,他们通过检查数据和评估实验技术来验证氢化物超导性的两个证据。

关键观点3: 礼来公司的减肥药物Zepbound获FDA批准,用于治疗阻塞性睡眠呼吸暂停

Zepbound是一种替泽帕肽(Tirzepatide)药物,用于治疗肥胖成人中度至重度的OSA。它通过减少呼吸中断次数和改善体重减轻来改善睡眠质量。然而,这种药物可能导致甲状腺癌等副作用。

关键观点4: 美国物理学会公布2024年度亮点工作,包括测量血糖、观测太阳中微子雾等

美国物理学会公布了2024年度亮点工作,包括无需样本即可测量血糖的技术、观测太阳中微子雾的实验、核聚变反应的进展等。此外,还涉及机械测量核衰变、证实第三种磁性、在城市光纤中传输纠缠光子等前沿领域的进展。

关键观点5: 我国宇航员完成首次出舱活动,打破单次出舱活动时长世界纪录

我国宇航员蔡旭哲、宋令东、王浩泽完成了首次出舱活动,用时9小时,刷新了中国航天员单次出舱活动时长纪录。这次活动也标志着我国航天员在航天领域的不断进步和发展。


文章预览

将环球科学 设为星标 周一至周五 第一时间掌握 最新鲜的全球科技资讯 ·  人工智能   · OpenAI公布新一代AI推理模型o3,某些条件下已接近通用人工智能 o3在ARC-AGI评估中已达到代表人类水平的门槛(图片来源:OpenAI) 当地时间12月20日, OpenAI公布了其新的人工智能(AI)推理模型——o3和o3 mini ,作为o1模型之后的下一代AI模型。o3在软件工程、编写代码、竞赛数学和掌握人类博士级别科学知识能力等方面均强于o1。据悉,OpenAI将确保新模型的可靠性和安全性后再提供给更广泛的用户使用,因此o3 mini将于2025年1月底前正式推出,而完整版的o3将在之后推出。目前, OpenAI官网已开放o3-mini模型的早期访问申请 。 据悉,o3在ARC-AGI评估(用来测试AI模型对困难数学和逻辑问题推理能力的基准测试)中获得了破纪录的分数,o3的最高分数可达87.5%,已经达到了代 ………………………………

原文地址:访问原文地址
快照地址: 访问文章快照
总结与预览地址:访问总结与预览