专栏名称: 腾讯研究院

【腾讯研究院 ★ Tencent Research Institute】网聚智慧，连接世界！网罗互联网前沿理念、传递互联网发展声音、汇集互联网研究成果、推动互联网法治进程。

我也要提交微信公众号

今天看啥

微信公众号rss订阅, 微信rss, 稳定的RSS源

微信公众号RSS订阅方法

B站投稿RSS订阅方法

雪球动态RSS订阅方法

微博RSS订阅方法

微博搜索关键词订阅方法

豆瓣日记 RSS订阅方法

腾讯研究院AI速递 20241230

腾讯研究院 · 公众号 · 科技媒体 · 2024-12-30 00:01

主要观点总结

文章概述了关于生成式AI的最新发展及相关技术进展，包括OpenAI的新模式与评估结果，不同领域的AI模型性能展示，以及各机构在AI领域的最新研究成果和观点。

关键观点总结

关键观点1: OpenAI分为两部分发展：营利部门追求商业利益，非营利部门专注于科学慈善。

OpenAI正式分为两部分，其中营利性部门转为PBC以追求商业利益，同时非营利部门专注于健康、教育和科学慈善。这种结构使得OpenAI更易获得资金，同时保留AGI造福人类的使命。

关键观点2: OpenAI的新模型o3在某些任务上表现接近人类水平，但仍存在无法解决的问题。

OpenAI的o3模型在ARC-AGI基准测试中表现优异，但仍有部分任务无法解决，显示出其与真正的AGI之间的差距。其计算成本高昂，但高计算量模式下的准确率较高。

关键观点3: 可灵AI的生图模型「可图1.5」上线了，擅长亚洲人面孔与古风摄影的人像生成。

可灵AI的「可图1.5」模型在生成人像方面表现突出，尤其擅长亚洲人像的生成。此外，它还推出了新功能「AI模特」，能够一键生成高质量的动态服装展示视频。

关键观点4: 腾讯优图等机构提出了DynamicControl框架，增强了文本生成图像任务的可控性。

DynamicControl框架通过动态选择控制条件，有效增强了文本生成图像任务的可控性。它引入多控制适配器和双循环控制器，优化了条件选择和图像一致性。

关键观点5: 小红书推出了AI搜索应用「点点」，提供多模态交互功能。

小红书推出了AI搜索应用「点点」，整合了全网生活经验信息，并提供多模态交互功能，如语音、拍照提问和视频回复。它帮助用户在美食、购物、旅行等领域获取精准答案。

关键观点6: DeepMind开源了“从假设到理论”（HtT）框架，旨在提高大模型的推理能力。

DeepMind的HtT框架旨在通过规则库增强大模型的推理能力，减少幻觉问题。实验表明，这一框架显著提升了GPT系列模型在关系推理、数值推理和概念学习中的准确性。

关键观点7: 英伟达发布了通用机器人模型RVT-2，训练效率大幅提升。

英伟达发布了RVT-2模型，其训练效率较一代提升了6倍。该模型通过引入多阶段推理管道和凸上采样技术，优化了抓手姿态预测，提高了任务执行精度。

关键观点8: 谷歌CEO表示将全力发力AI领域，把握颠覆性时刻。

谷歌CEO表示2025年将是AI领域的关键年份，公司计划全力发力以确保在AI领域的领先地位。谷歌通过Gemini模型迎头赶上OpenAI，并计划推出更多竞争性产品。

关键观点9: VAST公司的3D大模型“Tripo”推动3D生成技术的快速发展。

VAST公司通过其3D大模型“Tripo”推动了3D生成技术的快速发展。预计在未来两年内，用户将能零门槛创作实时3D内容，实现3D的UGC。

文章预览

生成式AI 一、 OpenAI一分为二，全力冲刺AGI！一半向钱看，一半装理想 1. OpenAI正式分为两部分：营利性部门转为PBC，追求商业利益；非营利部门专注健康、教育和科学慈善； 2. PBC结构使OpenAI更易获得资金，同时保留AGI造福人类的使命。 3. OpenAI与微软合作商业化引发批评，但认为资金是推进AGI发展的必要条件。 https://mp.weixin.qq.com/s/EK3D0B7z_dXlJlVf7jluzQ 二、这34道题o3真不会，即使思考 16 小时也没能给出正确答案 1. OpenAI的新模型o3突破了ARC-AGI基准，表现接近人类水平，且计算量越大，准确率越高； 2. o3每道题的计算成本高昂，低计算量模式每题17-20美元，高计算量模式达到数千美元； 3. o3大部分任务上表现优异，但仍有34个任务无法解决，显示出其与AGI之间的差距。 https://mp.weixin.qq.com/s/JP7oMNb0ioAOrAn9dZa7AQ 三、可灵AI生图模型，可图 1.5 上线，擅长亚 ………………………………

原文地址：访问原文地址
快照地址：访问文章快照
总结与预览地址：访问总结与预览

分享到微博