专栏名称: 腾讯研究院
【腾讯研究院 ★ Tencent Research Institute】 网聚智慧,连接世界!网罗互联网前沿理念、传递互联网发展声音、汇集互联网研究成果、推动互联网法治进程。
今天看啥  ›  专栏  ›  腾讯研究院

腾讯研究院AI速递 20241230

腾讯研究院  · 公众号  · 科技媒体  · 2024-12-30 00:01
    

主要观点总结

文章概述了关于生成式AI的最新发展及相关技术进展,包括OpenAI的新模式与评估结果,不同领域的AI模型性能展示,以及各机构在AI领域的最新研究成果和观点。

关键观点总结

关键观点1: OpenAI分为两部分发展:营利部门追求商业利益,非营利部门专注于科学慈善。

OpenAI正式分为两部分,其中营利性部门转为PBC以追求商业利益,同时非营利部门专注于健康、教育和科学慈善。这种结构使得OpenAI更易获得资金,同时保留AGI造福人类的使命。

关键观点2: OpenAI的新模型o3在某些任务上表现接近人类水平,但仍存在无法解决的问题。

OpenAI的o3模型在ARC-AGI基准测试中表现优异,但仍有部分任务无法解决,显示出其与真正的AGI之间的差距。其计算成本高昂,但高计算量模式下的准确率较高。

关键观点3: 可灵AI的生图模型「可图1.5」上线了,擅长亚洲人面孔与古风摄影的人像生成。

可灵AI的「可图1.5」模型在生成人像方面表现突出,尤其擅长亚洲人像的生成。此外,它还推出了新功能「AI模特」,能够一键生成高质量的动态服装展示视频。

关键观点4: 腾讯优图等机构提出了DynamicControl框架,增强了文本生成图像任务的可控性。

DynamicControl框架通过动态选择控制条件,有效增强了文本生成图像任务的可控性。它引入多控制适配器和双循环控制器,优化了条件选择和图像一致性。

关键观点5: 小红书推出了AI搜索应用「点点」,提供多模态交互功能。

小红书推出了AI搜索应用「点点」,整合了全网生活经验信息,并提供多模态交互功能,如语音、拍照提问和视频回复。它帮助用户在美食、购物、旅行等领域获取精准答案。

关键观点6: DeepMind开源了“从假设到理论”(HtT)框架,旨在提高大模型的推理能力。

DeepMind的HtT框架旨在通过规则库增强大模型的推理能力,减少幻觉问题。实验表明,这一框架显著提升了GPT系列模型在关系推理、数值推理和概念学习中的准确性。

关键观点7: 英伟达发布了通用机器人模型RVT-2,训练效率大幅提升。

英伟达发布了RVT-2模型,其训练效率较一代提升了6倍。该模型通过引入多阶段推理管道和凸上采样技术,优化了抓手姿态预测,提高了任务执行精度。

关键观点8: 谷歌CEO表示将全力发力AI领域,把握颠覆性时刻。

谷歌CEO表示2025年将是AI领域的关键年份,公司计划全力发力以确保在AI领域的领先地位。谷歌通过Gemini模型迎头赶上OpenAI,并计划推出更多竞争性产品。

关键观点9: VAST公司的3D大模型“Tripo”推动3D生成技术的快速发展。

VAST公司通过其3D大模型“Tripo”推动了3D生成技术的快速发展。预计在未来两年内,用户将能零门槛创作实时3D内容,实现3D的UGC。


文章预览

生成式AI 一、  OpenAI一分为二,全力冲刺AGI!一半向钱看,一半装理想 1. OpenAI正式分为两部分:营利性部门转为PBC,追求商业利益;非营利部门专注健康、教育和科学慈善; 2. PBC结构使OpenAI更易获得资金,同时保留AGI造福人类的使命。 3. OpenAI与微软合作商业化引发批评,但认为资金是推进AGI发展的必要条件。 https://mp.weixin.qq.com/s/EK3D0B7z_dXlJlVf7jluzQ 二、  这34道题o3真不会,即使思考 16 小时也没能给出正确答案 1. OpenAI的新模型o3突破了ARC-AGI基准,表现接近人类水平,且计算量越大,准确率越高; 2. o3每道题的计算成本高昂,低计算量模式每题17-20美元,高计算量模式达到数千美元; 3. o3大部分任务上表现优异,但仍有34个任务无法解决,显示出其与AGI之间的差距。 https://mp.weixin.qq.com/s/JP7oMNb0ioAOrAn9dZa7AQ 三、  可灵AI生图模型,可图 1.5 上线,擅长亚 ………………………………

原文地址:访问原文地址
快照地址: 访问文章快照
总结与预览地址:访问总结与预览