专栏名称: 腾讯研究院

【腾讯研究院 ★ Tencent Research Institute】网聚智慧，连接世界！网罗互联网前沿理念、传递互联网发展声音、汇集互联网研究成果、推动互联网法治进程。

我也要提交微信公众号

今天看啥

公众号rss, 微信rss, 微信公众号rss订阅, 稳定的RSS源

微信公众号RSS订阅方法

B站投稿RSS订阅方法

雪球动态RSS订阅方法

微博RSS订阅方法

微博搜索关键词RSS订阅方法

知网期刊RSS订阅方法

腾讯研究院AI速递 20250331

腾讯研究院 · 公众号 · 科技媒体 · 2025-03-31 00:01

主要观点总结

本篇文章包含多个关于人工智能领域的新闻报道，涵盖了不同公司和项目的最新进展和成就。

关键观点总结

关键观点1: Gemini 2.5 Pro在Chatbot竞技场和IQ测试中表现突出，具备高智商和强大的3D能力。

Gemini 2.5 Pro在智商测试中达到130的高分，具备将2D图像转换为3D打印文件的能力。此外，用户现在可以使用Canvas功能，并且谷歌正在扩大其试用范围。

关键观点2: GPT-4o展示了一键抠图功能和新推理能力。

GPT-4o的新功能包括一键抠图、换装和换背景。多位用户测试表明其功能保留细节能力强，并能在复杂转换时实现良好效果。此外，GPT-4o显示出推理能力的迹象，表明OpenAI可能正在为GPT-5做准备。

关键观点3: 面壁智能发布首个纯端侧智能助手cpmGO。

面壁智能推出了首个纯端侧智能助手cpmGO，强调其具备隐私安全和离线运行优势。此外，小钢炮超级助手已在汽车智能座舱领域落地，实现全链条感知决策执行能力。

关键观点4: 腾讯元宝更新功能，可识别并处理更多格式的文件。

腾讯元宝升级后能够识别并处理包括Word、PDF、Excel以及多种开发文件在内的36种格式的文件。在开发场景中，元宝能够完成代码解读、审查等多项任务。

关键观点5: VAST公司将开源多个3D生成项目。

VAST公司计划开源八大3D生成项目，其中TripoSG和TripoSF已率先发布。这些项目涉及高细节3D网格模型的生成和渲染。

关键观点6: 马斯克旗下AI公司收购社交平台X。

马斯克将自己的社交平台X以全股票交易方式出售给自己的AI公司xAI，合并后新公司估值达1130亿美元。此次合并体现了马斯克的"All in AI"战略。

关键观点7: AI癌症诊断模型ECgMPL准确度高。

ECgMPL模型能够从细胞和组织微观图像中精准识别癌症，对多种癌症的诊断准确率高。研究团队采用多步骤图像处理技术和创新的ECgMLP架构，将其定位为医生诊断的辅助工具。

关键观点8: Anthropic发表关于大模型思维研究的两篇论文。

Anthropic开发了一种AI“显微镜”方法，通过追踪神经网络内部活动模式来揭示大模型如Claude的思维过程和信息流动路径。研究还发现Claude具备提前规划输出、多语言共享概念等能力。

关键观点9: OWL团队对Manus的复刻及对未来Agent系统的看法。

OWL团队利用CAMEL-AI框架成功复刻了Manus，并分享了关于通用Agent与垂直领域Agent的看法。他们认为对于垂直领域来说，关键是解决特定领域的核心痛点，并提供专业的UI/UX体验。

文章预览

生成式AI 一、 Gemini 2.5 Pro冲上Chatbot竞技场榜首，IQ或高达130 1. Gemini 2.5 Pro在Chatbot竞技场和IQ测试中登顶，智商高达130，超越人类平均水平100； 2. 该模型展示强大3D能力，可将2D图像转换为3D打印文件，制作蛋糕模型、解魔方、创建游戏； 3. Gemini Advanced用户现可使用Canvas功能，谷歌正努力扩大2.5 Pro的试用范围。 https://mp.weixin.qq.com/s/0VmN8rKyQROIuYxDXv5WXw 二、除吉卜力外，GPT-4o一键抠图「换装」！推理也初步显现 1. GPT-4o发现新功能"画笔编辑"，支持一键抠图、换装、换背景，用户能通过涂抹区域+输入指令实现图像精准修改； 2. 多位用户测试表明功能保留细节能力强，能完成衣物更换、添加配饰、背景替换等操作，但复杂转换时效果尚有提升空间； 3. GPT-4o出现推理能力迹象，用户发现模型可显示推理时间和思维链过程，有迹象表明OpenAI正合并推理与 ………………………………

原文地址：访问原文地址
快照地址：访问文章快照
总结与预览地址：访问总结与预览

分享到微博