专栏名称: 腾讯研究院
【腾讯研究院 ★ Tencent Research Institute】 网聚智慧,连接世界!网罗互联网前沿理念、传递互联网发展声音、汇集互联网研究成果、推动互联网法治进程。
今天看啥  ›  专栏  ›  腾讯研究院

腾讯研究院AI速递 20250113

腾讯研究院  · 公众号  · 科技媒体  · 2025-01-13 00:01
    

主要观点总结

本文报道了关于生成式AI领域的多个话题,包括马斯克版的ChatGPT在iOS上的应用,DeepSeek手机应用的推出,以及多个关于AI模型、功能和应用的新进展。文章涵盖了图像生成、交互设计、手机应用、模型训练、视频生成、模型简化、系统推理等方面的内容。

关键观点总结

关键观点1: 马斯克版ChatGPT iOS应用上线,包含惊喜和槽点

Grok已推出iOS独立应用,支持文字、图片和文件输入,可访问X平台内容,在图像生成和交互设计方面有特点;界面设计对标ChatGPT,具有贴心的交互细节。

关键观点2: DeepSeek手机应用发布,支持联网搜索等功能

DeepSeek发布iOS和安卓版手机应用,支持联网搜索、文件上传和图片解析功能,应用底层使用DeepSeek V3纯文本模型,图片和文件解析通过OCR等外部工具实现。

关键观点3: 伯克利团队开源32B推理模型Sky-T1

该模型训练成本仅450美元,性能媲美早期o1-preview,基于Qwen2.5-32B-Instruct微调,使用数学和编程混合数据训练,研究发现32B以上规模和均衡的数据混合对推理能力提升至关重要。

关键观点4: 海螺AI推出“主体参考”功能

该功能基于S2V-01模型,能生成保持角色特征的视频,动作自由且面部稳定,采用图片参考技术路线,生成速度快,未来可拓展至多人、物体和场景。

关键观点5: GAN模型的改进与逆袭

布朗大学研究团队通过新的损失函数解决GAN模式崩溃和不稳定性问题,简化模型架构后性能超越扩散模型,新方法R3GAN在FFHQ、ImageNet等数据集测试中表现优秀。

关键观点6: Meta-CoT框架的推理能力升级

该框架通过显式建模底层推理过程,扩展传统思维链方法,解决复杂问题时能捕捉非线性和迭代性的真实数据生成过程,实现更强大的推理能力。

关键观点7: OpenAI进军机器人领域

OpenAI首次开放硬件招聘,目标是打造在动态环境中具有AGI级别智能的通用机器人,致力于将AI算法与物理机器人融合。

关键观点8: Scale AI 创始人谈AI Agent产品设计的重要性

创始人认为AI Agent的最大突破在于产品设计而非技术本身,强调独立思考和特定领域的专注是AI创业的关键。

关键观点9: AI对就业的影响及职业选择建议

研究发现AI影响就业存在拐点,特定工种的替代效应不可逆转,建议从业者重新考虑职业发展方向或与AI协同工作。


文章预览

生成式AI 一、  马斯克版 ChatGPT iOS 应用上线,测试一天发现这些惊喜和槽点 1. Grok已推出iOS独立应用,免注册可用,支持文字、图片和文件输入,可访问X平台内容但非实时; 2. 相比ChatGPT,Grok在图像生成方面更自由,可生成公众人物和版权内容,但在餐厅推荐等实用问题上表现粗糙; 3. 界面设计对标ChatGPT,具有贴心的交互细节,如自动滚动到问题开始处,整体UI美感十足。 https://mp.weixin.qq.com/s/lmyNqogc-fLRrCID1C3j7Q 二、  虽迟但到:DeepSeek正式推出手机app,苹果安卓系统都支持 1. DeepSeek发布iOS和安卓版手机应用,支持联网搜索、文件上传和图片解析功能,但未在官网展示和宣传; 2. 应用底层使用DeepSeek V3纯文本模型,开启深度搜索后调用DeepSeek-R1-Lite推理模型; 3. 图片和文件解析通过OCR等外部工具实现,而非使用模型的多模态能力。 https://mp.weixin.qq.com ………………………………

原文地址:访问原文地址
快照地址: 访问文章快照
总结与预览地址:访问总结与预览