今天看啥  ›  专栏  ›  腾讯云

腾讯元宝 X DeepSeek:双模聚合,解锁「图像理解」技能

腾讯云  · 公众号  ·  · 2025-02-21 10:20
    

文章预览

刚刚,腾讯元宝解锁了一项新技能—— 「看图说话」 。 现在,用户上传一张图片,元宝不仅能识别其中的文字,还能理解画面内容,并给出自己的分析和解读。 翻译过来就是,腾讯元宝在DeepSeek原有基础上,补足了「图像理解」能力。怎么做到的? 其实,这得益于腾讯元宝 「混元+DeepSeek」双模聚合效应 。 过去,DeepSeek处理图片,更像是「扫描仪」,只会老老实实提取信息;如今,在腾讯混元多模态技术的加持下,无论是艺术作品,还是生活随拍,都能真正「看懂」图中的细节、氛围,甚至是隐藏的含义。 注意,「看图说话」功能需要关闭联网搜索后使用。 当然,腾讯元宝的技能远不止于此。除了「看图说话」,它还支持 文件解析、联网搜公众号或视频号内容、微信上传文件 等,功能齐全并且样样精通。 同时,用户还可以根据场景和业务需 ………………………………

原文地址:访问原文地址
快照地址: 访问文章快照
总结与预览地址:访问总结与预览