今天看啥  ›  专栏  ›  LLM SPACE

Qwen 2.5 omni 案例测试文档

LLM SPACE  · 公众号  ·  · 2025-04-03 12:21
    

文章预览

实测体验 场景1:论文阅读(视觉与文本理解能力) 要求模型总结文章的主要内容,当摄像头对准文章的摘要部分时,模型的输出只有很简单的一句话,事实上通过摘要能获取的信息远不止于此,暂时不知道是什么导致了这样的原因。 可能的原因是对于任务的指令不够清晰,需要先声明清楚需要让模型完整阅览整个文献内容,再进行输出。 后续经严谨流程引导,模型确实能够阅读完整文献,并输出主要内容。 场景2:解方程组(视觉与数学能力) 测试1:简单方程组(成功) 首先询问模型是否有解方程的能力, 它首先回复我对于复杂的方程可以使用一些在线工具来求解, 同时也表示自己可以尝试解决。 将简单方程组给到模型来解决, 并且成功解出答案。 测试2:复杂方程组(失败) 第一次对话指令是:请帮我解决图中的问题。 第一次对话模型在文本 ………………………………

原文地址:访问原文地址
快照地址: 访问文章快照
总结与预览地址:访问总结与预览