专栏名称: 斌叔OKmath
橙旭园CEO 教育博主 教育部双创优秀导师。前微软员工。橙旭园儿童编程创始人。
今天看啥  ›  专栏  ›  斌叔OKmath

Show Lab和微软开源的一个基于Qwen2VL架构开发的视觉-20241128155908

斌叔OKmath  · 微博  ·  · 2024-11-28 15:59
    

文章预览

2024-11-28 15:59 本条微博链接 Show Lab和微软开源的一个基于Qwen2VL架构开发的视觉-语言-动作多模态AI模型:ShowUI,它可以识别和理解用户界面元素,执行比如,点击、输入、选择、滚动等操作,实现GUI自动化 能"看"屏幕、"懂"指令、会"操作",可以帮你自动操作电脑或手机,不需要写代码,用自然语言即可 不依赖源代码,它直接通过截图理解界面,自动识别和删减冗余信息,减少33%冗余视觉token,性能提升了1.4倍,零样本界面 ………………………………

原文地址:访问原文地址
快照地址: 访问文章快照
总结与预览地址:访问总结与预览