专栏名称: 宝玉xp
前微软Asp.Net最有价值专家 互联网科技博主 我是宝玉。
今天看啥  ›  专栏  ›  宝玉xp

Google Geimini 1.5 Pro 的多模态功能,不仅-20240831133658

宝玉xp  · 微博  · AI  · 2024-08-31 13:36
    

文章预览

2024-08-31 13:36 本条微博链接 Google Geimini 1.5 Pro 的多模态功能,不仅能检测图片上的物体,还能输出物体的边框坐标,这样理论上来说你可以在输入的图片上画上框和标注目标内容,很实用的功能。 由于是多模态大语言模型,你还可以在检测对象时加上限定条件,比如只输出动物。 有网友已经做了开源项目,上传图片就可以显示检测结果,但是需要自备 Gemini 的 Api Key。 注意提示词里面要限制输出的格式是JSON这样的方便解 ………………………………

原文地址:访问原文地址
快照地址: 访问文章快照
总结与预览地址:访问总结与预览