文章预览
前言 前一篇文章《 零成本部署:Vercel+Transformers.js 打造你的AI图片识别网站 》中,我们尝试使用 Transformers.js 和对应的模型来给图片进行标注,但发现对图片整体的识别效果不太理想。今天,我们将通过实战代码来调用大模型 API 实现图片语义识别,提升图片理解能力。 之前我们开发了一个壁纸小程序,需要对 AI 生成的图片进行标签分类,自动生成图片的描述,这正是大模型视觉能力的用武之地。 今天就来实践一下 著名的 Claude 大模型。Claude 3 系列模型带来了全新的视觉能力,使 Claude 能够理解和分析图像,为多模态交互打开了令人兴奋的大门。 代码 import anthropic,base64 client = anthropic.Anthropic(api_key= "sk-ant-ap************************************A" ) image1_media_type = "image/jpeg" image_path = './tlp.png' with open (image_path, "rb" ) as image_file: image_data = image_
………………………………