今天看啥  ›  专栏  ›  云中江树

在清华与中国AIGC大会的分享:多模态AI大爆发,多模态提示词与智能体

云中江树  · 公众号  ·  · 2024-06-10 17:28
    

文章预览

多模态AI大爆发 2024 年是多模态大模型发展之年,继 OpenAI 发布 GPT-4o 以来,谷歌的 Gemini 系列同样有了比较大的更新,同时国内通义千问系列,智谱 AI 的 CogVLM,商汤的多模态模型等也纷纷发布。 另一方面,语音情感 AI 方面,除了国外的 Hume AI 之外,火爆的 ChatTTS,字节跳动出品的 Seed-TTS 等语音 AI 的效果目前也十分惊艳,令人真假难辨。同时,OpenAI 发布 Sora 吊足大家胃口之后,国内迅速跟进,开源社区推出 OpenSora,清华推出 Vidu,快手推出的 Kling 模型最近更是风靡一时,也是当前公众能体验到的最接近 Sora 级视频生成模型。 多模态 AI 的大爆发,如期而至,与之相伴的是相关的提示词、智能体等技术的进一步更新升级。 与此同时,继幻方 deepseek 系列模型发布之后,大模型的使用成本下降了一个数量级。国内大模型降价潮也由此掀开帷幕,字节跳 ………………………………

原文地址:访问原文地址
快照地址: 访问文章快照
总结与预览地址:访问总结与预览