专栏名称: AIGC Research
AIGC Research|AI for Creativity Plan (AI4C Plan)|from ShanghaiTech University|致力于探索AIGC赋能创意智能|保持卓越学术品位和极致艺术追求
今天看啥  ›  专栏  ›  AIGC Research

174-B1|多模态时尚检索与生成,面部情感理解,MLLM几何推理;多模态上下文感知口型匹配视频配音;目标遮挡情境下的视频修复

AIGC Research  · 公众号  ·  · 2024-08-22 19:00

文章预览

AIGC   Research 主编| 庄才林(Cailin Zhuang) 技术支持|胡耀淇(Yaoqi Hu) Topic: Multi-modal|Fashion Retrieval and Generation, Facial Emotion Understanding, Geometric Reasoning UniFashion: A Unified Vision-Language Model for Multimodal Fashion Retrieval and Generation 2024-08-21|PolyU, WHU|⭐️ http://arxiv.org/abs/2408.11305v1 https://github.com/xiangyu-mm/UniFashion 概述 UniFashion 是一个融合了视觉和语言数据的统一模型,它专门应对时尚领域的多模态检索和生成任务 。随着人工智能技术的进步,尤其是在生成模型(如大型语言模型和扩散模型)方面,UniFashion 应运而生,以解决目前时尚领域多模态任务中存在的诸多挑战。 现有的多模态大规模语言模型(MLLMs)仍然面临对图像生成能力不足的局限,而 UniFashion 通过将检索与生成任务结合,实现了更好的多模态嵌入和生成能力 。研究证明,该模型在多个时尚任务 ………………………………

原文地址:访问原文地址
快照地址: 访问文章快照
总结与预览地址:访问总结与预览