专栏名称: AIGC Research

AIGC Research｜AI for Creativity Plan (AI4C Plan)｜from ShanghaiTech University｜致力于探索AIGC赋能创意智能｜保持卓越学术品位和极致艺术追求

我也要提交微信公众号

今天看啥

微信公众号rss订阅, 微信rss, 稳定的RSS源

微信公众号RSS订阅方法

B站投稿RSS订阅方法

雪球动态RSS订阅方法

微博RSS订阅方法

微博搜索关键词订阅方法

豆瓣日记 RSS订阅方法

211-B1｜声呐图像合成；百川Omni MLLM技术报告，音频描述生成｜Mon

AIGC Research · 公众号 · · 2024-10-15 23:55

文章预览

AIGC Research 主编｜庄才林（Cailin Zhuang）技术支持｜胡耀淇（Yaoqi Hu） Topic: Image Generation｜Sonar Image Synth-SONAR: Sonar Image Synthesis with Enhanced Diversity and Realism via Dual Diffusion Models and GPT Prompting 2024-10-11｜SRMIST｜ 🟡 http://arxiv.org/abs/2410.08612v1 概述本文提出了一种新颖的声呐图像合成框架，称为“Synth-SONAR”，旨在通过双扩散模型和GPT提示技术提升声呐图像的多样性和真实感。传统的声呐图像生成方法通常依赖于昂贵且耗时的实地数据采集，导致数据质量和多样性不足。Synth-SONAR通过整合生成式人工智能（GenAI）技术和公开的声呐数据集，克服了这些局限性。该框架的创新之处在于，它结合了高层（粗略）和低层（细致）文本条件的扩散模型，能够生成高质量的合成声呐图像，显著提升了图像的多样性和真实性。通过多种定量和定性分析，Synth-SONAR在声呐图 ………………………………

原文地址：访问原文地址
快照地址：访问文章快照
总结与预览地址：访问总结与预览

分享到微博