2024-09-12 05:34
本条微博链接
提出Draw an Audio框架,通过引入绘制的蒙版和响度信号作为额外输入指令,实现了生成与视频内容、时间和响度一致的可控音频。
[AS]《Draw an Audio: Leveraging Multi-Instruction for Video-to-Audio Synthesis》Q Yang, B Mao, Z Wang, X Nie... [Meituan University of Chinese Academy of Sciences] (2024) 网页链接 #机器学
………………………………