主要观点总结
本文主要报道了第32届ACM国际多媒体会议(ACM MM 2024)的举行情况,详细介绍了会议的关键点和获奖论文。会议于澳大利亚墨尔本举行,涵盖大规模图像视频分析、社会媒体研究等热门方向。报道特别介绍了三篇获奖论文及其研究内容,包括最佳论文、最佳学生论文和其他奖项等。
关键观点总结
关键观点1: 第32届ACM国际多媒体会议(ACM MM 2024)在澳大利亚墨尔本举行。
会议涵盖大规模图像视频分析、社会媒体研究等多媒体领域的热门方向。
关键观点2: 最佳论文《From Speaker to Dubber: Movie Dubbing with Prosody and Duration Consistency Learning》解决了电影配音的数据集限制和背景噪音干扰问题,提出了一种两阶段的配音方法。
关键观点3: 最佳学生论文《AV-Deepfake1M: A Large-Scale LLM-Driven Audio-Visual Deepfake Dataset》介绍了一个大规模音视频深度伪造数据集,对于构建下一代深度伪造定位方法具有重要意义。
关键观点4: 另外一篇论文《An In-depth Study of Bandwidth Allocation across Media Sources in Video Conferencing》分析了视频会议应用中的带宽分配策略,并研究了其对用户体验质量的影响。
文章预览
【导读】 第32届ACM国际多媒体会议(ACM MM)于2024年10月28日至11月1澳大利亚墨尔本举行。 最佳论文,最佳学生论文,最佳demo, 最佳开源软件在内的所有多媒体领域大奖都已出炉。 ACM国际多媒体会议(ACM International Conference on Multimedia, 简称自1993年首次召开以来,ACMMM每年召开一次,已经成为多媒体领域顶级会议,也是中国计算机学会推荐的A类国际学术。会议热门方向有大规模图像视频分析、社会媒体研究、多模态人机交互、计算视觉、计算图像等等。 最佳论文 标题 : From Speaker to Dubber: Movie Dubbing with Prosody and Duration Consistency Learning (从说话者到配音演员:基于韵律和时长一致性学习的电影配音 ) 作者 : Zhedong Zhang, Liang Li, Gaoxiang Cong, Haibing YIN, Yuhan Gao, Chenggang Yan, Anton Hengel, Yuankai Qi 摘要: 电影配音旨在将剧本转换为与给定电影片段在时间和情
………………………………