英伟达发布音频生成模型 Fugatto

奇客Solidot · 公众号 · AI 科技自媒体 · 2024-11-27 04:03

主要观点总结

英伟达展示了一款名为Fugatto的AI模型，用于生成音乐和音频。该模型能够根据文本提示修改声音和产生新的声音，面向音乐、电影和游戏制作商。新模型可以创造独特的声音，如改变乐器的声音，或改变歌曲中的人声和旋律。Fugatto建立在英伟达团队在语音建模、音频编码和音频理解等领域的工作基础上，并使用NVIDIA DGX超级计算机系统进行训练。

关键观点总结

关键观点1: 英伟达的AI模型Fugatto的用途和特点

该模型能根据文本提示修改声音和产生新的声音，面向音乐、电影和游戏制作商。它可以创造独特的声音，如改变乐器的声音和改变歌曲的人声和旋律。

关键观点2: Fugatto模型的技术基础

Fugatto建立在英伟达团队在语音建模、音频编码和音频理解等领域的工作基础上，使用英伟达的NVIDIA DGX超级计算机系统进行训练。

关键观点3: Fugatto模型的训练和使用

完整版本的Fugatto使用25亿参数，并在包含32个英伟达H100 Tensor Core GPU的超级计算机上进行训练。该模型可以通过开源数据进行训练。

文章预览

英伟达展示了一款用于生成音乐和音频的 AI 模型 Fugatto。该模型可以根据文本提示修改声音、产生新的声音。新模型面向音乐、电影和游戏制作商。它可以改变录音的口音和情绪，将钢琴演奏转换成人声歌唱，具体来讲，Fugatto 可以分离歌曲中的人声，添加乐器，将钢琴换成歌剧歌手来改变旋律。英伟达表示，新模型可以创造出“从未听过的声音”，比如可以使小号吠叫或者萨克斯发出猫叫声。Fugatto 建立在英伟达团队此前在语音建模、音频编码和音频理解等领域的工作基础上，完整版本使用 25 亿参数。新模型根据开源数据在包含 32 个英伟达 H100 Tensor Core GPU 的 NVIDIA DGX 超级计算机系统上进行训练。 https://fugatto.github.io/ https://www.thepaper.cn/newsDetail_forward_29459142 您的赞赏是对我们的鼓励，We’ll be more solid with your donations. ………………………………

原文地址：访问原文地址
快照地址：访问文章快照
总结与预览地址：访问总结与预览

分享到微博

推荐文章

新消费日报 · 苹果+阿里=iPhone中国AI？

2 天前

新消费日报 · 苹果+阿里=iPhone中国AI？

2 天前

SecWiki · SecWiki周刊（第571期）

2 天前

西藏举报 · 点击了解，刷单是怎么把你的钱“刷”没的？

2 天前

西藏举报 · 点击了解，刷单是怎么把你的钱“刷”没的？

2 天前

量子位 · 7118亿！马斯克出价收购OpenAI，奥特曼隔空阴阳：我711亿买推特还差不多

2 天前

AI前线 · “首席炒作官”Altman “碰瓷”摩尔定律引社区不满，1400万美元广告被批“都能训练3个DeepSeek V3了！”

3 天前

sundanjian · 二次函数压轴题拆分突破一二次函数与线段

2 月前

郑州大学 · 初冬绮梦——来拾取郑大的“金色记忆”！

2 月前

玩车教授 · 有快充，能跑222+km的代步神车！3万出头买到就赚！

4 周前

金铲铲阿助 · 血手契约阵容码和一图流

5 天前