字节音乐大模型炸场！Seed-Music发布，支持一键生成高质量歌曲、片段编辑等

机器之心 · 公众号 · AI · 2024-09-19 12:45

主要观点总结

本文介绍了机器之心发布的高质量音乐生成系统Seed-Music，其具备灵活控制能力的音乐生成系统，包括Lyrics2Song、Lyrics2Leadsheet2Song、Music Editing、Singing Voice Conversion四大核心功能。文章详细阐述了Seed-Music解决AI音乐创作面临的挑战的方式，以及其统一框架的实现方式，包括基于音频token、符号音乐token和声码器latent的三种链路。此外，文章还讨论了Seed-Music在社交属性方面的潜力以及未来可能出现的新场景。

关键观点总结

关键观点1: Seed-Music的主要功能

Seed-Music是一个具有灵活控制能力的音乐生成系统，包含Lyrics2Song、Lyrics2Leadsheet2Song、Music Editing和Singing Voice Conversion四大核心功能，可以生成高质量的音乐并提供灵活编辑能力。

关键观点2: AI音乐创作的挑战

目前AI音乐创作面临的主要挑战包括音乐信号的复杂性、评估标准的缺乏以及用户需求的多样性。各家公司在音频、演奏、曲谱层面进行了建模尝试，但人工评测仍必不可少。

关键观点3: Seed-Music的创新点与优势

Seed-Music通过采用创新的统一框架，结合语言模型和扩散模型的优势，并融入符号音乐的处理，能够更好地满足不同群体的音乐创作需求。其通过lead sheet来编辑音乐，显著提高了模型的实用性。此外，Seed-Music还提供了简单有趣的创作场景，如文生音乐、音频仿写等。

关键观点4: Seed-Music的技术细节

Seed-Music的实现基于统一框架，包含表征模型、生成器和渲染器三个核心组件。其采用了基于音频token、符号音乐token和声码器latent的三种链路来处理不同的音乐创作任务。此外，Seed-Music还经历了预训练、微调和后训练三个阶段，以提高模型的稳定性和性能。

关键观点5: Seed-Music的社交属性与未来潜力

Seed-Music将音乐生成自然地嵌入不同创作群体的工作流中，使AI音乐具备独特的社交属性。未来，可能会涌现出更多创作音乐、欣赏音乐、分享音乐的新场景，激发社交新场景的出现。

文章预览

机器之心发布机器之心编辑部高质量音乐生成、高灵活音乐编辑，Seed-Music 再次打开了 AI 音乐创作的天花板。放假期间，本 i 人又领教了被 e 人支配的恐惧。跟 e 人朋友出门玩，先被拉去饭局尬聊，再和陌生人组队打本，下面这首歌真是唱出了 i 人心声。后两天假期就舒服多了。通关了黑神话悟空还不过瘾，我在家补经典 86 版的《西游记》。无论多少次重温，还是会被大圣的魅力吸引。这歌怎么样，是不是感觉斗战胜佛活灵活现，如在眼前？实际上，两首歌都并非真人所作，而是全靠字节最新发布的音乐大模型 ——Seed-Music。 Seed-Music 官网：https://team.doubao.com/seed-music 据豆包大模型团队官网介绍，Seed-Music 是一个具有灵活控制能力的音乐生成系统，包含 Lyrics2Song、Lyrics2Leadsheet2Song、Music Editing、Singing Voice Conversion 四大核心功能，具体涵盖十种创 ………………………………

原文地址：访问原文地址
快照地址：访问文章快照
总结与预览地址：访问总结与预览

分享到微博