文章主题:衡宇, 凹非寺, 宇航员, 马
衡宇 发自 凹非寺
量子位 | 公众号 QbitAI宇航员骑马奔驰,配什么BGM比较飒?这活交给AI试试!
输入文本“宇航员骑大马”,秒速生成一段1分钟的音频:
emmm……听起来好动感!
是的没错,AI可以基于文字提示生成音乐!
在此段演示视频中,我们采用了基于Deforum Stable Diffusion的Colab页面代码进行优化改进。
这只新项目的名字叫Mubert API,已在Github开源,获得1000多的标星。
推特上也有不少人已经用Mubert API生成音频,来给自己的视频配乐了。
试听过的友友们这样留言:
音乐由真人谱曲、AI组曲
在演示视频里面,这个text-to-music的AI,实际生成效果听起来还不错。
那不如来看看,Mubert API是怎么工作的吧。
大概的工作流程是这样的:
音乐人谱曲后上传→AI进行风格分类→用户输入文本→AI用demo组曲→生成个性化音乐换句话说,尽管Mubert API在执行文本转音乐的任务时,涉及到AI的部分仅限于两个步骤,但API本身仍具备一定的功能和能力。
分类demo + 根据提示文本组合demo成曲。
简而言之,最后生成的音乐,是由真人谱曲、AI组曲。
具体是怎么回事呢?
回到第一个步骤,音乐人们制作好demo,上传到Mubert。
这种方法之所以被采用,而不是通过AI学习音乐人样本后自行创作新的音乐,主要是因为Mubert秉持着“从创造者到创造者”的理念。
目前,音乐人们上传的超过150万个demo进入Mubert API的音乐库。
为了让用户们玩得开心,Mubert买下了所有demo的版权。
在线玩耍后生成的音乐,可以免费用来配图或配视频画面。
要在各个社交平台分享的话,务必@mubertapp并带上#mubert话题。
然而,在DSP(包括Spotify、Apple Music和Deezer等平台)上发布原创内容是不被允许的。
至于商用,得是另外的价钱。
Demo上传、入库以后,AI识别音乐风格,将它们分组归类,以便于打标签。
前期工作准备就绪,现在来说说具体操作流程。
用户需要输入一句话作为提示文本,再加几个Mubert API标签。
注意,生成音乐的时长可以调节,要不要进行循环、选取哪一段开始循环,也都可以凭你喜欢。
比如宇航员骑大马,配的标签就是“空间”“萨克斯”“旅行”。
在Transformer模型中,输入的文本信息会被转化为潜在空间中的向量形式。随后,AI系统会从中挑选出与提示词以及标签最为相似的标记向量,作为最终的输出结果。
也就是说,AI经过分析后,会选择符合提示文本的音乐demo,把它们排列组合。
如此这般,根据文本生成的个性化音乐,出现了!
值得一提的是,即便输入相同的提示文本,生成雷同音乐的可能性也比较小。
因为所有的音乐,是在提交请求的时候即时生成的,而不是从已有的曲目库中直接拿来用。
一经开源,网友们已经玩儿开了。
日本网友用来生成和风流行音乐(但他也很疑惑,和印象里的日本音乐不咋一样哈)。
当然,也有人尝试了用Mubert API给即将到来的万圣节增加一点恐怖气氛。
有玩家在使用Mubert API进行音乐创作后反馈称,该API在生成音乐的过程中,仅能通过提示文本和标签来传达某种音乐氛围,却无法直接指定具体的节奏和旋律。
Mubert系列
浅看了一下官网,除了Mubert API,Mubert系列还有另外几个项目。
根据既有标签生成音乐的Mubert Render。
和API相比,它棋差一招,没办法让用户手动输入提示文本。
但玩儿的人不少,页面上还有很多已生成音乐在推荐位上。
以及,专供音乐人们上传自己音乐demo,赚点小钱钱的Mubert Studio。
(你说说,和API形成闭环了不是)
也不复杂,简简单单一注册就可。
还有个叫Mubert Play的App。
你在做运动、放松或者冥想的时候,需要的听歌软件又添一员。
有那么一点小遗憾,除了自行运行开源代码,现在普通玩家还不能玩上网页版。
好在创作团队在Twitter上放话:
Mubert API很快就能够在官网上线!会尽快开发一个简单易用、用户友好的Web界面。再等等吧!
Github地址:
https://github.com/MubertAI/Mubert-Text-to-MusicMubert官网:
https://mubert.com/—完—
@量子位 · 追踪AI技术和产品新动态
深有感触的朋友,欢迎赞同、关注、分享三连վᴗ ի ❤
AI时代,拥有个人微信机器人AI助手!AI时代不落人后!
免费ChatGPT问答,办公、写作、生活好得力助手!
搜索微信号aigc666aigc999或上边扫码,即可拥有个人AI助手!