文章主题:AI生成内容, 人工智能, 音乐, 音乐创作
什么是AIGC?
AIGC(Al-Generated Content)是一种创新性的技术,它通过运用人工智能的方式,根据用户的特定需求,借助丰富的材料库生成了与之匹配的内容。如今,这一技术已在音乐、绘画、音频等多个艺术领域得到了广泛的应用,充分展示了人工智能带来的巨大潜力与创造力。
AIGC技术在音乐领域的应用已经超越了辅助音乐创作的范畴。如今,它已经开始被广泛应用于创新用户体验,为音乐平台带来更多的可能性。以Spotify为例,该公司的DJ模式就是利用AIGC技术优化推荐歌曲体验的一种尝试。此外,我国的QQ音乐等音乐平台也在积极利用AIGC技术,进行各种创新实践。
技术驱动的生产力释放,的确引发了人们对激烈竞争的担忧,以及对内容质量和价值被稀释的忧虑。然而,在音乐领域,人们对于人的价值的强调却成为了一种主流趋势。一方面,当前的人工智能尽管仍在学习现有信息的基础上进行,但与科幻电影中真正具备自我意识的AI相比,还有很大的差距。另一方面,基于人类感性的艺术创作仍然具有不可替代性。
正如音乐创新者尼克·凯维(Nick Cave)所阐述的,人工智能仅能模拟,却始终无法触及真正的人类体验。即便人类体验在未来可能被削弱至微不足道,它的价值依然不可忽视。
在科技的浪潮中,人类能力边界将被重新审视。目前,音乐产业的创新驱动力依然在于人类的创造力和内容创作才华。然而,人工智能技术的出现,有望进一步提升这一推动力,降低市场阻力,从而使内容创作和传播变得更加高效。
人工智能作曲或成为未来方向
在某平台上,一些关于AI孙燕姿的的作品引发了评论热潮。其中,有人称赞这些声音缺乏情感,却具有孙燕姿的独特风味;而另一些人则认为翻唱质量不佳,甚至担忧这种技术未来在法律上的应用价值。尽管如此,AI音乐创作的实践并非新鲜事物。根据中央音乐学院音乐人工智能与音乐信息科技系的教师、青年作曲家巩子晗的介绍,AI生成的音乐主要涉及两个领域:AI作曲和AI歌唱。AI作曲可以进一步细分为基于规则生成和机器学习生成两种类型,而AI歌唱则主要包括AI合成和AI换声。自20世纪60年代起,美国便开始探索人工智能作曲的研究,而在2009年后,随着机器学习技术的进步,人工智能实现了显著的跨越式发展,逐渐被应用于音乐创作中。
“事实上,AI‘基于规则生成’和‘机器学习生成’的曲子,目前都可能存在生成结果不稳定、旋律简单重复等问题,不完全符合人类的审美。”巩子晗说,实际使用ChatGPT-4后,十分震撼。虽然目前ChatGPT-4不能直接生成曲谱,只能生成歌词并在歌词基础上以文字形式标注和弦,但是AI、ChatGPT-4的综合能力极强,且进步速度飞快。“未来,人工智能作曲一定是一个发展方向。音乐人工智能或将在这类集成式人工智能软件里面实现。”巩子晗说。
AI推动音乐内容制作和传播
相较于AI作曲,AI歌唱的应用则相对广泛和成熟。巩子晗介绍,目前,在换声方面,无论是“AI孙燕姿”使用的技术还是国内外不同科研人员开发的换声软件,在接近真人演唱方面已经有了很大进步。AI合成声音,在近年来出现的“虚拟偶像”应用上也不鲜见。
中国传媒大学音乐与录音艺术学院音乐传播教研室主任李小莹认为,“虚拟偶像”类AI技术的应用不仅不会对音乐行业造成冲击,反而丰富了音乐的表现形式,降低了制作成本。在前不久举办的第二十期“E法数字音乐论坛”上,李小莹师生团队发布的《网络直播领域音乐生态发展研究报告》(以下简称《报告》)指出,伴随各类网络直播平台的兴起,通过网络直播展示音乐才艺、分享地方民乐、开展音乐教学等内容层出不穷。与此同时,近年来中国网络音乐用户规模也持续增长,当前用户规模已达6.84亿,约占网民整体的64.1%。《报告》也关注到了AIGC。
《报告》提到,在音乐领域,人工智能的引入带来了巨大变革。中国数字音乐市场迅速扩大,音乐人群体不断壮大,市场对低门槛音乐制作工具的需求日益增加。针对这一趋势,一些公司积极探索利用AI技术推动音乐内容的创作和传播。例如,腾讯音乐通过推出“一站式”音乐服务平台和音色制作工具,为音乐人提供更高效的创作环境,并推动高质量内容产生。《报告》认为,如今,中国已成为全球第五大音乐市场,技术的进步为音乐产业在数字化时代的发展奠定了坚实基础,提高了生产效率。音乐与AIGC等新技术相结合,为文化创造更多价值奠定了基础。此外值得关注的是,近年来,“数字人”(运用数字技术创造出来的、与人类形象接近的数字化人物形象)越来越多地进入各类平台,甚至进入直播领域,成了“数字主播”。《报告》认为,人工智能技术赋予了“数字人”更强大的理解能力、对话能力,甚至肢体动作表现力。通过AI的加持,“数字人”的外观形象更加栩栩如生,与人进行对话也更加自然流畅,使得人机交互不再局限于简单的对话,而变成了一种沟通交流。
END
AIGC目前在音频领域的应用主要有TTS (Text to Speech)、浯音克隆、AI乐曲/歌曲生成。
此类技术可应用于流行歌曲、乐曲、有声书的内容创作,以及视频、游戏、影视等领域的配乐创作,大大降低音乐版权的采购成本。
目前,TTS发展相对成熟,多应用于客服及硬件机器人、有声读物制作、语音播报等任务。而语音克隆技术目前被应用于虛拟歌手演唱、自动配音等,在声音IP化的基础上,对于动画、电影、以及虛拟人行业有重要意义。
Al乐曲/歌曲生成方面,AIGC目前可以支持基于开头旋律、图片、文字描述、音乐类型、情绪类型等生成特定乐曲。音乐生成任务中仍需解决音乐数据难以标注的问题,数据标注其颗粒度大小影响音乐生成任务的可控性。若可控性得以解決,则可指定风格、情绪等因素的音乐生成任务有希望在影视、游戏等场景下的到大量应用。
未来已来,多少年不可知,但是可以预见的是,Al的“Phone时刻”已来。
over
文章部分内容(图文)源于网络整理,不用于商业用途如有异议请联系后台。我们将会及时处理,谢谢!
AI时代,拥有个人微信机器人AI助手!AI时代不落人后!
免费ChatGPT问答,办公、写作、生活好得力助手!
搜索微信号aigc666aigc999或上边扫码,即可拥有个人AI助手!