AI舞王风靡社交圈，通义千问新功能引爆网络潮流

文章主题：兵马俑, 通义千问, 新功能, 人工智能

兵马俑跳科目三，通义千问新功能火了

只要一张照片就能生成一段舞蹈视频，又一个大模型应用出圈！

在2024年的首个工作日起，一种全新的网络现象开始在我国的社交媒体和朋友圈中迅速传播开来，那就是兵马俑、马斯克以及全国各地的网友们纷纷上传了自己跳科目三和网红舞的视频。这些视频的长度大约为10秒钟左右，它们都是由人工智能技术生成的虚拟人物出镜表演，而非真实的人物。这种方式低门槛的“跳舞”方式，引发了广大网友们的热烈讨论和积极参与，从而掀起了一股新的斗舞热潮。在这些视频中，网友们金句频出，他们对这种新型的“跳舞”方式进行了各种幽默和创意的表达。例如，“AI治愈了我的四肢不协调”，“科目三的风吹到了考古界”和“再也不用担心跳科目三崴脚”，这些都成为了网友们津津乐道的经典语句。总的来说，这种由人工智能技术生成的低门槛“跳舞”方式，不仅给网友们带来了全新的娱乐体验，也让他们在使用人工智能技术的过程中，感受到了人工智能技术的魅力和便利。

阿里云通义千问APP推出了一个免费功能，用户只需在APP内输入特定的口令如“通义舞王”或“全民舞王”，便可立即进入相应的体验页面。接下来，用户需要根据提示上传一张个人照片。经过短短十几分钟的等待，系统便会生成一支既保留了原形象面部表情、身材比例、服装及背景等特征，又具有独特舞姿的舞蹈视频。值得一提的是，通义千问APP现已有12种热门舞蹈模板，包括科目三、蒙古舞、划桨步和鬼步舞等。

据报道，阿里通义实验室自主研发的视频生成模型Animate Anyone，是这一功能的背后算法。早在去年11月底，这项技术已经在推特、YouTube等海外社交媒体平台上引起广泛关注，相关的视频播放量突破了1亿大关。在GitHub上，该项目仅用了几天时间就收到了超过1万的Star，这使得它成为了近期大模型领域最受关注的算法之一。国外开发者和网友们纷纷对这项技术的成果表示赞赏，并呼吁开源体验该算法的更多信息。

该算法在生成效果方面的惊艳表现引起了广泛的关注，同时，其技术路径也受到了广泛关注。在当前的大模型领域中，视频生成被视为最具潜力的研究方向之一，谷歌、Meta、Runway等国际科技巨头纷纷投入巨资进行布局。然而，尽管视频生成领域充满了机遇，但在人物形象的视频生成方面，仍然面临着诸多技术难题，如保证人物形象的一致性、实现动作的流畅与可控、确保时序无瑕疵的人物动作视频等。

一篇公开论文揭示，Animate Anyone技术整合了众多创新元素，其中最具代表性的是引入了ReferenceNet。这一技术的运用，使得它能够捕获并保存原始图像的信息，从而在很大程度上实现了人物、表情以及服装细节的高度还原。此外，该算法还配备了高效的Pose Guider姿态引导器，确保了动作的精确度和可控性。同时，通过时序生成模块，Animate Anyone成功地保障了视频帧之间的连贯性和流畅性。经过在同一数据集的对比测试，Animate Anyone的表现明显超越了国内外的同类模型，展现了其卓越的技术实力。

今年9月，通义千问成国内首批通过备案的大模型，通义千问APP上线后功能持续升级，目前可提供文本对话、语音对话、翻译、PPT大纲助手、小红书文案、视频生成等几十项功能。返回搜狐，查看更多

责任编辑：

AI时代，拥有个人微信机器人AI助手！AI时代不落人后！

免费ChatGPT问答，办公、写作、生活好得力助手！

搜索微信号aigc666aigc999或上边扫码，即可拥有个人AI助手！

相关文章

发表回复 取消回复

发表回复取消回复