AI视频生成崛起：StableDiffusion等企业加速跟进

文章主题：AI视频生成, Stable Diffusion, 万兴科技

AI视频生成崛起 Stable Diffusion万兴科技等密集“秀肌肉”

2023-11-30 16:42:29 作者：姚立伟

在AIGC庆祝其“周年庆”的同時，OpenAI方面则在不斷地進行著“宫鬥”，而在另一邊，則有“猩球崛起”的故事正在上演。僅需半個月的時間，來自 Meta、Adobe、Runway、Stable Diffusion以及萬兴科技等国内外科技巨頭和AI獨角獸公司的們正在積極加速地驶入AI文生視頻領域。

在11月16日，Meta公司发布了一组全新的AI视频编辑功能，其中包括两款具有革命性的工具。首先是由名为“Emu Video”的工具，它可以根据输入的字幕、图像和文字描述，自动生成四秒钟的视频。其次则是名为“Emu Edit”的工具，它使用户能够通过输入文本指令，更加便捷地进行视频的修改和编辑。这两款工具提供了一个非常实用的方式，让用户能够在没有专业图像编辑经验的情况下，完成从图片中删除或替换物体的操作。

在11月22日，知名人工智能公司Stability AI推出了一款具有创新性的AI模型——Stable Video Diffusion。这款模型具备强大能力，能够根据现有的图片来生成高质量的视频内容。事实上，Stable Video Diffusion是由两大核心模型构成，分别为SVD和SVD-XT。其中，SVD能将静态的图片转换成14帧的视频，而SVD-XT则将帧数提升至24帧，为视频制作提供了更为丰富的画面效果。

在同一天，AI视频生成领域的一家知名企业Runway正式宣布推出了一款全新的“运动笔刷”功能。这款功能使得用户能够轻松地在图片中指定一个区域或主体，并为它选择一个运动方向以及相应的运动强度。一旦这些设置完成，运动笔刷就能够为用户的生成添加精确的运动效果。这一创新功能展示了Runway在AI视频生成技术方面的持续领导地位，也为广大用户提供了一种更加便捷、高效的处理运动动画的方式。

Runway的运动笔刷功能可生成受控运动

在11月23日，Adobe公司正式宣布了一项重要消息，即对AI初创公司Rephrase.ai进行了收购。Rephrase.ai具备独特的能力，能够将文字脚本与用户头像转换成具有用户形象的短视频，从而为企业营销、客户交流以及节日问候等商业场景提供有力的支持。值得一提的是，这不仅是Adobe在人工智能领域的一次突破性收购，更是该领域的一次重大进展。

在11月24日的晚上，AIGC软件公司的A股上市公司——万兴科技（股票代码：300624.SZ）在官方网站的视频号上发布了一部由AI创作的长短短视频《女孩的一生》。这部作品充分展示了万兴科技的多媒体大规模模型的视频生成能力。在这个大模型的支持下，用户只需要提供故事梗概或者片段脚本，就能够控制视频的起始帧内容。借助于大模型的强大功能，用户可以轻松实现全新视频内容的完整生成。

万兴“天幕”大模型生成视频《女孩的一生》截图

此前,万兴科技已预告过“天幕”大模型。据介绍,“天幕”是国内首个专注于以视频创意应用为核心的多媒体大模型,由视频大模型、音频大模型、图片大模型、语言大模型组成,具备一键成片、AI美术设计、文生音乐、音频增强、音效分析、多语言对话等核心能力,并在视觉、听觉等多模态关键能力上持续迭代。

作为国内AIGC领域的领跑者,万兴科技正持续深化AIGC布局,已推出万兴爱画、万兴播爆、万兴智演、Wondershare Kwicut、Wondershare VirtuLook等AIGC创意新品;旗下万兴喵影、Wondershare PDFelement、万兴PDF、亿图图示、亿图脑图、墨刀海外版Mockitt等产品均已集成AIGC能力,并持续优化上新。

11月29日,AI初创公司Pika Labs正式推出AI视频生成器的1.0版本。Pika Labs 1.0采用全新的AI模型,能够以3D动画、动漫、卡通和电影等不同风格生成和编辑视频。产品一经推出,便吸引无数AI届大佬“打call”,并迅速斩获5500万美元融资,俨然成为AI视频生成届最新“顶流”。

最新AI视频生成“顶流”Pika Labs

事实上,在本轮AI浪潮中,文生文、文生图一直并行发展,ChatGPT代表了文字生成的率先突破,Midjourney将文生图推到人人可用,并随着时间线的逐渐拉长迎来了无数的新玩家。在“先行者”的指引下,新入局玩家们显然少走了很多弯路,两条赛道的竞争也已渐趋白热化。

与文生文、文生图的直接生成即可使用不同,视频的底层原理是多帧图像的组合,文生视频/图生视频需要在文生图的基础上增加时间维度。这意味着计算成本高昂——一个短视频每秒包含大约30帧图像,单个视频片段有数百数千帧,为确保每一帧之间空间和时间的一致性,需要大量的计算资源。

此外,复杂信息难以处理——视频带有视觉动态信息,添加不同帧之间的时间信息后,对视频内容进行建模变得非常具有挑战性。

最后,算法稳定性的高强度要求——视频对连贯性的高要求,意味着文生视频/图生视频算法需保证每一帧画面的AI生成都需要有高相关性及连续、流畅的变化。

万事都是一体两面的。AI视频生成技术仍在快速迭代、飞速进化中,而其中又将孕育出多少新的机遇,都还是未知数。唯一确定的是,现在已入局的玩家们,显然已抢到了百舸争流的先机。返回搜狐，查看更多

责任编辑：

AI时代，拥有个人微信机器人AI助手！AI时代不落人后！

免费ChatGPT问答，办公、写作、生活好得力助手！

搜索微信号aigc666aigc999或上边扫码，即可拥有个人AI助手！

相关文章

发表回复 取消回复

发表回复取消回复