文章主题:实时, SDXL Turbo, 人工智能图像合成, 对抗性扩散蒸馏

666AI工具大全,助力做AI时代先行者!

Stable Diffusion XL Turbo可以以“实时”的速度生成AI图像

在家中,Stable Diffusion XL Turbo(SDXL Turbo)同样能够展现出令人惊奇的图像生成速度。

在周二的一次重要活动中,Stability AI公司发布了一款具有革命性的新模型——Stable Diffusion XL Turbo,这款人工智能图像合成模型能够在书面提示下迅速生成图像。值得一提的是,它的生成速度之快,甚至被公司 self-promoted 为“实时”图像生成工具,其转换速度甚至可以应对来自网络摄像头等多元来源的图像。

SDXL Turbo的显著突破在于其能够在一步之中完成图像产出,相较于其前身所需的20至50步有了巨大提升。稳定性AI将这种效率的提升归因于一项名为对抗性扩散蒸馏(ADD)的技术。ADD技术采用了分数提取的方式,模型能从现有的图像合成模型中学习和获取对抗性损失,从而提升了模型在区分真实图像与生成图像上的能力,最终确保了输出的真实性和准确性。

在周二发布的一份关于ADD技术的深度学习研究报告中,Stability AI深入剖析了该模型的核心运作机制。SDXL Turbo的一个显著优势在于,它在生成对抗网络(GAN)方面表现尤为出色,尤其是在生成单步图像输出方面具有显著的优势。

SDXL Turbo图像在较低步数下生成时,其细节表现不如在较高步数下生成的SDXL图像,这使得它并未成为先前型号的完美替代。然而,在速度优化方面,SDXL Turbo的表现却让人印象深刻。

在探索过程中,我们在Nvidia RTX 3060上使用Automatic111工具,对SDXL Turbo进行了本地运行(其权重与SDXL权重保持一致并降低)。如此操作下,大约4秒钟,我们可以生成3张1024×1024像素的图像;而对于细节程度相似的20步SDXL图像来说,这需要花费26.4秒。值得注意的是,较小的图像生成速度更快,仅需不到1秒(例如在512×768分辨率下)。当然,如果使用更强大的显卡,例如RTX 3090或4090,生成时间将会进一步缩短。与我们所期望的不同,SDXL Turbo图像在每张图像大约3-5步的位置展现出最佳的细节表现。

SDXL Turbo的生成速度就是所谓的“实时”。Stability AI表示,在NVIDIA A100(一款强大的AI调整图形处理器)上,该模型可以在207ms内生成一张512×512图像,包括编码、单个去噪步骤和解码。如果能够解决一致性问题,这样的速度可能会导致实时生成AI视频过滤器或实验性视频游戏图像生成。在这种情况下,一致性意味着在多个帧或代之间保持相同的主题。

目前,SDXL Turbo是在非商业研究许可证下提供的,限制其用于个人非商业目的。这一举措已经在Stable Diffusion社区受到了一些批评,但Stability AI表示对商业应用持开放态度,并邀请感兴趣的各方联系以获取更多信息。

与此同时,Stability AI本身也面临着内部管理问题,一位投资者最近敦促首席执行官埃马德·莫斯塔克(Emad Mostaque)辞职。据报道,Stability AI管理层一直在探索将公司出售给更大实体的可能性,但这并没有放慢Stability AI发布的节奏。就在上周,该公司发布了一款名为“稳定视频扩散”(Stable Video Diffusion)的软件,可以将静止图像转换为短视频剪辑。

Stability AI在其图像编辑平台Clipdrop上提供了SDXL Turbo功能的测试版演示。你也可以在 Hugging Face 上免费试用一个非官方的现场演示。显然,所有常见的警告都适用,包括缺乏训练数据的来源和滥用的可能性。即使有这些悬而未决的问题,人工智能图像合成的技术进步肯定不会放缓。

如果朋友们喜欢,敬请关注“知新了了”!返回搜狐,查看更多

责任编辑:

AI时代,拥有个人微信机器人AI助手!AI时代不落人后!

免费ChatGPT问答,办公、写作、生活好得力助手!

搜索微信号aigc666aigc999或上边扫码,即可拥有个人AI助手!

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注