StableDiffusionXLTurbo：实时生成AI图像的新突破

文章主题：实时, SDXL Turbo, 人工智能图像合成, 对抗性扩散蒸馏

Stable Diffusion XL Turbo可以以“实时”的速度生成AI图像

在家中，Stable Diffusion XL Turbo（SDXL Turbo）同样能够展现出令人惊奇的图像生成速度。

在周二的一次重要活动中，Stability AI公司发布了一款具有革命性的新模型——Stable Diffusion XL Turbo，这款人工智能图像合成模型能够在书面提示下迅速生成图像。值得一提的是，它的生成速度之快，甚至被公司 self-promoted 为“实时”图像生成工具，其转换速度甚至可以应对来自网络摄像头等多元来源的图像。

SDXL Turbo的显著突破在于其能够在一步之中完成图像产出，相较于其前身所需的20至50步有了巨大提升。稳定性AI将这种效率的提升归因于一项名为对抗性扩散蒸馏（ADD）的技术。ADD技术采用了分数提取的方式，模型能从现有的图像合成模型中学习和获取对抗性损失，从而提升了模型在区分真实图像与生成图像上的能力，最终确保了输出的真实性和准确性。

在周二发布的一份关于ADD技术的深度学习研究报告中，Stability AI深入剖析了该模型的核心运作机制。SDXL Turbo的一个显著优势在于，它在生成对抗网络（GAN）方面表现尤为出色，尤其是在生成单步图像输出方面具有显著的优势。

SDXL Turbo图像在较低步数下生成时，其细节表现不如在较高步数下生成的SDXL图像，这使得它并未成为先前型号的完美替代。然而，在速度优化方面，SDXL Turbo的表现却让人印象深刻。

在探索过程中，我们在Nvidia RTX 3060上使用Automatic111工具，对SDXL Turbo进行了本地运行（其权重与SDXL权重保持一致并降低）。如此操作下，大约4秒钟，我们可以生成3张1024×1024像素的图像；而对于细节程度相似的20步SDXL图像来说，这需要花费26.4秒。值得注意的是，较小的图像生成速度更快，仅需不到1秒（例如在512×768分辨率下）。当然，如果使用更强大的显卡，例如RTX 3090或4090，生成时间将会进一步缩短。与我们所期望的不同，SDXL Turbo图像在每张图像大约3-5步的位置展现出最佳的细节表现。

SDXL Turbo的生成速度就是所谓的“实时”。Stability AI表示，在NVIDIA A100（一款强大的AI调整图形处理器）上，该模型可以在207ms内生成一张512×512图像，包括编码、单个去噪步骤和解码。如果能够解决一致性问题，这样的速度可能会导致实时生成AI视频过滤器或实验性视频游戏图像生成。在这种情况下，一致性意味着在多个帧或代之间保持相同的主题。

目前，SDXL Turbo是在非商业研究许可证下提供的，限制其用于个人非商业目的。这一举措已经在Stable Diffusion社区受到了一些批评，但Stability AI表示对商业应用持开放态度，并邀请感兴趣的各方联系以获取更多信息。

与此同时，Stability AI本身也面临着内部管理问题，一位投资者最近敦促首席执行官埃马德·莫斯塔克（Emad Mostaque）辞职。据报道，Stability AI管理层一直在探索将公司出售给更大实体的可能性，但这并没有放慢Stability AI发布的节奏。就在上周，该公司发布了一款名为“稳定视频扩散”（Stable Video Diffusion）的软件，可以将静止图像转换为短视频剪辑。

Stability AI在其图像编辑平台Clipdrop上提供了SDXL Turbo功能的测试版演示。你也可以在 Hugging Face 上免费试用一个非官方的现场演示。显然，所有常见的警告都适用，包括缺乏训练数据的来源和滥用的可能性。即使有这些悬而未决的问题，人工智能图像合成的技术进步肯定不会放缓。

如果朋友们喜欢，敬请关注“知新了了”！返回搜狐，查看更多

责任编辑：

AI时代，拥有个人微信机器人AI助手！AI时代不落人后！

免费ChatGPT问答，办公、写作、生活好得力助手！

搜索微信号aigc666aigc999或上边扫码，即可拥有个人AI助手！

相关文章

发表回复 取消回复

发表回复取消回复