StabilityAI推出StableDiffusionXLTurbo模型：图像生成迭代步骤减半

文章主题：稳定性AI, Stable Diffusion XL Turbo, 对抗性扩散蒸馏技术, 图像生成

Stability AI 推出 Stable Diffusion XL Turbo 模型

近日，知名科技媒体IT之家报道了一则关于Stability AI公司推出的最新产品——Stable Diffusion XL Turbo（简称SDXL Turbo）的消息。SDXL Turbo是先前SDXL模型的升级版，其最大亮点在于采用了业界领先的“对抗性扩散蒸馏技术（Adversarial Diffusion Distillation）”。这一技术的应用使得SDXL Turbo在图片生成的迭代步骤方面有了显著的提升，从原先的50步缩短到了仅需1步。这意味着，用户只需进行一次迭代步骤，就能轻松生成出高质量图像。

据悉，Stable Diffusion XL Turbo 模型的最大特点，就是上述“一次迭代生成图像”，号称可以进行“即时文字转图像输出”，并能够保证图片的质量。

“对抗性扩散蒸馏技术”是一种融合了“蒸馏技术”与“对抗训练”的技术，其核心在于利用现有的大型图像扩散模型作为“教师网络”，引导并优化模型的生成过程。具体而言，这种技术通过“蒸馏技术”，也就是将大型模型的知识进行提炼和浓缩，使其能够被更小的模型所吸收。同时，借助“对抗训练”，模型得以改进，从而更好地模拟教师模型的输出。

在过去的模型蒸馏过程中，效率与品质的平衡一直是一个难以达到的目标。这主要是因为快速采样往往会牺牲输出品质。然而，Stable Diffusion XL Turbo模型的出现，标志着这一状况发生了改变。它采用了“对抗性扩散蒸馏技术”，不仅实现了高效生成高品质图像，更是在这个领域取得了重要的突破。

在本次研究中，我国官方对比了Stable Diffusion XL Turbo模型与多种不同模型的变体，如StyleGAN-T、OpenMUSE、IF-XL、SDXL以及LCM-XL。为了全面评估这些模型的性能，我们采用了两个实验来验证它们的效果。在第一个实验中，我们将模型评估任务交给随机抽取的两名评估人员，他们需要分别查看两个模型的输出结果，并从中挑选出那个更符合题目要求的输出图像。这个实验旨在检验模型在不同情况下对于给定提示词的反应能力，以及评估人员的主观判断对模型表现的影响。第二个实验的设计与第一个实验非常相似，只是在具体操作上略有不同。在这个实验中，评估人员需要从模型输出的众多图像中选出品质最佳的输出结果。这样的设置有助于我们进一步了解各个模型在图像品质方面的优势和劣势，从而为后续的研究和应用提供更有针对性的指导。总之，通过这两个实验，我们可以更加全面地了解Stable Diffusion XL Turbo模型以及其他模型变体之间的差异和特点。这为我们进一步优化和改进模型提供了宝贵的参考数据。

▲ 图源 Stability AI 博客

实验结果显示，Stable Diffusion XL Turbo 在大幅降低运算需求的同时，仍可以保持良好的图像生成品质，该模型单词迭代，即胜过 4 次迭代的 LCM-XL，而 4 次迭代的 Stable Diffusion XL Turbo 就可击败此前经过 50 步迭代配置的 Stable Diffusion XL；在 A100 GPU 上，计算 512×512 分辨率的图像，只需 207 毫秒。

IT之家注意到，目前 Stability AI 已经将相关代码公布在 Hugging Face，供个人和非商业用途使用，感兴趣的小伙伴们可以点此访问。返回搜狐，查看更多

责任编辑：

AI时代，拥有个人微信机器人AI助手！AI时代不落人后！

免费ChatGPT问答，办公、写作、生活好得力助手！

搜索微信号aigc666aigc999或上边扫码，即可拥有个人AI助手！

相关文章

发表回复 取消回复

发表回复取消回复