文章主题:IT之家, 11 月 30 日消息, Stability AI, SDXL Turbo

666AI工具大全,助力做AI时代先行者!

近日,知名科技媒体IT之家报道了一则关于Stability AI公司推出的最新产品——Stable Diffusion XL Turbo(简称SDXL Turbo)的消息。SDXL Turbo是先前SDXL模型的升级版,其最大亮点在于采用了业界领先的“对抗性扩散蒸馏技术(Adversarial Diffusion Distillation)”。这一技术的应用使得SDXL Turbo在图片生成的迭代步骤方面有了显著的提升,从原先的50步缩短到了仅需1步。这意味着,用户只需进行一次迭代步骤,就能轻松生成出高质量图像。

据悉,Stable Diffusion XL Turbo 模型的最大特点,就是上述“一次迭代生成图像”,号称可以进行“即时文字转图像输出”,并能够保证图片的质量

“对抗性扩散蒸馏技术”是一种融合了“蒸馏技术”与“对抗训练”的技术,其核心在于利用现有的大型图像扩散模型作为“教师网络”,引导并优化模型的生成过程。具体而言,这种技术通过“蒸馏技术”,也就是将大型模型的知识进行提炼与精简,使其能够被更小的模型所吸收,从而提高模型的学习效果。同时,借助对抗性训练,模型得以改进,进一步提升其对教师模型输出的模拟能力。

在过去的模型蒸馏过程中,效率与品质的平衡一直是一个难题。由于快速采样往往会牺牲输出品质,因此,Stable Diffusion XL Turbo模型的出现,标志着在高效生成高品质图像方面,对抗性扩散蒸馏技术取得了显著的突破。

在本次研究中,我国官方对比了Stable Diffusion XL Turbo模型与多种不同模型变体,如StyleGAN-T、OpenMUSE、IF-XL、SDXL以及LCM-XL。为了全面评估这些模型的性能,我们采用了两个实验来检验它们的能力。在第一个实验中,我们让模型评估人员随机观察并比较两项模型的输出结果,然后从中挑选出最符合题目要求的输出图像。这个实验旨在考察模型在不同输入条件下的响应能力和准确性。第二个实验的设计与第一个实验非常相似,只是在具体操作上略微调整。在这个实验中,模型评估人员需要从多个模型输出中挑选出品质最佳的图像。这样的设置有助于我们进一步了解模型在图像质量上的优势和劣势。综合这两个实验的结果,我们可以得出以下结论:Stable Diffusion XL Turbo模型在多项评估指标上均表现出较高的水平,不仅在符合题目要求的图像选择上表现出色,同时在图像品质方面的优势也相当明显。这使得该模型在当前的研究领域具有很高的竞争力。

▲ 图源 Stability AI 博客

实验结果显示,Stable Diffusion XL Turbo 在大幅降低运算需求的同时,仍可以保持良好的图像生成品质,该模型单词迭代,即胜过 4 次迭代的 LCM-XL,而 4 次迭代的 Stable Diffusion XL Turbo 就可击败此前经过 50 步迭代配置的 Stable Diffusion XL;在 A100 GPU 上,计算 512×512 分辨率的图像,只需 207 毫秒

举报/反馈

AI时代,拥有个人微信机器人AI助手!AI时代不落人后!

免费ChatGPT问答,办公、写作、生活好得力助手!

搜索微信号aigc666aigc999或上边扫码,即可拥有个人AI助手!

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注