文章标签:DALL·E, ChatGPT, 文生图工具, 图像生成
在人工智能领域,我们一直期待着能够出现一款能够绘制图像的AI模型。近日,OpenAI终于推出了他们的最新产品——DALL·E 3。这款模型的推出,意味着能够通过简单提示,让机器自动绘制出复杂的图像,这无疑是对人工智能技术的一次重大突破。想象一下,如果我们能够通过简单的词语描述,就能够得到一幅生动形象的画面,这样的技术将会给我们的生活带来怎样的改变?这就是DALL·E 3带给我们的可能性。它不仅仅是一个绘画工具,更是一个全新的艺术形式。而在这个新的艺术形式中,有一幅画作格外引人注目,那就是“超级向日葵刺猬”。这幅画作是由DALL·E 3完成的,它以独特的视角和色彩搭配,展现出了一个充满想象力的世界。这幅画作的出现,无疑是对人工智能技术的极大肯定,也让我们对未来的艺术有了更多的期待。总的来说,DALL·E 3的推出,标志着人工智能在图像绘制领域的重大突破。而“超级向日葵刺猬”这幅画作的出现,更是为我们展示了一个充满可能性的未来。我们可以期待,在不久的将来,人工智能将会在艺术领域有着更大的作为。
作者 | 香草
编辑 | 李水青
今天凌晨,人工智能领域的领军企业OpenAI发布了一则重要消息,他们宣布将对其突破性的生成对抗网络(GAN)工具DALL·E进行升级,版本名为DALL·E 3。令人振奋的是,这次升级还将使其具备与ChatGPT进行原生集成的能力,从而进一步拓宽了其在自然语言处理、创意生成等领域的应用范围。
与去年发布的DALL·E 2相比,DALL·E 3在对相同提示词进行处理时,在理解深度和图像质量方面有了显著的提高。过去经常被用户所抱怨的“无法在图像上生成文字”的问题,也在这次的升级中得以解决。

DALL·E 3(右侧)与 DALL·E 2(左侧)生成的图像效果对比图如下所示。画面中,一个半透明玻璃制成的神秘心脏在风起云涌的海洋中独自耸立,仿佛在诉说着一个令人难以捉摸的故事。而阳光则穿透层云,洒向这颗心脏,将其照耀得如同宇宙一般璀璨。在这幅作品中,“寻找你内心的宇宙”这句话以粗体大字刻印在地平线上,以此提醒我们,在这个广袤的世界里,每个人都拥有属于自己的独特宇宙。
(图源:OpenAI、Sambhav Gupta)
DALL·E 3与 ChatGPT 的融合,堪称画质与智能的完美结合。借助于 ChatGPT 强大的自然语言理解能力,用户无需再学习如何运用适当的提示词来描绘心中所想,只需轻轻松松地与 ChatGPT 交流,即可顺利实现图像的呈现。
在ChatGPT中使用DALL·E 3直接生成图像(图源:OpenAI官网)
DALL·E 3, the upgraded version of the artificial intelligence image generation tool, is set to launch first for ChatGPT Plus and enterprise clients in October. It will later provide an API interface and become available to the general public in the fall.
OpenAI对于其DALL·E 3技术的安全性给予了极高的重视,并采取了全方位的安全保障措施。这些措施包括但不限于对暴力内容的严格限制,对含有公众人物图像的生成予以拒绝,同时亦对试图模仿在世艺术家的风格的行为予以禁止。尽管如此,OpenAI对创作者的权利也提供了充分的理解和支持,允许他们提交申请以删除自己的图像。
那么,DALL·E这次升级具体带来了哪些改变呢?又将与ChatGPT的结合产生怎样的化学反应?为了让我们更好地理解这些变化,OpenAI通过一段精彩的视频展示以及多张引人入胜的图像示例,为我们生动地阐述了DALL·E 3的卓越之处。
一、原生集成于ChatGPT,DALL·E 3可以直接“讲故事”了
DALL·E此次升级,最大的亮点无疑是与ChatGPT的原生集成。OpenAI称,现在的文生图系统大多将重点放在生成图像的质量和水准上,而忽略了文字和描述的重要性,这使得用户不得不学习复杂的提示词工程。
而DALL·E 3通过集成ChatGPT,使文字生成图像这一过程中的“文字”部分实现了质的飞跃。
过去,当用户使用DALL·E 2、Midjourney等文生图AI工具时,通常的做法是:首先通过ChatGPT等聊天机器人,用简单的提示词生成丰富的图像描述文本;然后再进入文生图软件,用图像描述文本生成图片。如果生成效果不佳,就需要反复操作多次,步骤十分繁琐。ChatGPT DALL·E 3的组合则直接省去了中间步骤,一步到位。
OpenAI提供了一个视频来展示DALL·E 3的使用效果。这是一个家长为5岁孩子将想象带到现实中的故事。
当家长询问:“我家5岁的宝宝总是提到一只‘超级向日葵刺猬’——它会长什么样子?”
ChatGPT生成了四段描述该刺猬的文字,随后根据文字生成了相应的图像。
家长选择了其中一张图像,追问道:“我的女儿说这只刺猬名字叫Larry,可以提供更多它的图像吗?”
ChatGPT此时根据用户选择的刺猬形象,生成了更多不同画风的图像。
随后,家长说想看看Larry的房子,ChatGPT便生成了一张Larry在房门口检查信箱的画面。
值得注意的是,他的信箱上甚至写着自己的名字“LARRY”。这意味着DALL·E 3实现了在图像上写字的功能。
结合ChatGPT的文字生成功能,这只小刺猬还可以拥有自己的“人设”。
当家长追问:“是什么让他如此‘了不起’?”ChatGPT回答,是因为他有着向日葵花瓣作为“刺”,并且很善良。
家长继续追问,他的善良是如何体现的?ChatGPT便生成了一幅漂亮的插画,画面上,Larry和蝴蝶、小鹿以及其他的小刺猬伙伴们一起在草丛上玩耍。
此外,ChatGPT在画风迁移方面也完成得很好。可以生成不同风格的Larry,比如贴纸风:
最后,当家长提出是否可以基于这些内容讲一个睡前故事,ChatGPT便生成了一个名为“了不起的向日葵刺猬Larry”的故事。
当然,ChatGPT也可以继续为自己讲的这个故事创作插图。
不得不说,ChatGPT和DALL·E的结合可以实现1 1
DALL·E, ChatGPT, 文生图工具, 图像生成