文章标签:智东西, OpenAI, DALL·E, ChatGPT
作者 | 香草
编辑 | 李水青
今日凌晨,人工智能领域的重要参与者OpenAI公司发布了一则令人振奋的消息。他们宣布将对其突破性的生成模型DALL·E进行升级,将其提升至DALL·E 3版本,并计划将其与另一款备受关注的AI模型ChatGPT进行深度整合。这一举措无疑将极大地推动人工智能技术的发展,也预示着未来智能领域的无限可能。
与去年发布的DALL·E 2相比,DALL·E 3在对相同提示词进行处理时,在理解深度和图像生成质量方面均取得了显著的进步。过去常被用户所抱怨的“无法在图像上生成文字”的问题,也在这次升级得到了有效的解决。
DALL·E 3(右侧)与 DALL·E 2(左侧)的图像效果对比图如下所示。画面中,一个由半透明玻璃制成的神秘人类心脏在风起云涌的海洋环境中屹立。阳光透过乌云的缝隙,洒向这颗心脏,使其显得更加生动。这幅画面仿佛是在向我们展示一个微缩的宇宙。而“寻找你内心的宇宙”这句鼓励人们探索内心世界的话语,则以粗体大字刻印在地平线上,更具冲击力。图片来源于 OpenAI 和 Sambhav Gupta。
DALL·E 3与 ChatGPT 的融合,堪称画质与智能的完美结合。借助于 ChatGPT 强大的自然语言理解能力,用户无需再学习如何运用适当的提示词来描绘心中所想,只需轻轻松松地与 ChatGPT 交流,即可顺利实现图像的呈现。
▲在ChatGPT中使用DALL·E 3直接生成图像(图源:OpenAI官网)
DALL·E 3的升级版将于10月初启动公测,优先面向ChatGPT Plus和企业版用户。随后,我们计划在秋末提供API接口,并正式对公众开放。
OpenAI对于其DALL·E 3技术的安全性给予了极高的重视,并采取了全方位的安全措施。这些措施包括但不限于对暴力内容的限制,对含有公众人物图像的生成予以拒绝,以及禁止模仿在世艺术家的风格。同时,该平台也提供了创作者提交删除自己图像的申请的权限,从而确保了图像使用的合法性和安全性。
那么,DALL·E这次的升级具体带来了哪些改变呢?而与ChatGPT的结合又会产生怎样的化学反应?为了让我们更好地理解这些变化,OpenAI通过一个视频演示以及多张图像示例,为我们直观地呈现了DALL·E 3的卓越之处。
一、原生集成于ChatGPT,DALL·E 3可以直接“讲故事”了
DALL·E的升级版块中,最引人注目的特点便是其与ChatGPT的原生整合。据OpenAI介绍,当前许多文生图系统过于注重生成图像的质量和技术水平,却忽视了文字描述的关键性。这就导致了用户必须掌握繁琐的提示词操作。然而,DALL·E的升级版块将改变这一现状,它将有助于解决文本和描述在文生图系统中长期被忽视的问题。
而DALL·E 3通过集成ChatGPT,使文字生成图像这一过程中的“文字”部分实现了质的飞跃。
过去,当用户使用DALL·E 2、Midjourney等文生图AI工具时,通常的做法是:首先通过ChatGPT等聊天机器人,用简单的提示词生成丰富的图像描述文本;然后再进入文生图软件,用图像描述文本生成图片。如果生成效果不佳,就需要反复操作多次,步骤十分繁琐。ChatGPT DALL·E 3的组合则直接省去了中间步骤,一步到位。
OpenAI提供了一个视频来展示DALL·E 3的使用效果。这是一个家长为5岁孩子将想象带到现实中的故事。
当家长询问:“我家5岁的宝宝总是提到一只‘超级向日葵刺猬’——它会长什么样子?”
ChatGPT生成了四段描述该刺猬的文字,随后根据文字生成了相应的图像。
家长选择了其中一张图像,追问道:“我的女儿说这只刺猬名字叫Larry,可以提供更多它的图像吗?”
ChatGPT此时根据用户选择的刺猬形象,生成了更多不同画风的图像。
随后,家长说想看看Larry的房子,ChatGPT便生成了一张Larry在房门口检查信箱的画面。
值得注意的是,他的信箱上甚至写着自己的名字“LARRY”。这意味着DALL·E 3实现了在图像上写字的功能。
结合ChatGPT的文字生成功能,这只小刺猬还可以拥有自己的“人设”。
当家长追问:“是什么让他如此‘了不起’?”ChatGPT回答,是因为他有着向日葵花瓣作为“刺”,并且很善良。
家长继续追问,他的善良是如何体现的?ChatGPT便生成了一幅漂亮的插画,画面上,Larry和蝴蝶、小鹿以及其他的小刺猬伙伴们一起在草丛上玩耍。
此外,ChatGPT在画风迁移方面也完成得很好。可以生成不同风格的Larry,比如贴纸风:
最后,当家长提出是否可以基于这些内容讲一个睡前故事,ChatGPT便生成了一个名为“了不起的向日葵刺猬Larry”的故事。
当然,ChatGPT也可以继续为自己讲的这个故事创作插图。
不得不说,ChatGPT和DALL·E的结合可以实现1 1
智东西, OpenAI, DALL·E, ChatGPT