《AI绘画新突破：OpenAImergeChatGPT助力创作》

文章标签:OpenAI, DALL·E, ChatGPT, AI 绘画

文 | 尚恩

编辑 | 邓咏仪

OpenAI 悄咪咪的又在半夜整活，这次直接把 AI 绘画和 ChatGPT 合并了！

来源：OpenAI

美国时间 9 月 21 日凌晨，OpenAI 官宣文生图 AI 工具 DALL · E 系列迎来最新版本DALL · E 3。相比上一代模型 DALL · E 2，DALL · E 3 自身的画技不仅提升巨大，还能准确理解语意、细节的细微描述差异。

去年DALL·E 2发布时，AI文生图模型再次成为热门话题，其中包括像Stable Diffusion这样的众多相关工具和模型。

更重要的是，这次 OpenAI 直接把DALL · E 3 和 ChatGPT集成到了一起。

新版DALL·E 3的推出，带来了一次革命性的变革。它跳过了传统的提示词工程（Prompt Engineering），让你可以尽情发挥想象力，不再受限于关键词的限制。只需轻轻一点，ChatGPT就会为你提供丰富的词汇拓展，让你的创作如虎添翼。绘画这一环节，也无需担心，AI将为你代劳，让你的创作变得轻松愉快。如此简单，让你尽情享受创作的乐趣，不再为复杂的步骤而烦恼。

来源：公开网络

对此，OpenAI 联合创始人 Greg Brockman 直接表示：

很难不爱。

来源：X（原 Twitter）

这般操作，也属实是把网友看的一愣一愣的。不少网友都惊呼，这也太绝了！

一些网友在欣赏 DALL · E 3 生成的图像后，立即表达了对 Midjourney 的喜爱与不舍。

在 ChatGPT 里就能玩

要说这次 DALL · E 3 发布中，最大的亮点，当属是把AI 绘图原生构建在 ChatGPT 之上。

为何如此呢？相较于过去的文生图工具，它们通常会先将文本提示转化为图像，即便如 DALL·E 2 这样的先进技术，也可能会因为忽视特定词汇而出现错误。然而，如今我们只需向 ChatGPT 发出需求，只需一个简洁的句子，AI 就能启动头脑风暴以优化提示，从而不再为无法撰写出引人注目的提示词而苦恼。

甚至，你还可以在对话过程中，基于生成的图像随时做出修改。

例如，官方提供的示例详细地阐述了DALL·E 3是如何充分利用提示词中的每个场景，创作出令人赞叹的作品。

在明亮的满月照耀下，街道被一片银辉覆盖，行人穿梭于繁华的夜色中，享受着都市的喧嚣与活力。在街头巷尾的小摊位上，一位头戴火红秀发的少女，身披优雅的天鹅绒斗篷，正与态度粗暴的老板展开激烈的讨价还价。

除上述之外，OpenAI 还指出：”DALL · E 3 的性能相较于过往系统有着显著的提升，它能够更好地理解和体现微小的差异和细节，从而使用户更容易将心中所想转化为极其精确的图像。这无疑极大地提升了用户体验，使得图像生成的过程更为便捷、高效。”

以下两幅图均由DALL·E3与DALL·E2创作，而Prompt则是相同的：“一幅展现篮球运动员完成扣篮动作的油画，同时伴有璀璨的星云爆炸效果”。然而，在细节表现、画面清晰度和明亮度等方面，DALL·E2的左图显然无法与DALL·E3的右图相提并论。

左：DALL · E 2；右：DALL · E 3

DALL · E 3 ChatGPT 配置到底有多绝？这不，OpenAI 官方就专门给 DALL · E 3 搞了一个超可爱的宣传视频，连 CEO Sam Altman 都忍不住称赞。

根据放出的视频，可以看到用户写了一段提示词「我家 5 岁宝宝一直在说一个超级向日葵刺猬，它该长什么样？」，ChatGPT 同时写了四段不同风格的提示词，直接生成四张风格迥异的图。

接下来选择最后一张图，给小刺猬起个名字，就叫小 Larry 吧，并为它画一个房子。

另外，DALL · E 3 还可以根据图片的风格，生成可爱的贴纸。

最后，让 ChatGPT 总结一下刚才的内容，生成一个睡前故事。咱就是好家伙，这配合着 ChatGPT 配件玩，完全可以生成一个电子书了。

目前 DALL · E 3 还未完全开放，想玩还得等一等，不过可以先来看看 OpenAI 放出的大量样图，官方也很贴心的给每张图都附上了对应的提示词。

提示词：一个装饰着室内植物的咖啡馆的小地图立体模型，顶部是木质横梁纵横交错，里面有一个冷饮站，上面有小瓶子和玻璃杯。

提示词：一种带有大玻璃窗的现代建筑物，坐落在悬崖上，在日落时可以俯瞰宁静的海洋。

而 CEO Altman 最喜欢的则是这张 ” 牛油果看医生 “。

有网友去试把同样的提示词用在 DALL · E 2 上的效果，嗯… . 咱就是说，咋看咋别扭。

这么一对比，可以发现 DALL · E 3 确实进步了不少。

下面简单梳理了一下 DALL 系列。

DALL · E 引发 AI 绘图热，Midjourney 捏把汗

2021 年 1 月 6 日，OpenAI 在其博客发布了两个文本图像的神经网络 **DALL · E 和 CLIP。DALL · E 可以基于文本直接生成图像，CLIP 则能够完成图像与文本类别的匹配。

2022 年 4 月，DALL · E 迎来升级版本 -DALL · E 2。与一代相比，DALL · E 2 在生成用户描述的图像时具有更高的分辨率和更低的延迟。并且，二代还增添了一些新的功能，比如对原始图像进行编辑。

目前，DALL · E 3 处于研究预览版本，根据 OpenAI 计划，将于 10 月份首先向 ChatGPT Plus 和 ChatGPT Enterprise 用户发布，独立版在今年秋天晚些时候提供。

随着 OpenAI 推出 DALL · E 3，AI 绘画领域只能说是太卷了，其中最大的玩家莫过于估值 10 亿美元的文生图 ” 扛把子 “Midjourney 了。

很多网友们也手痒搞事，用同一个提示词在 DALL · E 3 和 Midjourney 生成，然后放出来进行比较。

来源：OpenAI、Midjourney

对比看下来，你觉得哪个效果更好呢？

One More Thing

AI 生图虽然好玩，但争议也不少，今年初 Stability AI 和 Midjourney 就遭到三位艺术家的版权诉讼。

这一次，在版权问题、生图安全这块，OpenAI 也是专门下了点功夫。

来源：Artist and Creative Content Owner Opt Out

首先，OpenAI 在 DALL · E 3 上进行了大量工作，包括强化安全措施，以防止生成暴力、色情的图像，或是带有公众人物姓名的图。

另外，为了确保模型的安全性，团队还使用了输入分类器，可以帮助识别图像是否由 DALL · E 3 生成

此外，OpenAI 还允许创作者填写表格，禁止网络爬虫访问艺术家自己的网站。也可以直接发送想要保护隐私的图像，团队就会将其从训练数据中删掉。

长按添加「智涌」小助手入群

添加请备注：公司职务

OpenAI, DALL·E, ChatGPT, AI 绘画

相关文章

发表回复 取消回复

发表回复取消回复