DALL·E3:集成ChatGPT提升细节效果，准确度惊人

文章主题：OpenAI, DALL·E 3, ChatGPT, 图像生成

OpenAI推出了一款最新的AI绘画模型DALL-E 3，该模型采用了ChatGPT技术，并对其进行了优化和改进，使其在细节表现方面有了显著提升。这一消息引起了广泛的关注，因为这是OpenAI在人工智能领域的一次重要突破。

利用DALL·E生成的 AI 图像（图片来源：OpenAI）

OpenAI 又公布了最新重磅消息。

北京时间9月21日凌晨，美国OpenAI公司宣布，文生图 AI 工具迎来了第三个版本DALL·E 3，比上个版本仅过去17个月左右。

OpenAI 宣布，其最新的 DALL·E 3 系统在理解微小差异和细节方面表现更胜一筹，这使得用户能够更轻松地将他们的创意转化为精确的图像。此外，DALL·E 3 还将与 ChatGPT 集成，实现原生多模态输出。这意味着 Plus 和企业版用户可以通过文本在 ChatGPT 中直接生成各种类型的图像。这不仅提升了提示词生成图像的体验，还增强了模型理解用户指令的能力，使图像效果得到了显著的提升。

OpenAI公司的首席执行官，被誉为“奥特曼”的Sam Altman对最新的DALL·E 3效果表达了高度赞赏。他表示，这一技术将在未来几周内对所有ChatGPT Plus付费版和企业版用户提供开放。Altman认为，只有亲身体验，才能真正理解这一技术的突破性意义。

据悉，OpenAI成立于2015年，致力于开发和应用人工智能（AI）技术造福全人类。目前，OpenAI公司估值高达270亿美元左右，年营收已接近10亿美元。

在2021年，人工智能领域的重要参与者OpenAI发布了一款具有重大突破性的产品，它名为DALL·E和CLIP（对比图文预训练）。这款产品的出现，使得文本与图像之间的关联得以建立，从而开启了一个全新的时代。DALL·E是一种能够直接通过文本生成图像的神经网络，而CLIP则是一个独立的模型，负责解析输出的图像并为它进行评分。在DALL·E生成的图像中，CLIP模型会进行筛选，以保证展示出来的图像质量达到最高标准。

在2022年，OpenAI再次展现了他们在人工智能领域的强大实力，他们对文生图技术进行了升级，推出了DALL·E 2。这一版本的升级带来了许多重要的新特性。首先，它显著提高了图像的分辨率，使得生成的图像更加清晰、细腻。其次，DALL·E 2的延迟降低，这意味着用户可以更快地与模型进行交互，获得即时的反馈。此外，DALL·E 2还具备编辑原始图像的功能，这无疑大大增强了用户的体验。值得一提的是，DALL·E 2模型并非孤立存在，而是作为GPT-3的多模态实现而存在的。这一点可以从其庞大的参数数量（共120亿个）得到证实。这些参数全部来自于网络上的文本和图像，这使得DALL·E 2能够充分理解并生成各种类型的内容。此外，DALL·E 2还采用了零样本学习的技术。这意味着用户只需提供描述和提示，模型就能生成相应的输出，无需进行额外的训练。这种技术的出现，无疑极大地简化了用户的使用过程，也提升了生成图像的质量。总的来说，DALL·E 2的推出，标志着人工智能在图像生成领域的技术又向前迈进了一步。

剑桥大学的机器学习专家尼尔·劳伦斯（Neil Lawrence）曾表示，像DALL·E这样的模型具备储存全球信息的能力，并能以人类觉得极为自然的方式来拓展应用范围。与此同时，佐治亚理工学院的互动计算学院副教授马克·里德尔（Mark Riedl）则从另一个角度出发，他认为DALL·E的展示效果展示了其能够有序地将概念融合在一起，这被认为是人类创造力的核心要素。他还指出，相较于过去几年的其他 Text 2 Image（由文本生成图像）系统，DALL·E所绘制的插图表现更为优秀。

时隔500多天后，此次发布的DALL·E 3拥有多个新特性，钛媒体App简单梳理如下：

DALL·E 3 具备更强大的图像细节和差异识别能力，使用户更易将想法转化为准确的图像，并解决了之前版本DALL·E不会写字的问题。 DALL·E 3 的一个主要特点是与 ChatGPT 的集成。此集成允许用户更简单地创建 prompt（提示词），因为当输入一个想法时，ChatGPT 会自动为DALL·E 3生成详细的 prompt。 DALL·E 3 在图像质量和对 prompt 的准确性上都有所增强。相比于上一代，新版本更能理解文本的上下文和更长的 prompt，处理效果更佳。安全性方面，OpenAI 在DALL·E 3上制定了强有力的安全措施，以防止创建有害图像，它也不能生成公众人物的图像。同时，DALL·E 3不会生成在世的艺术家的风格图像，避免了之前版本中的争议，而艺术家可以提交自己的作品并要求从未来的文本到图像 AI 模型中移除，保证其版权不被侵犯。 DALL·E 3计划在10月先向特定用户发布，并计划在秋季向研究实验室及其 API 服务发布。OpenAI 还未明确是否会发布免费的公开版本。

ChatGPT 和 DALL·E 3 的结合带来了更出色的图像生成能力、更加优化的用户体验和更为严谨的文生图规范，这可以被简单地概括为 improved image generation capabilities, enhanced user experience, and stricter content generation guidelines.

DALL·E 3 的安全性一直是人们关注的焦点，而 OpenAI 研究员 Sandhini Agarwal 对该模型的安全性表现出了高度的信心。她认为这个模型正在不断地优化和改进，从而更好地服务于广大用户。

值得一提的是，目前，国内外已经有多个对标DALL·E的文生图模型AIGC公司和应用，其中包括独角兽公司Stability AI的开源文生图模型Stable Diffusion，Midjourney，英伟达的Perfusion模型，阿里巴巴的通义万象，智源研究院的开源双语模型AltDiffusion，HiDream智象未来的Pixeling（千象），阿里大文娱旗下妙鸭相机，网易伏羲旗下模型丹青等。

然而，当前 AI 生成的图像仍存在一些问题。华盛顿特区一家法院8月裁定，根据美国法律，未经任何人工输入而由人工智能创作的艺术作品不能获得版权。

当前，OpenAI仍面临多起诉讼。其中，美国作家贸易组织代表约翰·格里沙姆（John Grisham）和《权力的游戏》小说家乔治·马丁（George RR Martin）等作家起诉该公司，指控ChatGPT非法训练学习他们的作品。

（本文首发钛媒体App，作者｜林志佳）返回搜狐，查看更多

责任编辑：

OpenAI, DALL·E 3, ChatGPT, 图像生成

AI时代，拥有个人微信机器人AI助手！AI时代不落人后！

免费ChatGPT问答，办公、写作、生活好得力助手！

搜索微信号aigc666aigc999或上边扫码，即可拥有个人AI助手！

相关文章

发表回复 取消回复

发表回复取消回复