文章主题:OpenAI, DALL·E 3, ChatGPT, 图像生成
OpenAI推出了一款最新的AI绘画模型DALL-E 3,该模型采用了ChatGPT技术,并对其进行了优化和改进,使其在细节表现方面有了显著提升。这一消息引起了广泛的关注,因为这是OpenAI在人工智能领域的一次重要突破。
利用DALL·E生成的 AI 图像(图片来源:OpenAI)
OpenAI 又公布了最新重磅消息。
北京时间9月21日凌晨,美国OpenAI公司宣布,文生图 AI 工具迎来了第三个版本DALL·E 3,比上个版本仅过去17个月左右。
OpenAI 宣布,其最新的 DALL·E 3 系统在理解微小差异和细节方面表现更胜一筹,这使得用户能够更轻松地将他们的创意转化为精确的图像。此外,DALL·E 3 还将与 ChatGPT 集成,实现原生多模态输出。这意味着 Plus 和企业版用户可以通过文本在 ChatGPT 中直接生成各种类型的图像。这不仅可以提升提示词生成图像的体验,而且可以提高模型理解用户指令的能力,从而带来图像效果的巨大提升。
OpenAI公司的首席执行官,被誉为“奥特曼”的Sam Altman,近日在面对媒体时,对最新的DALL·E 3技术表现表达了高度赞赏。他表示,这一次的改进堪称革命性的,预计在未来的几周内,将会向所有ChatGPT Plus的付费版和企业版用户提供开放。Altman强调,只有亲身体验过这项技术的人,才能真正体会到它的价值和意义。
据悉,OpenAI成立于2015年,致力于开发和应用人工智能(AI)技术造福全人类。目前,OpenAI公司估值高达270亿美元左右,年营收已接近10亿美元。
在2021年,人工智能领域的重要参与者OpenAI发布了一款具有重大突破性的产品,它名为DALL·E和CLIP(对比图文预训练)。这款产品的出现,使得文本和图像之间的关联得以建立,从而开启了一个全新的时代。DALL·E是一种能够直接通过文本生成图像的神经网络,而CLIP则是一个独立的模型,负责解析输出的图像并为它进行评分。在DALL·E生成的图像中,CLIP模型会进行筛选,以保证展示出来的图像质量达到最高标准。
在2022年,OpenAI再次展现了他们在人工智能领域的强大实力,他们对文生图技术进行了升级,推出了DALL·E 2。这一版本在图像分辨率、延迟以及编辑原始图像方面都有所提升。值得一提的是,DALL·E模型实际上是GPT-3的多模态实现,其庞大的参数数量达到了120亿个。这个强大的模型并非从无到有,而是利用网络上的文本和图像进行训练的。此外,DALL·E model还具备零样本学习的功能,这意味着它可以从描述和提示中直接生成输出,无需进行额外的训练。
剑桥大学的机器学习专家尼尔·劳伦斯(Neil Lawrence)曾表示,像DALL·E这样的模型具备储存全球信息的能力,并能以人类觉得极为自然的方式来拓展应用范围。与此同时,佐治亚理工学院的交互计算学院副教授马克·里德尔(Mark Riedl)则从另一个角度出发,他认为DALL·E的展示效果展示了其能够有序地整合概念,这正是人类创造力的核心要素。他还强调,相较于过去几年的其他 Text 2 Image(由文本生成图像)系统,DALL·E所绘制的插图有着明显的优势。
时隔500多天后,此次发布的DALL·E 3拥有多个新特性,钛媒体App简单梳理如下:
DALL·E 3 具备更强大的图像细节和差异识别能力,使用户更易将想法转化为准确的图像,并解决了之前版本DALL·E不会写字的问题。 DALL·E 3 的一个主要特点是与 ChatGPT 的集成。此集成允许用户更简单地创建 prompt(提示词),因为当输入一个想法时,ChatGPT 会自动为DALL·E 3生成详细的 prompt。 DALL·E 3 在图像质量和对 prompt 的准确性上都有所增强。相比于上一代,新版本更能理解文本的上下文和更长的 prompt,处理效果更佳。 安全性方面,OpenAI 在DALL·E 3上制定了强有力的安全措施,以防止创建有害图像,它也不能生成公众人物的图像。同时,DALL·E 3不会生成在世的艺术家的风格图像,避免了之前版本中的争议,而艺术家可以提交自己的作品并要求从未来的文本到图像 AI 模型中移除,保证其版权不被侵犯。 DALL·E 3计划在10月先向特定用户发布,并计划在秋季向研究实验室及其 API 服务发布。OpenAI 还未明确是否会发布免费的公开版本。ChatGPT 和 DALL·E 3 的结合带来了更出色的图像生成能力、更加优化的用户体验和更为严谨的文生图规范,这无疑是一个巨大的进步。
DALL·E 3 的安全性一直是研究人员关注的焦点。OpenAI 研究员 Sandhini Agarwal 在接受采访时表示,她对该模型的安全性有着“高度的信心”,并且相信该模型会不断完善。
值得一提的是,目前,国内外已经有多个对标DALL·E的文生图模型AIGC公司和应用,其中包括独角兽公司Stability AI的开源文生图模型Stable Diffusion,Midjourney,英伟达的Perfusion模型,阿里巴巴的通义万象,智源研究院的开源双语模型AltDiffusion,HiDream智象未来的Pixeling(千象),阿里大文娱旗下妙鸭相机,网易伏羲旗下模型丹青等。
然而,当前 AI 生成的图像仍存在一些问题。华盛顿特区一家法院8月裁定,根据美国法律,未经任何人工输入而由人工智能创作的艺术作品不能获得版权。
当前,OpenAI仍面临多起诉讼。其中,美国作家贸易组织代表约翰·格里沙姆(John Grisham)和《权力的游戏》小说家乔治·马丁(George RR Martin)等作家起诉该公司,指控ChatGPT非法训练学习他们的作品。
(本文首发钛媒体App,作者|林志佳)返回搜狐,查看更多
责任编辑:
AI时代,拥有个人微信机器人AI助手!AI时代不落人后!
免费ChatGPT问答,办公、写作、生活好得力助手!
搜索微信号aigc666aigc999或上边扫码,即可拥有个人AI助手!