AI赋能未来,让生活更精彩!关注公众号,了解最新AI趋势,使用顶尖AI工具,共创智能化美好生活!
文章主题:DALL·E 3, AI, 生成图像, 版本升级
公众号关注“AI FUN Times”
设为“星标“,了解最新的AIGC资讯
爱因斯坦说过:一个好问题胜过一打好答案。
为什么DALL·E 3的效果有大幅提升?
新版DALL·E 3能直接用于商业做图的生产吗?
提示词门槛极大降低会带来什么竞争格局的变化?
带着这3个问题,让我们来进一步了解DALL·E 3
部分内容转发自 梦晨 萧箫 发自 凹非寺
量子位 | 公众号 QbitAI起猛了!OpenAI竟然把 AI绘画 和 ChatGPT 合 并 了!
这不,最新发布的DALL·E 3,直接给AIGC带来了两大震撼——
提示词门槛极大降低
理解语意的细微差异的细节描述,准确到令人发指
没错,新版DALL·E 3,不仅省去了提示词工程!还顺带把语言理解能力提升了一个档次!
你只管随意想象:词,
ChatGPT帮你拓展:画,
DALL·E 3给你精确到细节。
五大优势:
1. DALL·E 3与GPT4.0,无需再担心怎么写提示词的问题,同步上线后,GPT4.0一定会有好用的适用于DALL·E 3绘画的提示词插件更新!
2. 它非常擅长需要一致图案的风格,例如像素艺术、马赛克或点阵。
3、它对人…和手(终于!)非常擅长,这点完胜SD!
4、它非常擅长混合真实感和虚构元素。这是照片中平坦的大地冰墙和升天的天使。
5、极繁主义和古典艺术的创作也很有趣。
AI就能像拍电影一般,确保从背景到人物,细节一字不差地复刻出来:
满月下的街道,熙熙攘攘的行人正在享受繁华夜生活。
街角摊位上,一位有着火红头发、穿着标志性天鹅绒斗篷的年轻女子,正在和脾气暴躁的老小贩讨价还价。
这个脾气暴躁的小贩身材高大,老道,身着一套整洁西装,留着引人注目的小胡子,正在用他那部蒸汽朋克式的电话兴致勃勃地交谈。
除了基础细节,DALL·E 3甚至能将模糊的形容词如繁华、讨价还价、脾气暴躁演绎得活灵活现,和CLIP已经不在一个档次了。
同时,相比上一代老模型,DALL·E 3自身的画技也前进了一大步:
这般操作,直接把网友看愣了。
已有网友明智地做出了选择,他们决定取消Midjourney的订阅。因为Midjourney若无法正确解读文本,这甚至不能称之为同等的竞争。
还有网友调侃,现在压力来到即将到来的谷歌Gemini和Midjourney V6这边。
更多细节,我们从DALL·E 3展示的效果一一来看。
在ChatGPT里直接用
相比前两代,DALL·E 3最大的优势在于原生构建在ChatGPT之上。
不仅意味着语言理解能力大幅飞跃,甚至提示词都可以让ChatGPT自己来写。
更多细节藏在奥特曼都忍不住自夸可爱的宣传视频里。
这是一个家长把5岁小朋友脑海里的幻想变成现实的故事。
首先家长询问ChatGPT,“我家5岁宝宝一直在说一个’超级向日葵刺猬’,它该长什么样?”
可以看到ChatGPT同时写了四段不同风格的提示词,并给出对应图像。
家长选择其中偏童话插图风格的一张后,故事的主角小刺猬形象似乎就能固定下来了,可以继续请ChatGPT画出更多。
顺便给小刺猬一个名字Larry,后面的对话中就不用每次都说“超级向日葵刺猬”了。
主角定好了,接下来再添加更多元素,让整个童话故事更丰富,比如给Larry画个房子。
这里既展示出了DALL·E 3创作一致形象的能力,也展示出邮箱上正确写上了LARRY的名字,解决了之前版本DALL·E不会写字的问题。
反正都用上ChatGPT了,不如把故事情节也完善一下?
刚编好的情节立马就可以有配套的插画了。
保持角色形象,迁移到完全不同的贴纸画风
也没问题,可以直接打印出来。
注意了,最绝的地方来了,直接让ChatGPT总结前面对话中所有内容,写成一个完整的睡前故事。
虽然演示到此结束,但完全可以想象配合ChatGPT插件功能,还可以直接生成一本电子书出来。
部分视频演示:在过去的一段时间里,有人提出了一个有趣的观点,即要确保人工智能(AI)的安全性,最好的方法是鼓励OpenAI、Anthropic等公司的员工拥有孩子。这个建议看似与AI安全没有直接关系,但它实际上包含了一种深刻的思考方式。首先,拥有孩子意味着拥有更多的责任和关爱。员工作为父母,会更加关注他们孩子的安全和健康,这会让他们更加谨慎地对待他们在工作中使用的技术。这种关注和责任感不仅限于个人生活,还会延伸到工作领域,从而提高员工对AI安全的重视程度。其次,让孩子成为员工的一部分,可以增强他们的归属感和认同感。当员工感受到公司对员工的关心和尊重,他们更有可能为公司的发展和安全做出贡献。在这种情况下,员工更愿意分享他们的知识和经验,以便确保AI系统的安全性。最后,鼓励员工拥有孩子还可以促进公司内部的多样性和包容性。不同的员工有着不同的家庭背景和价值观,拥有孩子可以使公司更加适应这些差异,并更好地支持员工的需求。这种多样性有助于创建一个更加灵活和创新的的工作环境,从而提高公司在面对各种挑战时的能力。综上所述,虽然让OpenAI、Anthropic等公司的员工拥有孩子似乎是一个离奇的建议,但它实际上包含了一些有价值的思考。通过培养员工的责任感、归属感和多样性,我们可以为公司的发展和安全创造一个更加稳健的基础。
这样他们就有动力确保AGI到来时世界是安全的。(手动狗头)
虽然DALL·E 3现在还不能马上玩到,一次放出的大量样张也可以先看个饱了。
每一张点开还可以看到提示词,都是直接用人话描述,没怎么加复杂咒语的那种。
复杂场景与不存在的概念组合,效果很惊艳。
搞室内设计概念图,光影明暗关系乍看也挑不出毛病。
配合正确写字能力,直出海报也是生产力拉满(没指定文字的小字部分还有些问题)。
刚加入OpenAI不久的德扑AI之父Noam Brown也晒出了他试玩的机器人打牌图。
CEO奥特曼最喜欢的则是这张“牛油果看医生”。
有网友尝试将相同的提示词应用于DALL·E 2,结果令人失望。其效果仅限于文字呈现不准确,以及牛油果中心的空洞无法正常显示。在治疗方面更是无法满足需求。
还记得2021年1月DALL·E 1刚出的时候吗?梦开始的地方就是一组“牛油果做的沙发”。
也难怪网友感叹:看看它走了多远!
“如有侵权,请来删图”
当然,除了上述特性以外,OpenAI也预告了一些神奇的新功能。
例如,DALL·E 3即将配套推出一个图像鉴别器。
一个高效的分类器能够有效地辨别图像是否出自DALL·E 3,其作用不仅在于防止误判(例如手动狗头),更在于能够在DALL·E创作出优质作品时,迅速将其确认为自己所有。
在图像生成的领域,OpenAI已经进行了大量的努力,以确保其生成的图像不会包含暴力、色情或其他有害内容,同时避免生成带有公众人物(如明星、名人等)姓名的图像。
在隐私问题上,纽约时报曾揭露,OpenAI正在运用先进的技术手段,对上传至ChatGPT的图片中的人物面部进行模糊处理。
为防止ChatGPT沦为纯粹的人脸识别工具,特别是那些已经在网络上流传的知名人物照片,故此采取相应措施。
如今这个技术可能也被用到了DALL·E 3中,防止生成侵权图像。
同时,OpenAI也与安全红队合作,提高了图像风险评估的能力。
除此之外,在训练数据上,有了Midjourney的“前车之鉴”,OpenAI这次也学会了保护自己。
相比于直接和画手打官司、或者等着被起诉,OpenAI在官网放出了一则训练数据“免责声明”:
为了更好地保护您的隐私,我们建议您采取以下两种方式:一是浏览器的“用户隐私”设置中,将我们的网络爬虫GPTBot添加到“不受欢迎的应用程序”列表中,从而禁止其访问您的网站;二是将您希望保护隐私的图片发送给我们,我们将从我们的训练数据中移除这些图片。这两种方式都可以有效地保护您的隐私,同时确保我们的网络爬虫不会未经许可地访问您的个人信息。
那么DALL·E 3具体什么时候上线呢?划重点了:
ChatGPT Plus会员(20美元/月)和企业版在10月可用。
独立版在今年秋天晚些时候提供(目前价格15美元可以玩115次)。
参考链接:
[1] https://openai.com/dall-e-3[2]https://www.nytimes.com/2023/07/18/technology/openai-chatgpt-facial-recognition.html[3]https://twitter.com/sama/status/1704547625482203560AIGC交流群
「 AI FUN赋能圈」是一个AIGC学习社区,我们拥有自己的绿色版ChatGPT、Midjourney工具,同时也有头部AI数字人服务项目。我们会不定时更新AI相关的科普知识和有趣实用的AI应用工具。欢迎大家在这里交流AIGC未来各个场景落地的想法!
— 完 —
DALL·E 3, AI, 生成图像, 版本升级
AI时代,拥有个人微信机器人AI助手!AI时代不落人后!
免费ChatGPT问答,办公、写作、生活好得力助手!
搜索微信号aigc666aigc999或上边扫码,即可拥有个人AI助手!