文章主题:AIGC, Midjourney, Prompt, 图片质量
以下是我体验一个多月整理的观察、经验,以及较具体的入门指引。
——
1. Midjourney 会让一些插画师失业
自从 Midjourney 的 v4 版本在 2022 年 11 月 5 日发布之后,我就上瘾了。
Midjourney 画出的图片,惊艳程度是超越了「可用」的范畴的,让很多人认为,只会简单绘图的插画师将会失业了。
像这个,就是我帮朋友月莞柔的在 2022 年广受好评的新播客《大食话》画的插画风格海报,Midjourney 出片,仅需 3 分钟。
更多观察和思考,可以参考这一篇:沉迷 AIGC 两周后:某些人失业是必然的
还可以参考播客「三五环」的这一期播客:
2. prompts 就是 AI 绘图的核心竞争力
谈到AIGC,我们不能不提到其需要经验主义引导语的问题,这在Midjourney工具中被称为Prompt。Prompt的使用对于图片的质量效果有着直接的影响。然而,目前Midjourney工具尚未达到让大家随意说点啥都能画出非常满意程度的程度,事实上,很多优秀的图片都需要经过精细的调教。
例如,我曾经想画一个封面,表达的是喝运动饮料的运动员的状态,用的 prompt 是:
A asian athlete, throwing out drink cans, pop art, circle picture
(亚洲运动员,扔出饮料罐,波普艺术,圆形)
在我个人的观点中,这几篇文章似乎没有达到我所期望的水平。它们过于注重现实主义的描绘,失去了部分美感。为了提升整体质量,我认为需要在风格上进行一定的调整。如何能让文章在保持强烈运动感的同时,又增加艺术的元素,成为了我正在思考的问题。
于是我加了一个「colorful ink painting」,水墨画风格。就变成了这样:
比刚才的更风格化了、更有趣了。
在实际应用Midjourney的过程中,我们会逐渐发现,对于风格的理解与把握,成为了创作过程中至关重要的技能。
我曾尝试过模仿徐冰先生的作品《天书》,试图将日常的部首组合起来,创造出那些并不存在的字。这种既陌生又熟悉的感受,令人玩味无穷。
尽管AI目前无法识别文字,但绘制不存在的字已无大碍。然而,如何使文字排列有序,呈现出类似书法作品的风格,仍是一个挑战。
如果直接输入
Chinese words, Calligraphy
(中国字,书法),会出现这种结果:
当然也挺好看,但不符合预期。
在我心中回顾过的众多摄影师中,Andreas Gursky的名字始终让我印象深刻。这位出生于1955年的德国摄影师,以其独特的拍摄手法和大尺幅、高密度的摄影风格而著称。他的作品总是能够捕捉到那些我们日常生活中的不经意的瞬间,将其转化为引人入胜的艺术画面。正因如此,他的摄影作品在国内外享有极高的声誉。
(巴黎蒙帕纳斯线 Paris Montparnasse ,1993年)
那不是巧了吗?于是用简单的这个 prompt :
Chinese words, Calligraphy , by Andreas Gursky
就能得到这样的结果了:
所以接下来就容易说明了:
对于 Midjourney 的使用来说,promps 就是核心竞争力。
这些各种各样的风格,包括画风(水墨、波普、抽象)、艺术家(摄影师、画家)等等,是能画好图最关键的武器。创意当然重要,但离怎么样实现创意之间,需要有大量的 prompts 的素材作为武器。
3. Midjourney 保姆注册和使用说明
想尝试的朋友,这里提供一份完整的注册使用说明。
1)科学上网。
为了完成您的任务,您需要在www.midjourney.com上创建一个账户。请注意,尽管Midjourney没有提供自身的应用程序,但它却是以Discord平台为依托的。因此,在开始之前,确保您已注册并登录了Discord账户。
Discord可以被看作是一个类似于微信群的社交平台,而在Midjourney的团队中,他们采用了一种独特的方法来利用这个平台——引入机器人(bot)。具体来说,他们会将绘制图片的过程中所需要的prompt信息发送给这些机器人,然后机器人会根据接收到的指令生成相应的图像反馈。这样一来,通过使用Discord这一平台,团队便能够更加高效地完成图片创作的任务。
所以加入大的群组(社区)后,可以看到各种小群组。对于新用户,有免费的画图名额,要进入新人画图群组,是这几个 newcomer rooms:
进入之后,你会发现很多人已经在画图了:
画图的方式是,在对话框里输入
/imagine
对话框会变成这样:
在 prompt 的框里输入英文的描述,敲回车即可。
4)你会发现每次生成 4 个不同的图片,这样每张都不算高清。这其实算是 demo,低成本地让你判断有没有合适的,然后可以再做 upscale (升级,或者扩大篇幅)的操作。每个图片下面也有快捷按钮,U1-U4 指的就是按顺序的图片。
注意,upscale 的操作也是耗费额度的。
具体 upscale 的操作技巧,下一节我们再聊。
5)免费会员有 25 次的使用额度,用完后就没了。付费会员则分为几类:
– 10 美元/月,每个月 200 张的额度;
– 30 美元/月,fast 模式大概有 900 张的额度,relax 模式额度不限;
– 60 美元/月,fast 模式大概有 1800 张额度,relax 模式额度不限,同时可以私密模式下使用(其它模式下你画的图是公开在个人主页的)。
一般推荐的还是前两种。付费可以用国际货币信用卡。
查看付费页面的方式是在输入框里使用语句:
/subscribe
付费会员会有自己的 bot,不用在群组里发了:
几个补充:
fast 模式和 relax 模式顾名思义,就是速度不同,fast 基本会确保 3-4 分钟出图;relax 不一定,但个人体验下来也还好,很少有超过 10 分钟的,因为是排队的模式,在有时差、外国人都睡觉的时段,速度也很快。切换 fast 和 relax 的方式是直接在输入框里输入语句:/fast/relax英语不熟悉的朋友,推荐用这个:deepl.com用 Midjourney 画出的图片,创作者可以拥有版权,这两种情况例外:是免费会员;用于年收入超过 100w 美元公司的使用。更详细的可参考:docs.midjourney.com对于付费会员来说,Midjourney 的 feed 社区是发掘好的 prompts 的绝佳圣地:www.midjourney.com4. prompt 结构说明与属性描述词Midjourney 的 prompt 的结构可以拆分成三个基础组成部分:1)内容描述:就是主体内容,表达我们到底想画什么。是骡子是马,是猴子是兔。他们是什么形象、穿着什么衣服、在干什么,等等。2)风格描述:包括曾经讲过的艺术家、画笔风格、艺术风格等等,甚至包括打光、视角、拍照相机的牌子等等。3)属性描述:最基本的图片属性,比如尺寸、使用的 Midjourney 版本。
显然,内容描述是各位在画每个图的时候各自去创作的;风格描述,就是这个创意库接下来要探讨的;而属性描述,是相对最基础也容易掌握的部分。这篇文章就探讨几个最基本的属性描述词。
对了,强调一下,内容描述和风格描述都是可以用 , 或者 + 隔开的。而属性描述是要用两个短横线隔开的,要严格遵循:–[属性名][空格][属性值]
比如:rabbit, white –v 4
版本号 –v 1/2/3/4前文提到过了,去年底发布的 v4 是效果最震撼的,而之前的三个版本还没有达到如此写实的程度。2023 年,这个专栏更新的过程中,Midjourney 预计会发布 v5,又会有一轮优化。v 1-4 的区别,可以用同样的关键词来体会,比如:cat –v 1cat –v2cat –v3cat –v4直观的感受,自然是默认都用 v4 即可,效果是最好的。但在画不同艺术风格的图片时,也未必。有时候觉得过于写实了,用一下 v2、v3 画抽象的风格,可能会有奇效。另外,每次输入 –v 4 是比较麻烦的,想要默认都是 v4,可以输入语句:
/settings
这里面可以选择各种默认的语句。每次输入完,会自动给你添加上的。
扩幅相关 upscaleupscale 是把 4 in 1 的 demo 图片扩大篇幅成为更高清的图片。默认的扩幅一般就能用了。这里还有一个 Make Variations,也容易理解,就是根据这个图重新做一份 4 in 1 的 demo,效果是这样的:
对于扩幅的图片像素大小,官方有一个完整的图表:
负面提示词 –no如果不希望图片里出现什么内容,可以用这个描述。比如:
–no hands不要出现手。
质量 –q .25/.5/1/2这是很量化的图片渲染时间,默认是 1。如果用更短的时间,消耗的额度更少,图片效果可能略差;反之亦然。注意,渲染时间也跟额度有关。q 设置为 2,差不多就消耗两倍的额度。
图片比例 –ar 2:3/3:2v4 版本只支持三种比例:默认的 1:1,2:3 和 3:2(今天刚更新的版本,已经支持 16:9 等尺寸了)
要调整比例,使用语句 –ar,如:
cat –ar 2:3v3 支持更多比例。但这里不展开说了。
参考图片Midjourney 是支持参考图片的。比如如果想依据自己的照片画图,可以直接把图片网址放在 prompt 里面。例如:https://s.mj.run/euG_Zu_BnQM iron man如果图片还没有上传到什么图床,可以直接在对话框里发送,发送完后点击右键——复制地址。
增加语句重制 Remix跟普通的重新制图不一样,高阶版的增加语句重制,可以在原构图/基本结构上,画别的主题。具体操作是要去 settings 里打开 Remix Mode,然后再已经 upscale 的图片下点击 Make Variations,就可以另行输入 prompt 了。
这是我画的中国古镇:
这是用同一张图片在 Remix 模式下绘制的北欧古镇:
更多相关的属性描述词可以参考官方手册:docs.midjourney.com掌握了以上这些,可以说已经完全可以入门、画出一些不错的画作了。5. 我的 Midjourney 创意库正如前文所说,prompts 是 AI 绘图的核心竞争力(就目前而言)。我之前有各式各样的尝试,慢慢地把各式各样的几百条描述词沉淀成了自己的 AIGC 资产。这些分享给你,想必你也可以成为一个专业的 AI 画手。以下是这些创意的实例:
如果你对怎么画出这些图比较感兴趣,欢迎来小报童订阅这个年度专栏。如果你很喜欢它们,想要当做壁纸,这也是个不错的壁纸库。权益说明如下:
我会每篇提供同一个主题的图片,在 5-10 张左右;专栏更新周期大概是一年,不少于 50 篇,因此图片大概在 300-500 张之间;配合主题,我会介绍风格、艺术家和在 Midjourney 中的使用实例(prompts);提供高清的图片,并放弃版权,可以非商用前提下随意使用;加入读者专属的微信群,讨论 Midjourney 的使用,和 AIGC 的动向。目前是优惠阶段,在 1000 个读者之后,会恢复原价。
AIGC, Midjourney, Prompt, 图片质量
AI时代,拥有个人微信机器人AI助手!AI时代不落人后!
免费ChatGPT问答,办公、写作、生活好得力助手!
搜索微信号aigc666aigc999或上边扫码,即可拥有个人AI助手!