文章主题:验证, Midjourney 5.1, 表现, 相同文字提示词
IT之家 5 月 4 日消息,AI 作图工具 Midjourney 近日发布了最新的 5.1 版本,宣称能够为用户带来更高质量、更有个性的 AI 艺术作品。
Midjourney 是一家提供生成式 AI 艺术服务的公司,用户只需在 Discord 上输入一些文字或图片,就可以让 AI 根据自己的喜好和风格创作出独一无二的艺术作品。Midjourney 的引擎经过多次升级,目前已经达到了 5.1 版本,据官方介绍,这一版本的引擎更加“有主见”,能够生成出更接近 4.0 版本的效果,但质量更高。此外,还有一个“原始”模式,供那些不想要太强个性化效果的用户使用。其他方面的改进包括:准确度提高,图像中不想要的边框减少,文字失真情况减少,锐度增强。
为了检验 Midjourney 5.1 版本的性能,知名的外媒 Forbes 利用相同的文字提示,在 5.0 和 5.1 两个版本中分别生成了四张图片并进行对比分析。在此过程中,所有的其他设置均保持一致,仅 Midjourney 设置为基础质量和中等风格。IT之家提醒读者,以下的图片展示中,左边的四张是 Midjourney 5.0 版本的结果,而右边的四张则是 5.1 版本的结果。
第一个提示词是“女人走在鹅卵石街道上,走向日落”:
在Midjourney 5.0版本中,一直存在着一个显著的问题,即过度强烈且不真实的镜头光晕效果。然而,在5.1版本中,这一问题终于得到了妥善解决。改进后的日落画面显得更为自然,同时天空也呈现出更加温馨和有趣的色调。
第二个提示词是“油漆厂爆炸,矢量艺术”:
同样地,5.1 版本的图片比 5.0 版本的更出色,颜色运用得更好,构图也更有动感。
人脸是 Midjourney 的一个强项,下一张图片的提示词是“戴着泳镜的孩子的特写”:
在Midjourney 5.1版本中,我们可以明显感受到“主见”的特性更为突出。相较于5.0版本,其间的图片质量有了显著的提升。在5.0版本中,图像表现得较为平凡,仿佛是手机拍摄的孩子戴上眼镜的日常生活照片。然而,在Midjourney 5.1版本中,右侧的图像却展现出了更强烈的艺术气息,仿佛是由专业摄影师精心捕捉的作品。这种升级不仅让软件的功能更加完善,同时也让用户在使用过程中能够获得更好的视觉体验。
在最终的测试中,5.1 版本的性能表现得到了验证,其确实能够有效地解决文字失真的问题。这一点从“街角卖报纸的人,1950 年代风格,棕褐色”这个提示词就能看出。
两个版本都未能准确理解提示词的含义,所生成的场景均呈现出一名持有报纸的推销员,而非真正售卖报纸的角色,这方面的修正可以通过调整提示词来实现。在两组图片中,背景均存在文字元素,但彼此间并无显著差异。从整体来看,两组图片中的文字尚可,然而,一旦放大观察,便会发现其中大部分文字并无实际意义。相较于5.1版本,其图片构图更为强烈,主题在画面中所占空间也相对较大。
目前,Midjourney 5.1 版本仍在测试阶段,但用户已可通过在Discord上输入 /settings 命令选择使用此版本。据公司计划,Midjourney 5.1 将在本周末前成为默认模式。
AI时代,拥有个人微信机器人AI助手!AI时代不落人后!
免费ChatGPT问答,办公、写作、生活好得力助手!
搜索微信号aigc666aigc999或上边扫码,即可拥有个人AI助手!