文章主题:验证, Midjourney 5.1, 表现, 文字提示词

666AI工具大全,助力做AI时代先行者!

IT之家 5 月 4 日消息,AI 作图工具 Midjourney 近日发布了最新的 5.1 版本,宣称能够为用户带来更高质量、更有个性的 AI 艺术作品。

Midjourney 是一家提供生成式 AI 艺术服务的公司,用户只需在 Discord 上输入一些文字或图片,就可以让 AI 根据自己的喜好和风格创作出独一无二的艺术作品。Midjourney 的引擎经过多次升级,目前已经达到了 5.1 版本,据官方介绍,这一版本的引擎更加“有主见”,能够生成出更接近 4.0 版本的效果,但质量更高。此外,还有一个“原始”模式,供那些不想要太强个性化效果的用户使用。其他方面的改进包括:准确度提高,图像中不想要的边框减少,文字失真情况减少,锐度增强。

为了评估 Midjourney 5.1 版本的性能,知名的外媒 Forbes 利用相同的文字提示,在 5.0 和 5.1 两个版本中分别生成了四张图片并进行对比分析。在此过程中,其余所有设置均保持一致,仅 Midjourney 设置为基础质量和中等风格。IT之家提醒读者,以下图片中的左四张为 Midjourney 5.0 版本的结果,右四张则是 5.1 版本的结果。

第一个提示词是“女人走在鹅卵石街道上,走向日落”:

在Midjourney 5.0版本中,一直存在着一个显著的问题,即过度强烈且不真实的镜头光晕效果。然而,在5.1版本中,这一问题终于得到了妥善解决。改进后的日落画面显得更为自然,同时天空也呈现出更加温馨和有趣的色调。

第二个提示词是“油漆厂爆炸,矢量艺术”:

同样地,5.1 版本的图片比 5.0 版本的更出色,颜色运用得更好,构图也更有动感。

人脸是 Midjourney 的一个强项,下一张图片的提示词是“戴着泳镜的孩子的特写”:

在Midjourney 5.1版本中,我们可以明显感受到其“主见”特性的提升,相较于5.0版本, latter版本的图片质量有了显著的提升。在5.0版本中,图片看似普通,仿佛是智能手机拍摄的孩子戴上眼镜的日常生活照片。然而,在5.1版本中,右侧的图片却展现出了更为强烈的艺术气息,仿佛是由专业摄影师精心捕捉的作品。这种升级不仅让软件的功能更加完善,同时也让用户在使用过程中能够体验到更高品质的视觉感受。

在最终的测试中,5.1 版本的性能表现得到了外界的验证。针对提示词“街角卖报纸的人,1950 年代风格,棕褐色”,我们成功地进行了一系列的调整和改进,最终确保了系统在处理这类任务时的稳定性和准确性。

两个版本都未能准确理解提示词的含义,所生成的场景均呈现出一名持有报纸的推销员,而非真正售卖报纸的角色,这方面的修正可以通过调整提示词来实现。在两组图片中,背景均存在文字元素,但彼此间并无显著差异。从整体来看,两组图片中的文字尚可,然而,一旦放大观察,便会发现其中大部分文字并无实际意义。相较于5.1版本,其图片构图更为强烈,主题在画面中所占空间也相对较大。

目前,Midjourney 5.1 版本仍在测试阶段,但用户已可通过在Discord上输入 /settings 命令选择使用此版本。据公司计划,Midjourney 5.1 将在本周末前成为默认模式。

AI时代,拥有个人微信机器人AI助手!AI时代不落人后!

免费ChatGPT问答,办公、写作、生活好得力助手!

搜索微信号aigc666aigc999或上边扫码,即可拥有个人AI助手!

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注