文章主题:IT之家, 腾讯混元大模型, 文生图, 功能升级

666AI工具大全,助力做AI时代先行者!

近日,我国科技巨头腾讯的混元大模型再次迎来升级,并对外公开了“文生图”功能。据“鹅厂技术派”报道,腾讯混元大模型的升级版已经正式亮相,其效果表现超过了GPT3.5,且在代码能力方面有了显著提升,达到了业界领先水平。这一消息发布后,立刻引发了广泛的关注和讨论。

1702785873268.jpg
▲ 图源鹅厂技术派公众号

大模型文生图的制作面临着三大挑战,即对提示词语义的准确理解、生成内容的合理性以及生成图像的效果。为了克服这些难题,腾讯公司投入专项技术力量进行了深入研究,并研发出一系列具有创新性的算法。

在语义理解方面,腾讯混元采用了中英文双语细粒度的模型,模型同时建模中英文实现双语理解,而不是通过翻译,通过优化算法提升了模型对细节的感知能力与生成效果,有效避免多文化差异下的理解错误。

在内容合理性方面,AI 生成人体结构和手部经常出现变形现象。为了改善这一问题,混元文生图采用了先进的算法模型,强化了图像二维空间位置感知能力,并融入了人体骨架和人手结构等先验信息。这样一来,生成的图像结构更加合理,错误率得到了有效降低。

在画面质感方面,混元文生图基于多模型融合的方法,提升生成质感。经过模型算法的优化之后,混元文生图的人像模型,包含发丝、皱纹等细节的效果提升了 30%,场景模型,包含草木、波纹等细节的效果提升了 25%。

1702785873616.jpg
广告
胆小者勿入!五四三二一…恐怖的躲猫猫游戏现在开始!
×
▲ 图源鹅厂技术派公众号

如果用户想生成一张更接近真人感的照片,或接近实拍的图片,可以加上“真实感”或“摄影风”等描述;如果用户想要特定风格的图片,建议在提示词中加入该风格的描述,如油画风、赛博朋克风等。此外,用户还可以对画面进行尽可能详细地描述,以获得满意的效果。

据介绍,腾讯内部的多个开发平台已经成功接入腾讯混元大模型,并且已经超过了180个内部业务。这些业务涵盖了腾讯会议、腾讯文档、企业微信、腾讯广告以及微信搜一搜等多个领域。

▲ 图源IT之家网友

近日,有IT之家网友反馈已经通过混元大模型内测审核,并分享了相关操作页面。从截图中可以看到,混元大模型支持制定面试大纲、旅行计划、PPT 大纲、健身计划等功能,分为工作、编程、营销、生活等选项。

此外,混元大模型还支持 AI 对话功能,已经通过的内测申请的用户可以尝鲜一下。

IT之家附更多生成图:

1702785874138.jpg
▲ 图源鹅厂技术派公众号,下同
1702785874481.jpg
广告
从秘书起步,十年内无人超越,以一己之力力挽狂澜成就一段传奇
×
1702785874674.jpg
1702785874847.jpg
1702785875010.jpg
1702785875266.jpg
1702785875531.jpg

aigc666aigc999_0.jpg

AI时代,拥有个人微信机器人AI助手!AI时代不落人后!

免费ChatGPT问答,办公、写作、生活好得力助手!

搜索微信号aigc666aigc999或上边扫码,即可拥有个人AI助手!

Leave a Reply

Your email address will not be published. Required fields are marked *