文章主题:IT之家, 腾讯混元大模型, 文生图, 功能升级
最近,根据“鹅厂技术派”的消息,腾讯混元大模型进行了全新升级,并正式向公众开放了“文生图”功能。官方表示,升级后的腾讯混元中文表现力显著超过了GPT3.5,代码能力提升了20%,达到了业界领先水平。这一消息引起了广泛关注,让人们对于腾讯混元大模型的未来发展充满期待。
▲ 图源鹅厂技术派公众号大模型文生图的制作面临着三大挑战,即对提示词语义的准确理解、生成内容的合理性以及生成图像的效果。为了应对这些难题,腾讯公司投入专项技术力量进行深入研究,并研发出一系列具有创新性的算法。
在语义理解方面,腾讯混元采用了中英文双语细粒度的模型,模型同时建模中英文实现双语理解,而不是通过翻译,通过优化算法提升了模型对细节的感知能力与生成效果,有效避免多文化差异下的理解错误。
在内容合理性方面,AI 生成人体结构和手部经常出现变形现象。为了改善这一问题,混元文生图采用了先进的算法模型,强化了图像二维空间位置感知能力,并融入了人体骨架和人手结构等先验信息。这样一来,生成的图像结构更加合理,错误率得到了显著降低。
在画面质感方面,混元文生图基于多模型融合的方法,提升生成质感。经过模型算法的优化之后,混元文生图的人像模型,包含发丝、皱纹等细节的效果提升了 30%,场景模型,包含草木、波纹等细节的效果提升了 25%。
广告如果用户想生成一张更接近真人感的照片,或接近实拍的图片,可以加上“真实感”或“摄影风”等描述;如果用户想要特定风格的图片,建议在提示词中加入该风格的描述,如油画风、赛博朋克风等。此外,用户还可以对画面进行尽可能详细地描述,以获得满意的效果。
据介绍,腾讯内部的多个开发平台已经成功接入腾讯混元大模型,这一数字已经超过了180个,涵盖了腾讯会议、腾讯文档、企业微信、腾讯广告以及微信搜一搜等多个内部业务。这些成功的案例充分展示了腾讯混元大模型在实际应用中的强大能力和广阔前景。
▲ 图源IT之家网友近日,有IT之家网友反馈已经通过混元大模型内测审核,并分享了相关操作页面。从截图中可以看到,混元大模型支持制定面试大纲、旅行计划、PPT 大纲、健身计划等功能,分为工作、编程、营销、生活等选项。
此外,混元大模型还支持 AI 对话功能,已经通过的内测申请的用户可以尝鲜一下。
IT之家附更多生成图:
▲ 图源鹅厂技术派公众号,下同广告IT之家, 腾讯混元大模型, 文生图, 功能升级
AI时代,拥有个人微信机器人AI助手!AI时代不落人后!
免费ChatGPT问答,办公、写作、生活好得力助手!
搜索微信号aigc666aigc999或上边扫码,即可拥有个人AI助手!