文章主题:腾讯, 混元大模型, 文生图, 人工智能
近期,我国科技巨头腾讯公司宣布其混元大模型已实现最新升级,并开放了“文生图”功能。在相关采访中,腾讯混元大模型文生图技术的负责人芦清林透露,自2022年8月起,文生图功能开始进行研发和优化,而在2023年,该功能将获得更显著的投入和推广。
在今年的9月7日,我国科技巨头腾讯通过其腾讯云平台,正式向公众开放了其通用大模型“腾讯混元”。这一模型是由腾讯全链路自主研发的,其规模之庞大,更是达到了超千亿参数的程度。同时,预训练语料库也超过了2万亿tokens,显示出了其强大的技术实力。仅仅一个月多的时间,腾讯方面就透露出,已经有超过180个腾讯内部的业务已经接入了腾讯混元,这些业务涵盖了腾讯会议、腾讯文档、企业微信、腾讯广告以及微信搜一搜等多个领域。此外,QQ浏览器也基于腾讯混元推出了“PDF阅读助手”,这款工具不仅具备智能摘要功能,还能进行智能问答和多轮提问,大大提高了用户的使用体验。
腾讯机器学习平台的算法负责人康战辉透露,混元模型在大型主模型之外,还成功产生了7B、13B等中小型模型。这些模型均基于腾讯自主研发的训练框架AngelPTM平台构建,并通过API接口实现业务形态。
在过去的一个月多时间里,混元大模型的提升主要集中在代码能力和数据推理能力的优化上,相较于之前的性能,这两项能力分别取得了20%的进步。这一点得到了康战辉的确认。
在当前的时代背景下,各个行业都在寻求数字化转型的路径,而腾讯云作为我国领先的云计算服务提供商,凭借其强大的技术实力和丰富的行业经验,成功地为众多行业提供了腾讯混元大模型API的调用服务。这些行业涵盖了零售、教育、金融、医疗、传媒、交通、政务等多个领域,应用场景则包括智能问答、内容创作、数据分析、代码助手等多个方面。这种多元化的合作模式不仅推动了各行业的创新发展,也为腾讯云在人工智能领域的布局增添了更深的层次和广度。
在除底座技术之外的其他方面,康战辉指出,大模型指令面临着几个主要挑战。首先,要解决模型泛化的問題,这需要在模型在样本数据上表现出色之後,進行任務訓練過程中的抗干擾能力。其次,需要處理多輪對話的問題。最後,對於複雜指令的自動進化,必須解決訓練集中數據質量與複雜性之間的問題。
收入方面,康战辉表示,目前腾讯接入混元的180个业务数量较9月的首次披露增长了三倍,其中60多项业务做精调,至于180多项业务中哪些是千亿规模、哪些是中小模型,以及包括微信、QQ等具体业务接入的大模型参数与能力情况,采访中康战辉并未具体透露。

此次,腾讯宣布混元大模型文生图功能上线,落地场景中广告业务效果较为明显。芦清林表示,大模型文生图的难点体现在对提示词的语义理解、生成内容的合理性,以及生成图片的效果。针对这三个技术难点,腾讯进行了专项技术研究,提出了一系列原创算法,来保证生成图片的可用性和画质,如采用中英文双语细粒度模型、增强算法模型的图像二维空间位置感知能力等。另外针对文生图存在的版权问题,芦清林对第一财经记者表示,需要把控好训练数据,包括公开数据集与采买数据。
7月,阿里云宣布推出AI绘画模型通义万相,支持文生图等功能。阿里业务结合方面,钉钉斜杠“/”已接入通义万相,用户可通过“/”在钉钉文档、群聊、会议等场景中唤起作图、绘画等图片生成服务。
对于腾讯集团内部业务与文生图功能的结合,芦清林对记者表示,混元大模型文生图功能目前主要在成熟商业场景中打磨能力,目前已被用于素材创作、商品合成、游戏出图等多项业务中,此外在广告业务下的多轮测评中,腾讯混元文生图的案例优秀率和广告主采纳率分别达到86%和26%。
作为文生图应用的代表,Midjourney的商业化部分采用每月10到60美元的订阅服务模式。对于混元文生图会否开辟独立收费模式,芦清林对记者表示,目前没有这样的计划,收费一定是客户对具体诉求有明确的商业价值定性才合理,本质上是与已有的商业做链接。既然腾讯内部有很多产品流量和商业行为,混元就先做这些。如果业务想进行售卖,如企业微信,团队也会与他们进行合作,支撑业务进行商业模式的尝试。

AI时代,拥有个人微信机器人AI助手!AI时代不落人后!
免费ChatGPT问答,办公、写作、生活好得力助手!
搜索微信号aigc666aigc999或上边扫码,即可拥有个人AI助手!

