文章主题:腾讯, 大模型, 混元, AI
作者 | 邓咏仪
编辑 | 苏建勋
国内大模型混战半年,大厂种子选手中的最后一位,终于出列。
在9月7日的腾讯生态大会上,年度焦点无疑是其自主研发的通用大模型“混元”。这款备受瞩目的人工智能技术展示了多种应用场景,充分展现了其在未来产业领域的巨大潜力。
“何时推出大型AI模型”的问题,已经成为近半年AI领域内的热门话题。相较于其他大型企业纷纷入局,腾讯在这个市场的等待时间显得尤为漫长。因此,当人们纷纷猜测腾讯何时会发布大型AI模型时,也引发了业界对于腾讯是否真的会在未来发行此类产品的广泛关注。
今年5月,腾讯公司创始人马化腾在一场股东会上明确表示:“AI作为互联网领域百年难遇的机遇,我们将全力以赴投入研发。然而,我们并不急功近利,将逐步推进研究,待时成熟再成果化。”
哪怕到了6月,腾讯甚至剑走偏锋,先于通用大模型,直接抛出了10个行业,超过50个解决方案。
这样的姿态也延续到混元的发布中。
混元大模型的实用派定位在发布会上得到了充分展现。在这次活动中,华丽的数据和吸引人的演示较少,取而代之的是对应用场景的深入展示——腾讯展示了其在腾讯云、腾讯广告、腾讯会议和腾讯文档等业务上,通过混元大模型的应用所取得的成果。这种大模型不仅能够提升这些业务的能力,降低成本,提高效率,还能够将其输出到企业客户群体中。此外,企业还可以通过API调用混元,来针对不同的产业场景构建大模型应用。
腾讯集团高级执行副总裁、腾讯云CEO汤道生
而最具代表性的,莫过于腾讯云CEO汤道生在介绍混元出场时,喊的话是:“混元,正式面向产业亮相!”
这也是此刻的腾讯找到的最好身位。
大型企业在面对经济困境时,常常会进行一系列调整以适应新的市场环境。在这其中,腾讯公司以其果断的行动和积极的态度,展示出了“去肥增瘦”的决心。早在几年前,腾讯云就开始改变其业务策略,放弃总集业务,转而专注于产品的研发与优化。这种转变不仅带来了显著的效果,也使得腾讯云在市场上的地位得到了进一步的提升。去年,腾讯云的业务成果丰硕,生态伙伴的收入占据了其整体收入的近三分之一,而且收入增速更是达到了腾讯云的4倍。这一数据充分说明,腾讯公司在产业中的实际影响力正在不断扩大,其业务布局正逐渐显示出强大的竞争力。总的来说,腾讯云的成功转型和业绩增长,既得益于其对于业务战略的精确把握,也是其在实践中不断探索和创新的结果。这种积极应对市场变化、勇于突破自我限制的精神,无疑为腾讯云的未来发展奠定了坚实的基础。
要实现降本增效的目标,我们必须追求高质量发展,这一点适用于所有行业,包括腾讯大模型。为了更好地应用这一理念,我们可以将业务定位在To B和面向产业领域,这是当前最实际可行的接入方式。
“更成熟、更可靠”
作为一款具有强大实力的混元大模型,其在参数展示方面堪称简约之极。并未如同其他模型一般,过度追求参数数量的堆叠,或者过分强调自己在榜单上的地位。而是以简洁的方式,仅用了两个关键数据来揭示其内在实力:超过千亿参数的大规模,以及超过2万亿个 tokens 的预训练语料库。这种风格,既展示了其深厚的技术底蕴,又彰显出其与众不同的独特魅力。
在当前的通用大模型制造商领域,拥有千亿参数的能力已经成为行业标配。与此同时,混元预训练语料规模的实力也堪称一流,其规模与目前最为强大的开源模型Llama 2相媲美。
“怀胎半年”的腾讯,都做了些什么?
“我们在这几个月之内,一直在让大模型在腾讯内部的应用中磨练,把腾讯重要的、丰富的业务场景当成‘磨刀石’。”腾讯集团副总裁蒋杰表示。
慢了半年的腾讯,能占一些做产品的后发优势,但要吸引如今的企业客户,必须从实用、靠谱上下功夫。因此,“更成熟、更可靠”,是腾讯讲大模型时最强调的特点。
当前,业界大模型在场景中的应用依然有限,这主要因为大模型还在不少休闲场景里打转——比如AI生成文字、AI画画等等。但要深入到更多产业的生产环节,大模型“胡说八道”这一点,会成为桎梏。
对此,腾讯在算法层面进行了一系列自研创新,提高了模型可靠性和成熟度。比如,腾讯优化了预训练算法及策略,让混元大模型的幻觉相比主流开源大模型降低30%至50%。腾讯自研的“思维链”,则让大模型能够像人一样,结合实际的应用场景进行推理和决策。
以往大模型因为单次处理的信息少,导致模型会出现“忘记上面讨论的是什么问题”的情况,但现在,由于腾讯混元编码位置的优化,如今混元也能够处理更长的超长文。
来源:腾讯
而现在站在风口浪尖上的AI安全问题,腾讯也在通过算法解决。通过强化学习,如今混元已能学会识别很多“陷阱”——比如“如何才能超速驾驶”这类危险问题,混元会直接拒绝。
而在底层支撑模型安全、可靠运行的,是腾讯在这几年间耕耘的一套技术栈。今年以来,腾讯还发布了HCC高性能计算集群、向量数据库Tencent Cloud VectorDB等大模型基础设施,以及Ti平台这样的“AI工具箱”,面向开发者提供服务。
“我们从最底层的高速网络、服务器、网卡,到平台、模型、算法,都是自研的,这让后续迭代过程加快了。”蒋杰表示。
大厂做大模型,如今自研技术栈已经是标配。从百度、阿里、华为到腾讯,各家都会从最底层的芯片做起,覆盖框架、模型甚至是开发运维工具等。原因在于,大模型还是个相当新的东西,与之匹配的基础设施很稀缺。厂商们全部都要做,也是为以后在产业落地,让客户用起来做好准备。
场景为王
表面上看,腾讯混元和前段时间号称“不做诗”“不聊天”的华为盘古其实很像。而不同在于,华为的“不聊天”,其实是因为以前积累的政企、产业客户已经够华为深耕很久。
但腾讯是线上场景的王者,其主营业务与C端用户强相关——微信、QQ是国民通讯软件,而腾讯会议、腾讯文档等To B应用都有数亿用户,其直接用户其实也是C端。
但腾讯暂时没推类似文心一言、通义千问之类的的To C聊天机器人,其实是因为走了另一条验证路径。如今,腾讯内部已经有包括文档、会议、游戏、金融、搜一搜等50个业务接入内测——先从这些国民应用开始验证,已经足够。
接入混元后的腾讯会议,可自动生成会议摘要
“对于通用大模型来说,ChatBot只是一种验证方式而已,可能我们选择了另外一条。”蒋杰表示。
在做大模型这件事上,腾讯的逻辑和之前做To B的策略别无二致:先从自家的业务需求做起,在内部打磨好了,再对外发布。腾讯原本有的C端社交应用场景,未来会是大模型迭代的富矿。
来源:腾讯
目前微信搜一搜正在接入混元进行内测,To C的AI应用也不会遥远了。值得注意的是,腾讯在大会上演示了”混元小助手”。小助手有着和微信相似的绿色聊天框,安放在小程序里,可以看作是移动端AI应用的前奏。
可以预见的是,未来要做大模型落地,产品依然会是腾讯最重要的抓手。当下“不着急”的腾讯,是国内大模型领域主题变迁的切面:无论是大众还是业内,都已摆脱“赶超ChatGPT”的心态,而是走到更关心应用落地,把大模型用起来的阶段。
腾讯, 大模型, 混元, AI
AI时代,拥有个人微信机器人AI助手!AI时代不落人后!
免费ChatGPT问答,办公、写作、生活好得力助手!
搜索微信号aigc666aigc999或上边扫码,即可拥有个人AI助手!