《腾讯混元大模型：实用主义路线的产业应用》

文章主题：腾讯, 大模型, 混元, AI

作者 | 邓咏仪

编辑 | 苏建勋

国内大模型混战半年，大厂种子选手中的最后一位，终于出列。

在9月7日的腾讯生态大会上，年度焦点无疑是其自主研发的通用大模型“混元”。这款备受瞩目的人工智能技术展示了多种应用场景，充分展现了其在未来产业领域的巨大潜力。

“何时推出大型AI模型”的问题，已经成为近半年AI领域内的热门话题。相较于其他大型企业纷纷入局，腾讯在这个市场的等待时间显得尤为漫长。因此，当人们纷纷猜测腾讯何时会发布大型AI模型时，也引发了业界对于腾讯是否真的会在未来发行此类产品的广泛关注。

今年5月，腾讯公司创始人马化腾在一场股东会上明确表示：“AI作为互联网领域百年难遇的机遇，我们将全力以赴投入研发。然而，我们并不急功近利，将逐步推进研究，待时成熟再成果化。”

哪怕到了6月，腾讯甚至剑走偏锋，先于通用大模型，直接抛出了10个行业，超过50个解决方案。

这样的姿态也延续到混元的发布中。

混元大模型的实用派定位在发布会上得到了充分展现。在这次活动中，华丽的数据和吸引人的演示较少，取而代之的是对应用场景的深入展示——腾讯展示了其在腾讯云、腾讯广告、腾讯会议和腾讯文档等业务上，通过混元大模型的应用所取得的成果。这种大模型不仅能够提升这些业务的能力，降低成本，提高效率，还能够将其输出到企业客户群体中。此外，企业还可以通过API调用混元，来针对不同的产业场景构建大模型应用。

腾讯集团高级执行副总裁、腾讯云CEO汤道生

而最具代表性的，莫过于腾讯云CEO汤道生在介绍混元出场时，喊的话是：“混元，正式面向产业亮相！”

这也是此刻的腾讯找到的最好身位。

大型企业在面对经济困境时，常常会进行一系列调整以适应新的市场环境。在这其中，腾讯公司以其果断的行动和积极的态度，展示出了“去肥增瘦”的决心。早在几年前，腾讯云就开始改变其业务策略，放弃总集业务，转而专注于产品的研发与优化。这种转变不仅带来了显著的效果，也使得腾讯云在市场上的地位得到了进一步的提升。去年，腾讯云的业务成果丰硕，生态伙伴的收入占据了其整体收入的近三分之一，而且收入增速更是达到了腾讯云的4倍。这一数据充分说明，腾讯公司在产业中的实际影响力正在不断扩大，其业务布局正逐渐显示出强大的竞争力。总的来说，腾讯云的成功转型和业绩增长，既得益于其对于业务战略的精确把握，也是其在实践中不断探索和创新的结果。这种积极应对市场变化、勇于突破自我限制的精神，无疑为腾讯云的未来发展奠定了坚实的基础。

要实现降本增效的目标，我们必须追求高质量发展，这一点适用于所有行业，包括腾讯大模型。为了更好地应用这一理念，我们可以将业务定位在To B和面向产业领域，这是当前最实际可行的接入方式。

“更成熟、更可靠”

作为一款具有强大实力的混元大模型，其在参数展示方面堪称简约之极。并未如同其他模型一般，过度追求参数数量的堆叠，或者过分强调自己在榜单上的地位。而是以简洁的方式，仅用了两个关键数据来揭示其内在实力：超过千亿参数的大规模，以及超过2万亿个 tokens 的预训练语料库。这种风格，既展示了其深厚的技术底蕴，又彰显出其与众不同的独特魅力。

在当前的通用大模型制造商领域，拥有千亿参数的能力已经成为行业标配。与此同时，混元预训练语料规模的实力也堪称一流，其规模与目前最为强大的开源模型Llama 2相媲美。

“怀胎半年”的腾讯，都做了些什么？

“我们在这几个月之内，一直在让大模型在腾讯内部的应用中磨练，把腾讯重要的、丰富的业务场景当成‘磨刀石’。”腾讯集团副总裁蒋杰表示。

慢了半年的腾讯，能占一些做产品的后发优势，但要吸引如今的企业客户，必须从实用、靠谱上下功夫。因此，“更成熟、更可靠”，是腾讯讲大模型时最强调的特点。

当前，业界大模型在场景中的应用依然有限，这主要因为大模型还在不少休闲场景里打转——比如AI生成文字、AI画画等等。但要深入到更多产业的生产环节，大模型“胡说八道”这一点，会成为桎梏。

对此，腾讯在算法层面进行了一系列自研创新，提高了模型可靠性和成熟度。比如，腾讯优化了预训练算法及策略，让混元大模型的幻觉相比主流开源大模型降低30%至50%。腾讯自研的“思维链”，则让大模型能够像人一样，结合实际的应用场景进行推理和决策。

以往大模型因为单次处理的信息少，导致模型会出现“忘记上面讨论的是什么问题”的情况，但现在，由于腾讯混元编码位置的优化，如今混元也能够处理更长的超长文。

来源：腾讯

而现在站在风口浪尖上的AI安全问题，腾讯也在通过算法解决。通过强化学习，如今混元已能学会识别很多“陷阱”——比如“如何才能超速驾驶”这类危险问题，混元会直接拒绝。

而在底层支撑模型安全、可靠运行的，是腾讯在这几年间耕耘的一套技术栈。今年以来，腾讯还发布了HCC高性能计算集群、向量数据库Tencent Cloud VectorDB等大模型基础设施，以及Ti平台这样的“AI工具箱”，面向开发者提供服务。

“我们从最底层的高速网络、服务器、网卡，到平台、模型、算法，都是自研的，这让后续迭代过程加快了。”蒋杰表示。

大厂做大模型，如今自研技术栈已经是标配。从百度、阿里、华为到腾讯，各家都会从最底层的芯片做起，覆盖框架、模型甚至是开发运维工具等。原因在于，大模型还是个相当新的东西，与之匹配的基础设施很稀缺。厂商们全部都要做，也是为以后在产业落地，让客户用起来做好准备。

场景为王

表面上看，腾讯混元和前段时间号称“不做诗”“不聊天”的华为盘古其实很像。而不同在于，华为的“不聊天”，其实是因为以前积累的政企、产业客户已经够华为深耕很久。

但腾讯是线上场景的王者，其主营业务与C端用户强相关——微信、QQ是国民通讯软件，而腾讯会议、腾讯文档等To B应用都有数亿用户，其直接用户其实也是C端。

但腾讯暂时没推类似文心一言、通义千问之类的的To C聊天机器人，其实是因为走了另一条验证路径。如今，腾讯内部已经有包括文档、会议、游戏、金融、搜一搜等50个业务接入内测——先从这些国民应用开始验证，已经足够。

接入混元后的腾讯会议，可自动生成会议摘要

“对于通用大模型来说，ChatBot只是一种验证方式而已，可能我们选择了另外一条。”蒋杰表示。

在做大模型这件事上，腾讯的逻辑和之前做To B的策略别无二致：先从自家的业务需求做起，在内部打磨好了，再对外发布。腾讯原本有的C端社交应用场景，未来会是大模型迭代的富矿。

来源：腾讯

目前微信搜一搜正在接入混元进行内测，To C的AI应用也不会遥远了。值得注意的是，腾讯在大会上演示了”混元小助手”。小助手有着和微信相似的绿色聊天框，安放在小程序里，可以看作是移动端AI应用的前奏。

可以预见的是，未来要做大模型落地，产品依然会是腾讯最重要的抓手。当下“不着急”的腾讯，是国内大模型领域主题变迁的切面：无论是大众还是业内，都已摆脱“赶超ChatGPT”的心态，而是走到更关心应用落地，把大模型用起来的阶段。

腾讯, 大模型, 混元, AI

AI时代，拥有个人微信机器人AI助手！AI时代不落人后！

免费ChatGPT问答，办公、写作、生活好得力助手！

搜索微信号aigc666aigc999或上边扫码，即可拥有个人AI助手！

“更成熟、更可靠”

场景为王

相关文章

发表回复 取消回复

发表回复取消回复