文章主题:腾讯混元大模型, 腾讯云, NLP稀疏大模型, 模型算法

666AI工具大全,助力做AI时代先行者!

界面新闻记者 崔鹏

在2023年的腾讯全球数字生态大会上,腾讯公司终于正式推出了其混元大模型,并宣布将其开放给腾讯云用户使用。这一消息于9月7日正式公布,引起了广泛的关注和期待。作为一款全新的AI技术产品,混元大模型采用了先进的自然语言处理、计算机视觉和深度学习等技术,能够实现多种任务场景下的智能应用,如语音识别、文本生成、图像识别等。这款模型的推出,标志着腾讯在人工智能领域的技术实力进一步得到了提升和巩固。此次将混元大模型开放给腾讯云用户使用,也是腾讯在推动AI技术普及和应用方面的一次重要尝试。腾讯云作为一个领先的云计算平台,拥有庞大的用户基础和强大的技术支持,将混元大模型引入到云计算领域,将为广大用户提供更加智能化、高效化的服务体验。总的来说,腾讯混元大模型的正式亮相和开放,不仅展示了腾讯在人工智能领域的技术创新和实力,也为广大用户提供了更加便捷、高效的AI应用服务。相信随着混元大模型的不断升级和完善,它将在未来的数字生态中发挥越来越重要的作用。

腾讯集团高级执行副总裁、云与智慧产业事业群CEO汤道生阐述,混元大模型是一款由腾讯全链路自主研发的通用大语言模型,其具备超过千亿参数的规模,并且已经预先训练了超过2万亿个 tokens 的语料库。

汤道生表示,混元大模型具备卓越的中文解析和创作技巧、逻辑推导能力,同时拥有稳定的任务执行效能。在应对大模型普遍存在的“幻觉”问题方面,该模型已取得显著的成果。

在未来的发展中,它将成为腾讯云MaaS服务的基础设施。用户不仅可以通过API调用来使用混元,还可以将其作为基础模型,开发各种产业场景的应用。

腾讯官方消息显示,腾讯已与超过1万家外部合作伙伴共同推出覆盖100多个产业场景的行业解决方案。在上一年度,这些生态伙伴所贡献的收入占比达到了腾讯云整体收入的三分之一,而且其收入增速是腾讯云增速的4倍。

在采访过程中,腾讯集团副总裁蒋杰向界面新闻等媒体透露,混元大模型已成功接入腾讯的众多业务领域,涵盖了腾讯云、腾讯广告、腾讯游戏、腾讯会议、腾讯文档、微信搜一搜以及QQ浏览器等多个业务和产品。此外,混元大模型的应用已取得了显著的成果。

全链路自研

从2021年开始,腾讯先后推出千亿和万亿参数的NLP稀疏大模型,打破CLUE三大榜单记录,实现在中文理解能力上的新突破。

蒋杰透露称,腾讯混元大模型从第一个token开始就从零开始训练,掌握了从模型算法到机器学习框架,再到AI基础设施的全链路自研技术。

他认为,目前业界大模型在场景中的应用依然有限,主要集中在容错率高、任务简单的休闲场景。腾讯在算法层面进行针对性研发,解决大模型目前存在的“幻觉”问题。

针对大模型容易“胡言乱语”的问题,腾讯优化了预训练算法及策略,让混元大模型的幻觉相比主流开源大模型降低了30%至50%。

同时,通过强化学习的方法,让模型学会识别陷阱问题,可以拒绝回答不恰当的用户问题;通过位置编码优化,提高了超长文的处理效果和性能。

此外,腾讯的研发团队还提出了思维链的新策略,能够让大模型能够像人一样结合实际的应用场景进行推理和决策。

蒋杰表示,腾讯的自研机器学习框架Angel让训练速度相比业界主流框架提升1倍,推理速度比业界主流框架提升1.3倍。

因此,腾讯混元大模型能够理解上下文的含义,并且有长文记忆能力,可以流畅地进行专业领域的多轮对话。腾讯方面表示,它能进行文学创作、文本摘要、角色扮演等内容创作,做到充分理解用户意图,并高效、准确的给出有时效性的答复。

在发布会上,蒋杰还用中国信通院《大规模预训练模型技术和应用的评估方法》的标准符合性测试结果,来印证混元大模型的能力。

在这项评测中,混元大模型共测评66个能力项,在“模型开发”和“模型能力”两个重要领域的综合评价均获得了当前的最高分。在主流的评测集MMLU、CEval和AGI-eval上,混元大模型均有优异的表现。

腾讯全面拥抱大模型

蒋杰在发布会上说,腾讯研发大模型的目标不是在评测上获得高分,而是将技术应用到实际场景中,“腾讯将全面拥抱大模型。”

他也同时展示了腾讯会议、腾讯文档、腾讯广告等多个业务接入腾讯混元大模型后的实际应用情况。

比如腾讯会议基于混元大模型开发的AI小助手,只需要简单的自然语言指令,就能完成会议信息提取、内容分析等复杂任务,会后还能生成智能总结纪要。

据实测,在指令理解、会中问答、会议摘要、会议待办项等多个方面,混元大模型均获得较高的用户采纳率,相较于GPT3.5有明显的优势。

在文档处理方面,腾讯混元大模型支持数十种文本创作场景,能够一键生成标准格式文本,熟悉上百种Excel公式,支持自然语言生成函数,并基于表格内容生成图表。

腾讯方面表示,这些文档处理功能目前正在内测阶段,将在成熟后面向用户开放。

在广告业务场景,腾讯混元大模型支持智能化的广告素材创作,可以结合行业与地域特色,实现文字、图片、视频的自然融合。

今年6月,腾讯云曾推出模型即服务(MaaS)解决方案,提供涵盖模型预训练、模型精调、智能应用开发等一站式的行业大模型服务。

蒋杰表示,目前腾讯云已经全面接入Llama 2、Bloom等20多个主流模型,并支持直接部署调用。客户可以根据实际需求,既可以基于混元大模型,也可以基于开源模型,打造自己的行业大模型。

AI时代,拥有个人微信机器人AI助手!AI时代不落人后!

免费ChatGPT问答,办公、写作、生活好得力助手!

搜索微信号aigc666aigc999或上边扫码,即可拥有个人AI助手!

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注