文章主题:
作者|星奈
编辑|方奇
媒体|AI大模型工场
腾讯混元大模型虽迟但到。
在2023腾讯全球数字生态大会上,腾讯混元大模型正式亮相,并宣布通过腾讯云对外开放。
最近,以文心一言、百川智能为代表的大模型,已经面向社会开放,一周后,腾讯混元才姗姗来迟,正式公开内测。不同于其他大模型厂商,腾讯在大模型探索中有着自己的初心和坚持。
“不着急”是腾讯做大模型带给我们最直接的感受。马化腾曾明确表态:“腾讯不急于做半成品”。
“不着急”背后是腾讯在落地实践上的坚持,此次混元的亮相,让我们看到了大模型落地各行业的更多可能性。
AI大模型工场了解到,微信已经上线“腾讯混元助手”小程序,支持AI问答/绘画,图标类似太极阴阳图案AI,目前需要注册手机号排队等待内测。
全链路技术自研,从零到两万亿
腾讯集团副总裁蒋杰介绍,腾讯混元大模型从第一个token开始从零训练,掌握了从模型算法到机器学习框架,再到AI基础设施的全链路自研技术。
目前腾讯混元的参数规模超千亿,预训练语料超2万亿tokens,具备强大的中文创作能力,复杂语境下的逻辑推理能力,以及可靠的任务执行能力。
蒋杰自信地表示:“正因为我们掌握了全链条技术,所以有信心在未来不断升级这一技术体系,以应对外部环境的各种变化。”
在大模型赛道上,国内外参赛选手并不在少数,但拥有全链路自研能力的大模型厂商屈指可数。
在全球范围内,除了谷歌、微软、亚马逊、阿百度、腾讯、华为等具有强大软硬件支撑的厂商,其他大模型厂商很难做到全链路自研。
腾讯混元全链路自研,无疑给大模型赛场扔下了一枚重磅炸弹。
据悉,混元大模型参数量超千亿,具备多轮对话能力,内容创作能力,逻辑推理能力,搜索增强和知识图谱。训练数据更新至今年7月份,未来会不断更新迭代。
从2021年开始,腾讯先后推出千亿和万亿参数的NLP稀疏大模型,打破CLUE三大榜单记录,实现在中文理解能力上的新突破。
目前,业界大模型在场景中的应用依然有限,主要集中在容错率高、任务简单的休闲场景。腾讯在算法层面进行了一系列自研创新,提高了模型可靠性和成熟度。
针对大模型容易“胡言乱语”的问题,腾讯优化了预训练算法及策略,让混元大模型的幻觉相比主流开源大模型降低了30%至50%;通过强化学习的方法,让模型学会识别陷阱问题;通过位置编码优化,提高了超长文的处理效果和性能;提出思维链的新策略,让大模型能够像人一样结合实际的应用场景进行推理和决策。
此外,腾讯还自研了机器学习框架Angel,使训练速度相比业界主流框架提升1 倍,推理速度比业界主流框架提升1.3倍。
得益于全链路自研技术,腾讯混元大模型能够理解上下文的含义,并且有长文记忆能力,可以流畅地进行专业领域的多轮对话。除此之外,它还能进行文学创作、文本摘要、角色扮演等内容创作,做到充分理解用户意图,并高效、准确的给出有时效性的答复。
上海财经大学校长刘元春认为:“借助于全链路自研,中国将不断积累大模型相关人才和技术,逐渐形成体系化的产业链、人才链、技术链和创新链,最终走出一条发展通用人工智能的中国路径,助力我们在数字技术的创新上取得突破性进展。”
腾讯混元大模型,更看重“实用性”
蒋杰表示:“我们研发大模型的目标不是在评测上获得高分,而是将技术应用到实际场景中。”
“实用性”贯穿腾讯探索大模型的始终。
官方将混元大模型定义为:“从实践中来,到实践中去”的实用级大模型。
目前混元已接入超过50个腾讯业务和产品测试,并取得初步效果,包括腾讯云、腾讯广告、腾讯游戏、腾讯金融科技、腾讯会议、腾讯文档、微信搜一搜、QQ浏览器等业务和产品,混元大模型正逐步成为腾讯公司的业务智能底座。
大会上,蒋杰展示了腾讯会议、腾讯文档、腾讯广告等多个业务,在接入腾讯混元大模型后的实际应用情况。
比如腾讯会议基于混元大模型打造了AI小助手,只需要简单的自然语言指令,就能完成会议信息提取、内容分析等复杂任务,会后还能生成智能总结纪要。据实测,在指令理解、会中问答、会议摘要、会议待办项等多个方面,混元大模型均获得较高的用户采纳率。
此外,腾讯混元在产业场景的应用不断落地。
腾讯推出了“腾讯云MaaS服务”,在腾讯云行业大模型精选商店中,提供混元大模型,同时上架20多种行业最新、最流行的开源通用大模型,以及覆盖金融、文旅、零售、政务、医疗、教育等20多个领域的行业大模型。
腾讯将大模型与腾讯的行业解决方案、企业级应用结合,在生产、营销、售后服务、办公等多个环节,实现能力提升,达至降本增效。
在智能生产方面,以创新方式破解场景痛点。例如,在能源领域,腾讯通过训练电力视觉大模型,一个模型可以有效适应不同电网场景,具有高检出率、低误检率、支持少样本训练、泛化能力强的优势,助力电网生产经营和减负增效。
在智能营销方面,提升服务效率。在营销中,新一代的腾讯企点智能客服,基于行业模型,结合客户业务需求进行训练与精调,可以提供更精准、更详细的回答,复杂问题的解决率,比之前提升了30%。同时,销售人员用自然语言提问,就可以实现准确的商业分析,几秒钟可以获取一份PPT,不再需要花费大量的时间,学习复杂的软件、制作看板。
最近,腾讯云也全面接入Llama 2、Bloom等20多个主流模型,和混元一样,都支持直接部署调用。客户可以根据实际需求,基于混元、也可以基于开源模型,打造自己专属的行业大模型。
腾讯集团高级执行副总裁、云与智慧产业事业群CEO汤道生表示:“以大模型生成技术为核心,人工智能正在成为下一轮数字化发展的关键动力,也为解决产业痛点带来了全新的思路。大模型需要基于产业场景,与企业数据融合,才能释放出最大的价值。”
在大模型狂飙的近300天里,各大企业各展神通,腾讯混元姗姗来迟,能否成为国产大模型的新巨星,我们拭目以待。
AIGC大模型工场已经组织了非常精准的「AI大模型垂直社群」,覆盖超1000位AIGC圈,百度大模型业务负责人,京东大模型业务负责人,腾讯大模型业务人,阿里云大模型技术负责人,科大讯飞大模型公关,商汤大模型业务,阅文大模型公关,360大模型公关负责人都在群里啦,欢迎大模型业务负责人加入。请加微信fqq2000nian,注明真实身份。数据支持天眼查,大模型独家合作账号— END —监制 / 刘老师编辑 / AIGCCCCC视觉 / 大模型微博 / @AI大模型工场TG/AI Marketing Field大模型应用创业者,你怎么看?■ 百度文心一言,阿里通义千问 ▍通用大模型案例
■ 科大讯飞星火 京东 ▍产业大模型案例
■ 商汤日日新、腾讯,昆仑万维 ▍ 金融大模型案例
■ 盘古大模型,中国电信,医联 ▍医疗大模型案例
■阅文大模型,腾讯音乐大模型 ▍ 文娱大模型案例
■知乎,360大模型,火山引擎 ▍ 教育大模型案例
■ 网易,金山办公大模型 ▍ 更多行业大模型案例
上次介绍科大讯飞大模型链接
本文由大模型领域垂直媒体「AI大模型工场」
原创出品,未经许可,请勿转载。
/
欢迎提供新的大模型商业化落地思路
AI时代,拥有个人微信机器人AI助手!AI时代不落人后!
免费ChatGPT问答,办公、写作、生活好得力助手!
搜索微信号aigc666aigc999或上边扫码,即可拥有个人AI助手!