腾讯混元_666AI大模型

腾讯混元

文生图：腾讯混元大模型引领图像自动生成新潮流

腾讯混元大模型迎来全新升级，正式对外开放“文生图”功能，展示其在图像自动生成领域的领先能力。升级后的模型综合能力超过GPT3.5，代码能力大幅提升20%，达到业界领先水平。该模型已应用于腾讯内部180多个业务场景，涵盖腾讯会议、腾讯文档、企业微信、腾讯广告和微信搜一搜等。此外，腾讯自研的面向垂直领域的7B和13B模型也首次亮相，具有更高的性价比和效率，能够满足各种垂直场景和业务需求。

5 months前 0

腾讯混元

腾讯混元大模型：文生图功能引领图像自动生成领域

本文介绍了腾讯混元大模型的最新升级及“文生图”功能的对外开放。升级后的腾讯混元中文能力超过GPT3.5，达到业界领先水平。文生图功能在人像真实感、场景真实感等方面具有明显优势，并成功应用于广告场景、素材创作、商品合成、游戏出图等多项业务。如今已有超过180个腾讯内部业务接入腾讯混元，并在多个行业实现了广泛的应用。

5 months前 0

腾讯混元

国产大模型训练效率大幅提升，支持腾讯混元大模型“开箱即用”以色列监狱“拉皮条”事件：多名女狱警供犯人玩乐，长官负责牵线

在算力紧缺的背景下，如何提升大模型训练和推理的效率，并降低成本，成为业界关注的焦点。 11月23日，腾讯披露，腾讯混元大模型背后的自研机器学习框架Angel再次升级，大模型训练效率提升至主流开源框架的2.6倍，千亿级大模型训练可节省50%算力成本。升级后的Angel支持单任务万卡级别超大规模训练，进一步提升腾讯云HCC大模型专属算力集群的性能和效率。同时，Angel还提供了从模型研发到应用落地的一站式平台，支持用户通过API接口或精调等方式快速调用腾讯混元大模型能力，加速大模型应用构建，腾讯会议、腾讯新闻、腾讯视频等超过300个腾讯产品及场景均已接入腾讯混元内测。目前，相关能力已通过腾讯云对外开放。基于升级后的Angel机器学习框架，腾讯云TI平台可提供更优的训练和推理加速能力，并支持客户用自己的数据一站式训练精调，基于腾讯混元大模型打造专属智能应用。自研机器学习框架升级，大模型训练推理效率再提升随着大模型时代到来，模型参数呈指数级增长，达到万亿级别。大模型逐渐从支持单一模态和任务发展为支持多种模态下的多种任务。在这种趋势下，大模型训练所需算力巨大，远超单个芯片的处理速度，而多卡分布式训练通信损耗巨大。如何提高硬件资源利用率，成为影响国产大模型技术发展和实用性的重要前提。面向大模型训练，腾讯自研了机器学习训练框架AngelPTM，针对预训练、模型精调和强化学习等全流程进行加速和优化。AngelPTM采用最新的FP8混合精度训练技术，结合深度优化后的4D并行和ZeROCache机制优化存储，可兼容适配多款国产化硬件，能够以更少的资源和更快的速度训练更大的模型。 2023年4月，腾讯云面向大模型而生的新一代HCC高性能计算集群正式发布，性能较前代提升3倍。除了硬件的升级，针对大模型训练场景，HCC对网络协议、通信策略、AI框架、模型编译等进行系统级优化，大幅节约训练调优和算力成本。此前AngelPTM就已经通过HCC对外提供服务，本次Angel机器学习框架升级，也将进一步提升HCC大模型专属算力集群的性能，助力企业加速大模型落地。模型参数的增大不仅给训练带来了挑战，还导致了推理成本的不断上升。为解决这一问题，腾讯自研的大模型推理框架AngelHCF通过扩展并行能力、采用多种Attention优化策略等方式对性能进行了提升。同时，框架还适配了多种压缩算法，以提高吞吐能力，从而实现更快的推理性能和更低的成本，支持大型模型推理服务。相较于业界主流框架，AngelHCF的推理速度提高了1.3倍。在腾讯混元大模型文生图的应用中，推理耗时从原本的10秒缩短至3至4秒。此外，AngelHCF还支持多种灵活的大模型压缩和量化策略，支持自动压缩。一站式应用构建，让大模型“开箱即用” 作为实用级大模型，腾讯混元大模型从研发之初就面向应用场景而生，在实践中解决大模型落地难点。腾讯产品及应用种类多、流量大，让模型真正“用起来”挑战很大。基于Angel，腾讯构建了大模型接入和应用开发的一站式平台，包含数据处理、精调、模型评估、一键部署以及提示词调优等服务，让大模型的“开箱即用”成为可能。模型接入层面，腾讯混元大模型提供千亿、百亿、十亿多个尺寸的模型，充分适配各类应用场景的需求，只需要经过简单微调就能达到满足业务需求的效果，同时降低模型训练和推理服务的资源成本，在问答、内容分类等常见应用场景中具有更高的性价比。应用开发层面，腾讯内部已有超过300项业务和应用场景接入腾讯混元大模型内测，相比上个月数量翻了一倍，覆盖文本总结、摘要、创作、翻译、代码等多个领域。 2023年9月，腾讯自研的实用级大模型腾讯混元正式亮相并通过腾讯云开放。腾讯混元拥有超千亿参数规模，预训练语料超 2 万亿 tokens，聚合了腾讯在预训练算法、机器学习平台和底层算力资源多个层面的自研技术积累，并在应用中持续迭代，不断优化大模型能力。目前，已有来自零售、教育、金融、医疗、传媒、交通、政务等多个行业的客户，通过腾讯云接入腾讯混元大模型。

5 months前 0

腾讯混元

全国首批！腾讯混元通过国家“大模型标准测试”羊城派2023-12-23 20:10羊城派2023-12-23 20:10

12月22日，全国首个官方“大模型标准符合性测试”结果公布，包括腾讯混元大模型、百度文心一言、360智脑、阿里云通义千问四款国产大模型首批通过国家大模型标准测试。为促进国内大模型和人工智能产业健康发展，2023年，中国电子技术标准化研究院发起“大模型标准符合性评测” ，围绕多领域多维度模型评测框架与指标体系，涵盖语言、语音、视觉等多模态领域，建立大模型标准符合性名录，引领人工智能产业健康有序发展。腾讯混元大模型是由腾讯全链路自研的通用大语言模型，拥有超千亿参数规模，预训练语料超2万亿tokens，具备强大的中文创作能力，复杂语境下的逻辑推理能力，以及可靠的任务执行能力。 2023年10月，腾讯混元大模型正式对外开放“文生图”功能，腾讯也推出千亿、百亿以及十亿等不同尺寸的大模型。作为实用级的通用大模型，腾讯内部已有超过300项业务和应用场景接入腾讯混元大模型内测，包括腾讯会议、腾讯文档、企业微信、腾讯广告和微信搜一搜等。腾讯云目前已将大模型技术与20多个行业融合，提供超过50个行业大模型解决方案，助力客户提质增效。文/记者王丹阳图/受访者供图举报/反馈

5 months前 0