鹏城-百川·脑海33B}:国产算力大模型训练的新篇章

文章主题：百川智能, 鹏城实验室, 大模型训练, 国产算力

在11月16日的新闻发布会上，我国知名的人工智能公司百川智能与鹏城实验室联合宣布，将共同开展大模型训练与应用的探索研究。双方将携手开发一款基于国产算力的128K长窗口大模型——“鹏城-百川·脑海33B”，这标志着我国国产算力大模型创新与实际应用迈出了积极的一步。

近日，我国知名的人工智能企业百川智能与鹏城实验室联合展示了他们共同研发的大模型“鹏城-百川·脑海33B”。这款模型所采用的128K长上下文窗口，是在“鹏城云脑”国产算力平台上进行训练的，预计在未来，这个窗口可以升级到192K，这将使其成为我国基于国产算力训练的最长上下文窗口。这一成果充分展示了我国在人工智能领域的技术实力和应用潜力。

上下文窗口长度对于模型在特定上下文环境中的理解、生成相应文本的能力起着至关重要的作用，它也是大模型核心技术的组成部分。一般来说，具有较长上下文窗口的模型能够提供更加丰富且准确的语义信息，有效消除歧义，从而使生成的文本在准确性和流畅性上表现更为出色。

在训练大型人工智能模型时，我们需要大量的计算能力，而这种计算能力的增强与模型的参数数量呈平方关系增长。因此，大模型的性能竞争，在一定程度上就是一场算力的较量。然而，在国际环境复杂多变的今天，我国算力供需之间的差距不断扩大，这使得国产算力成为了我国大模型企业发展的必然选择。

在我国，许多企业在通用人工智能芯片领域已经有了早期的布局，并且在芯片的生产、生态的塑造以及应用的扩展上都有了显著的进步。然而，当谈到基于国产算力训练大型模型时，我们仍然面临一些挑战，包括生态的建设、成本的控制以及能效比的优化等问题。因此，要想实现算力的完全自主，我们需要芯片制造商、大型模型公司以及学术研究机构等多方面的共同努力。

鹏城实验室强调，其始终坚守”国产算力自主大模型”的创新信念，借助于”鹏城·脑海”开源联合体的支持，深度整合企业、高校以及科研机构的力量，以开源协同的方式共享资源，旨在为各行各业提供人工智能的”翅膀”。百川智能作为国内领先的大模型企业，自创立以来就专注于大模型的研发和开源生态的建设，其开放和封闭式的模型在权威评测中均表现优异。在合作过程中，双方都能充分运用自身优势，形成强大的合力，以此更好地满足我国智能化转型的需求，有力推动我国人工智能产业的快速发展。

百川智能表示，百川智能希望通过开源、与合作伙伴共创等方式助力中国大模型创新，繁荣本土大模型生态。鹏城实验室作为国家战略科技力量的重要组成部分，在国产算力大模型研发和应用等方面一直处于国内领先位置。本次百川智能与鹏城实验室合作研发“鹏城-百川·脑海33B”长窗口大模型，是国产算力大模型技术创新和落地的一次突破。未来，百川智能将在技术、算力等诸多维度不断深化与鹏城实验室的合作，持续助力本土大模型创新发展。

文/北京青年报记者温婧

编辑/田野

AI时代，拥有个人微信机器人AI助手！AI时代不落人后！

免费ChatGPT问答，办公、写作、生活好得力助手！

搜索微信号aigc666aigc999或上边扫码，即可拥有个人AI助手！

相关文章

发表回复 取消回复

发表回复取消回复