文章主题:百川智能, 鹏城实验室, 大模型训练, 国产算力
在11月16日,我国知名的人工智能公司百川智能与鹏城实验室联合宣布,将共同开展大模型训练与应用的探索研究。双方将共同开发一款基于国产算力的128K长窗口大模型——“鹏城-百川·脑海33B”,这标志着我国国产算力大模型创新与实际应用迈出了积极的一步。
近日,我国知名的人工智能企业——百川智能与鹏城实验室携手展示了他们共同研发的一款强大的人工智能模型——“鹏城-百川·脑海33B”。这款模型的独特之处在于其拥有128K的长上下文窗口,这一数值使得它在同类产品中独树一帜。值得一提的是,这个窗口 size 是基于我国自主研发的“鹏城云脑”国产算力平台进行训练的,预计在未来,它还将升级至更大的192K。作为一款国产算力训练的人工智能模型,“鹏城-百川·脑海33B”无疑代表了我国人工智能领域的发展新高度。
上下文窗口长度对于模型在特定上下文环境中的理解、生成相应文本的能力起着至关重要的作用,它作为大模型核心技术的组成部分。一般来说,具有较长上下文窗口的模型能够提供更加全面的语义信息,有效消除歧义,从而使生成的文本内容更为精确、流畅。
在训练大型人工智能模型时,我们需要大量的计算能力,而这种计算能力的增强与模型的参数数量呈平方关系增长。因此,大模型的性能竞争,在一定程度上就是一场算力的较量。然而,在国际环境复杂多变的今天,我国算力供需之间的差距不断扩大,这使得国产算力成为了我国大模型企业发展的必然选择。
在我国,许多企业在通用人工智能芯片领域已经有了早期的布局,并且在芯片的生产、生态的塑造以及应用的扩展上都有了显著的进步。然而,当谈到基于国产算力训练大型模型时,我们仍然面临一些挑战,包括生态的建设、成本的控制以及能效比的优化等问题。因此,要实现算力的完全自主,我们需要芯片制造商、大型模型公司以及学术研究机构等多方面的合作和努力。
鹏城实验室宣称,其始终坚守“国产算力 自主大模型”的创新原则,并借助于“鹏城·脑海”开源联合体的支持,深度整合了企业、高校以及科研院所的力量,以开源群智合作的方式共享资源,旨在为各行各业提供人工智能的“翅膀”。作为国内领先的大模型企业,百川智能一直致力于推动大模型研发和开源生态的建设,其无论是开源还是闭源模型,都在同等的权威评测中表现优异。双方在合作的过程中,可以充分运用各自的优点,形成强大的合力,以更好地满足我国在智能化转型方面的需求,进一步推动我国人工智能产业的快速发展。
百川智能表示,百川智能希望通过开源、与合作伙伴共创等方式助力中国大模型创新,繁荣本土大模型生态。鹏城实验室作为国家战略科技力量的重要组成部分,在国产算力大模型研发和应用等方面一直处于国内领先位置。本次百川智能与鹏城实验室合作研发“鹏城-百川·脑海33B”长窗口大模型,是国产算力大模型技术创新和落地的一次突破。未来,百川智能将在技术、算力等诸多维度不断深化与鹏城实验室的合作,持续助力本土大模型创新发展。
文/北京青年报记者 温婧
编辑/田野
AI时代,拥有个人微信机器人AI助手!AI时代不落人后!
免费ChatGPT问答,办公、写作、生活好得力助手!
搜索微信号aigc666aigc999或上边扫码,即可拥有个人AI助手!