百川智能大模型发布会:开源共赢,推动国内大模型科研进展

文章主题：北京市, 科技委员会, 中关村科技园区管理委员会, 北京市海淀区政府

在9月6日这个特殊的日子里，北京市科学技术委员会、中关村科技园区管理委员会以及北京市海淀区政府联合指导，我国知名的人工智能企业——百川智能，举办了一场以“百川汇海，开源共赢”为主题的盛大发布会。在这次发布会的现场，我们有幸邀请到了中国科学院院士张钹先生，他亲自上台发表了精彩的演讲。在发布会上，百川智能做出了一项重大决策：他们正式将经过微调的Baichuan 2-7B、Baichuan 2-13B、Baichuan 2-13B-Chat以及其4bit量化版本开源出去，而且所有这些资源都是完全免费的，可以供所有人使用。这一举措无疑将极大地推动人工智能领域的发展，实现开源共赢的目标。

百川智能近期再次开放了模型训练的关键节点，同时宣告即将推出Baichuan 2技术报告。这份报告将深入揭示Baichuan 2的训练过程，从而让大模型学术研究机构、开发者和企业用户能够更加深入地理解其训练方法，进而有力推动大模型学术研究的进步以及社区技术的蓬勃发展。

本文将深入探讨Baichuan 2-7B-Base和Baichuan 2-13B-Base这两个强大的语言模型，它们都是基于2.6万亿高质量多语言数据进行深度训练的。这两个模型的出现，不仅保留了上一代开源模型在生成和创作上的优秀表现，而且在这些基础之上，对数学、代码、安全、逻辑推理和语义理解等多个方面进行了显著的提升。具体来看，Baichuan 2-7B-Base在保留原有优势的同时，在数学、代码、安全、逻辑推理和语义理解等方面都展现出了明显的进步。而Baichuan 2-13B-Base则进一步升级，相较于上一代的13B模型，它在数学、代码、安全、逻辑推理和语义理解等方面的提升更为显著，分别达到了49%、46%、37%、25%和15%。总的来说，Baichuan 2-7B-Base和Baichuan 2-13B-Base的推出，标志着我国在语言模型领域的研究又向前迈进了一大步，同时也为人工智能的应用提供了更加强大的工具。

Baichuan2-7B与Baichuan2-13B的开放程度不仅限于学术研究，其对于商业使用的限制也十分宽松。开发者只需通过发送电子邮件申请，待获得官方商用许可后，便可尽情运用这两个工具进行免费的商业活动。

大模型训练的过程涉及多个关键步骤，其中包括获取大量高质量的数据、构建稳定的大规模训练集群以及优化模型算法等。这些环节都需要消耗大量的人力和计算资源，使得从无到有地完整训练一个大模型所需的投资变得巨大，这限制了学术界对大模型训练的进一步探索。

秉持着协作与持续优化的理念，我国知名的人工智能公司百川智能，近日成功开源了从220B到2640B的模型训练Check Point数据集。这一举措对于科研机构而言，无疑提供了极为丰富的资源，有助于深入研究大型模型训练的过程、模型的持续优化以及模型的价值观对齐等方面。这将对我国大型模型的科研发展产生深远影响，同时，这也是我国在开源训练模型领域的一个新的突破。

百川智能自成立之初，就将通过开源方式助力中国大模型生态繁荣作为公司的重要发展方向。成立不到四个月，便相继发布了Baichuan-7B、Baichuan-13B两款开源免费可商用的中文大模型，以及一款搜索增强大模型Baichuan-53B，两款开源大模型在多个权威评测榜单均名列前茅，目前下载量超过500万次。

此次开源的两款Baichuan 2大模型，得到了上下游企业的积极响应，腾讯云、阿里云、火山方舟、华为、联发科等众多知名企业均参加了本次发布会并与百川智能达成了合作。

文/北京青年报记者温婧

编辑/樊宏伟

AI时代，拥有个人微信机器人AI助手！AI时代不落人后！

免费ChatGPT问答，办公、写作、生活好得力助手！

搜索微信号aigc666aigc999或上边扫码，即可拥有个人AI助手！

相关文章

发表回复 取消回复

发表回复取消回复