文章主题:百川智能, 第二代开源模型, Baichuan 2, 微调

666AI工具大全,助力做AI时代先行者!

在9月6日的新闻发布会上,我国知名的人工智能公司——百川智能,正式推出其第二代开源模型Baichuan 2。此次发布的模型包括微调后的Baichuan 2-7B、Baichuan 2-13B、Baichuan 2-13B-Chat以及其4bit量化版本。值得一提的是,这些模型都可以免费商用。此外,这些模型已经在AI模型社区魔搭ModelScope上首发上架。为了帮助开发者更好地理解和使用这些模型,魔搭ModelScope迅速推出了相关的模型部署教程,让开发者能够快速上手。

在今年6月至7月期间,我国知名的开源项目百川陆续发布了其上一代的7B和13B模型。此次公开的Baichuan 2-7B-Base和Baichuan 2-13B-Base模型,是在2.6万亿高质量多语言数据的基础上进行训练的。这些数据不仅包括了各种类型的文本,还包括了大量的语音和视频信息。通过这种方式,新发布的模型保留了上一代开源模型出色的生成和创作能力,同时也保留了流畅的多轮对话能力和低部署门槛等众多优点。

在同一时期,两种模型的数学、编程、安全性、逻辑推导和语义理解等方面都取得了显著的进步。相较于上一代的13B模型,Baichuan 2-13B-Base在数学方面提升了49%,在编程方面提升了46%,在安全性方面提升了37%,在逻辑推导方面提升了25%,以及在语义理解方面提升了15%。这些显著的改进表明,这种模型正在不断优化和完善自己的性能。

两篇模型在各类评测平台上均取得了优异的成绩,特别是在MMLU、CMMLU、GSM8K等重要评估基准下,它们以压倒性的优势超越了LLaMA2,展现了卓越的表现。尤为值得关注的是,在英文主流任务中,Baichuan2-7B模型以70亿参数的规模与130亿参数的LLaMA2齐平,这一成绩更是令人瞩目。

  7B参数模型的Benchmark成绩

  13B参数模型的Benchmark成绩

百川智能的Baichuan2-7B和Baichuan2-13B两款产品,展现出了极高的开放性。不仅学术研究领域完全对外公开,开发人员只需通过发送电子邮件申请,便能在获得官方商用许可后,自由地进行商用。此外,百川智能更是以身作则,开源了模型训练的Check Point,这一举动在国内实属罕见。为了进一步展示Baichuan2的技术实力,百川智能还计划发布一份详细的Baichuan2技术报告,其中将详细阐述Baichuan2的训练过程和细节。这一创新举措无疑开国内之先河。

作为魔搭社区的关键合作伙伴,百川智能每次推出的开源模型均选择魔搭作为国内首个发布平台,这使得百川的开源模型在魔搭AI开发者群体中获得了广泛的好评与欢迎。

  针对本次开源,魔搭社区基于Baichuan2-13B-Chat开发了体验接口,普通用户可以直接体验或使用模型;魔搭公众号则推出了最佳实践教程,提前跑通模型的部署、推理和微调,供开发者参考。

AI时代,拥有个人微信机器人AI助手!AI时代不落人后!

免费ChatGPT问答,办公、写作、生活好得力助手!

搜索微信号aigc666aigc999或上边扫码,即可拥有个人AI助手!

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注