文章主题:百川智能, 第二代开源模型, Baichuan 2, 微调

666AI工具大全,助力做AI时代先行者!

在9月6日的新闻发布会上,我国知名的人工智能公司——百川智能,正式推出其第二代开源模型Baichuan 2。此次发布的模型包括微调后的Baichuan 2-7B、Baichuan 2-13B、Baichuan 2-13B-Chat以及其4bit量化版本。值得一提的是,这些模型都可以向公众免费开放,并且可以被用于商业用途。这一消息已经引起了广泛的关注,并在AI模型社区魔搭ModelScope上的首发上架。为了帮助开发者更好地理解和掌握这些模型的使用方法,魔搭ModelScope立即提供了相关的模型部署教程,以便于开发者能够快速上手。

1703037297699.jpg

在今年6月至7月期间,我国知名的开源项目百川陆续发布了其上一代的7B和13B模型。此次公开的Baichuan 2-7B-Base和Baichuan 2-13B-Base模型,是在2.6万亿高质量多语言数据的基础上进行训练的。这些数据不仅包括了各种类型的文本,还包括了音频、视频等多种形式的信息,使得模型的训练更为全面和深入。值得一提的是,尽管这两个模型基于高质量的数据进行了训练,但依然保留了上一代开源模型诸多优秀的特性。比如,它们具有良好的生成和创作能力,可以进行流畅的多轮对话,并且部署门槛相对较低。这使得Baichuan 2-7B-Base和Baichuan 2-13B-Base模型在实际应用中更为灵活便捷,能够满足不同场景的需求。总的来说,百川这次的开源动作,无论是从数据的质量还是模型的性能上,都为我国的人工智能领域的发展做出了重要贡献。我们期待百川在未来能带来更多优秀的作品,推动我国人工智能技术的不断进步。

在同一时期,两种模型的数学、编程、安全性、逻辑推导和语义理解等技能都取得了显著的进步。相较于上一代的13B模型,Baichuan 2-13B-Base在数学方面提升了49%,在编程方面提升了46%,在安全性方面提升了37%,在逻辑推导方面提升了25%,而在语义理解方面则提升了15%。这些显著的改进表明,Baichuan 2-13B-Base模型在各方面能力都有了显著的提升。

两篇模型在各类评测平台上均取得了优异的表现,并在MMLU、CMMLU、GSM8K等多個權威評估標準中,以絕對優勢超越了LLaMA2。值得注意的是,Baichuan2-7B在MMLU等多個權威英文評估標準中的得分,甚至與130億參數的LLaMA2保持一致,其70億的參數數量更是与其他同級別模型表現相媲美。

  7B参数模型的Benchmark成绩

1703037299133.jpg

  13B参数模型的Benchmark成绩

百川智能的Baichuan2-7B和Baichuan2-13B两款产品,展现出了极高的开放性。不仅学术研究领域完全开放,而且开发者只需通过邮件申请,便能在获得官方商用许可之后,自由地进行商用。此外,百川智能更是开了先河,他们将模型训练的Check Point开源出来,并计划发布Baichuan 2技术报告,其中将详细揭示Baichuan 2的训练过程。这一举动在国内无疑是独一无二的。

作为魔搭社区的关键战略伙伴,百川智能每次推出的开源模型都选择在魔搭平台上进行国内首次发布,这使得百川的开源模型在魔搭AI开发者社群中获得了极高的关注度和广泛好评。

在此次开源活动中,魔搭社区依托于Baichuan2-13B-Chat技术,成功开发出了一系列体验接口。这些接口不仅能够让普通用户直接体验和应用模型,还为开发者提供了宝贵的参考,即通过魔搭公众号推出的最佳实践教程,实现了模型部署、推理及微调的早期验证,为开发者们的实际操作提供了有力的指导。

百川智能, 第二代开源模型, Baichuan 2, 微调

aigc666aigc999_0.jpg

AI时代,拥有个人微信机器人AI助手!AI时代不落人后!

免费ChatGPT问答,办公、写作、生活好得力助手!

搜索微信号aigc666aigc999或上边扫码,即可拥有个人AI助手!

Leave a Reply

Your email address will not be published. Required fields are marked *