文章主题:百川智能, Baichuan2-53B, 大模型, API接口
作者 | 周愚
编辑 | 邓咏仪
据36氪报道,9月25日,我国人工智能公司百川智能正式推出了其Baichuan2-53B闭源大模型,并相应地公开了该模型的API接口。这一举动标志着百川智能正式进入To B市场,开始启动商业化进程。
自2023年4月10日成立以来,百川智能已成功发布了六款大型AI模型,平均每隔28天就会推出一款新的大模型,这一稳定的发布节奏充分展示了百川智能的技术实力与创新精神。
上月初,我们发布了Baichuan1-53B模型,而现在,Baichuan2-53B在数学、逻辑推理等领域都有了明显的进步。此外,它的表现也相当出色在模型幻觉方面。据百川智能的声明,这个模型可能是我国当前幻觉问题解决能力最强的模型。
根据百川智能的研究报告,Baichuan2-53B在Baichuan1-53B的基础上,逻辑推理能力实现了100%的增长,而数学能力则提高了31%。同时,Baichuan2-53B在语言理解、文本创作以及知识问答等方面的表现也有所提升,具体包括29%、18%和9%的进步。
图源:企业供图
在模型幻觉领域中,Baichuan2-53B采用了两种主要优化手段。首先,为了增强模型的学习效果,百川对其数据集进行了扩大,并且提升了数据的质量。其次,通过引入搜索等外部工具,Baichuan2-53B使模型具备了获取实时信息的能力。
根据百川智能的FacTool评测结果,Baichuan2-53B模型的综合得分为140.5分,这一成绩在主流基础大模型中仅次于GPT-4,在国内保持着领先的地位。
图源:企业供图
据我们所知,FacTool是一款由上海交通大学、卡内基梅隆大学、香港城市大学以及Meta等知名学府的学者们联合研发的通用框架。该框架的主要功能在于检查大型语言模型的生成内容是否具有较高的准确性。
具体来说,Baichuan2-53B构建了一个独特的数据质量体系,该体系以低质量和高质量作为数据分类的标准,从而确保Baichuan2-53B始终使用优质数据进行预训练。在信息获取方面,Baichuan2-53B对指令意图理解、智能搜索以及结果增强等模块都进行了升级。
图源:企业供图
除了能力升级之外,开放API接口也是此次发布的一大亮点。企业和开发者可以通过API将Baichuan2-53B集成至他们的应用程序和服务中,适配用户在智能客服、智能写作、智能推荐等多种不同场景的需求。
在安全合规问题方面,作为首批通过《生成式人工智能服务管理暂行办法》备案的大模型企业,百川智能为Baichuan2-53B打造了覆盖大模型预训练、精调、推理全周期的安全增强。
值得一提的是,Baichuan2-53B的API接口对OpenAI的接口高度兼容,客户可以实现快速迁移,降低模型的部署和转换成本。
百川智能, Baichuan2-53B, 大模型, API接口
AI时代,拥有个人微信机器人AI助手!AI时代不落人后!
免费ChatGPT问答,办公、写作、生活好得力助手!
搜索微信号aigc666aigc999或上边扫码,即可拥有个人AI助手!