文章主题:阿里云, 大模型, 通义千问, AI模型
经济观察网 记者 钱玉娟
在全球范围内,大型开源模型体系的推出及商业化的实施取得了重要进展。8月3日,我国知名科技公司阿里巴巴集团的子公司阿里云,正式宣布其自主研发的大模型通义千问已正式开源,这使得它成为了我国首个公开宣布大模型开源的大型互联网企业。值得一提的是,通义千问的70亿参数通用模型Qwen-7B以及对话模型Qwen-7B-Chat,已经上架至AI模型社区魔搭ModelScope,向公众提供开源、免费且可商用的服务。
据深度了解,阿里云于2022年倾力打造了一个名为魔搭社区的AI模型社区,旨在为广大AI开发者提供优质的服务。据官方统计数据显示,目前魔搭社区已汇集了来自20多家顶级人工智能机构的超过1000款开源模型,堪称我国大模型开源领域的领导者。
在六月份之前,由王小川创立的百川智能人工智能创新科技公司,先后推出了两个大规模参数模型——Baichuan-7B和Baichuan-13B,这两个模型的参数规模分别达到了70亿和130亿。这使得百川智能成为了我国首个推出完全开源、免费可商用大模型创业公司的实例。
作为一名文章写作高手,我会从专业角度对原文进行改写。在魔搭社区中,开发者飞鲸对通义千问开源模型的参数数量仅为70亿表示关注。然而,经过微调优化后,该模型在数学推理方面表现得相当出色,对于基本的加减乘除运算题目,其回答准确率较高。
在通义千问开源的消息发布后,用户和应用开发者现在可以方便地获取和使用Qwen-7B和Qwen-7B-Chat两个模型。这些模型可以在魔搭社区直接下载,也可以通过阿里云灵积平台进行访问和调用。对于使用这些开源大模型体系的用户,阿里云将提供包括模型训练、推理、部署、精调等在内的全方位服务。
在今年四月份,我们推出了一款名为通义千问的自研大模型产品。仅仅几个月之后,阿里巴巴云计算平台在今年的七月份宣布,作为中国大模型生态繁荣的首要目标,将向大模型创业公司提供包括智能算力以及开发工具在内的全方位支持。
谈及当前国内外开源的模型,飞鲸认为对包括他在内的开发者们帮助极大,“可以基于自己的业务领域需求,做finetune(微调)或者和本地知识库对接,实现快速地业务落地。”
飞鲸告诉记者,在一些垂直领域并不需要参数量很高、通用能力很强的模型,而是“希望一些小甜点”,他举例到,比如几十到百亿左右参数规模的模型,结合垂直领域数据,就可以发挥很好的价值。
阿里云方面认为,开源大模型可以帮助用户简化模型训练和部署的过程,用户不必从头训练模型,只需下载预训练好的模型并进行微调,就可快速构建高质量的模型。
AI时代,拥有个人微信机器人AI助手!AI时代不落人后!
免费ChatGPT问答,办公、写作、生活好得力助手!
搜索微信号aigc666aigc999或上边扫码,即可拥有个人AI助手!