文章主题:阿里云, 开源模型, 大模型, 人工智能
经济观察网 记者 钱玉娟
9月25日午后,我国知名云计算服务商阿里云正式公布两款全新人工智能模型——通义千问140亿参数模型Qwen-14B与Qwen-14B-Chat,并决定将这些模型向全社会免费开放,供公众免费商用。阿里云方面表示,自70亿参数的Qwen-7B等模型开源以来,仅用了短短半个月时间,其下载量便已经突破了百万量级。现在,广大用户不仅可以在中国大模型开源社区魔搭社区内直接下载14B模型,还可以通过阿里云的灵积平台便捷地访问和使用这些强大的模型。
据相关报道,阿里云的灵积平台不仅拥有自家的通义千问大模型,同时还兼容并托管了包括百川、姜子牙、Stable Diffusion以及ChatGLM-v2在内的多行业大模型。
我们是一个致力于构建开放、共享的模型社区的团队,我们的目标是为广大开发者和企业提供更多元化的选择。阿里云CTO周靖人在接受经济观察网记者采访时表示:“目前我们专注于打造一个基础性的模型,与我们在实际应用中所需求的具体场景仍存在一定差距。”他强调指出,团队的核心任务并非仅限于构建模型,更重要的是协助开发者和企业更好地应用这些模型。
因此,通义千问决定开源自研大模型,以便为开发者和企业提供更多的选择。周靖人强调:“我们可以根据不同的应用场景和实际需求,选择不同规模和效能的模型,并将其应用于开发环境中。”
随着模型参数、整体容量和能力的逐步优化与提升,14B模型相较于7B模型在部分长尾领域将展现出更为显著的认知能力和推理技巧。周靖人强调:“在模型微调及应用方面,14B模型具备更高的性价比。”
随着阿里云率先踏上大模型开源的征程,全球及我国的其他众多企业也纷纷跟隨。据IDC中国高级分析师程荫指出,模型开源将有助于让更多的人机会接触到先进的大模型技术,进而降低技术学习和应用的门槛与成本,推动大模型技术在各行各业中的广泛运用。
行业开源开放确实是趋势,但“让AI更普惠”这句话在周靖人看来,实现起来并不容易。
“只做开源也不行,不做开源更不行。”周靖人强调,当下大模型生态需要在技术创新的同时也要更及时地触达中小企业和个人开发者。
“未来可能会形成一种开源模型和商业模型并存的格局。”程荫分析,开源模型会促进更多生态的形成,降低训练模型的巨大成本,为创业型企业、开发者们带来更多机会。
AI时代,拥有个人微信机器人AI助手!AI时代不落人后!
免费ChatGPT问答,办公、写作、生活好得力助手!
搜索微信号aigc666aigc999或上边扫码,即可拥有个人AI助手!