开源大模型风起云涌：千模大战背后的新一代创新方向

文章主题：开源大模型, 通义千问, 千行百业, 创新方向

开源大模型风起云涌通义千问的关键一役

在经历了热情洋溢且紧张刺激的“百模大战”之后，大型模型如何为各行各业提供助力，已经成为新的创新趋势。在此背景下，众多开发者和创业公司纷纷投身于开源大模型的研究和应用，努力构建属于他们自己的模型和解决方案。

例如，个人开发者陶佳运用通义千问（Qwen）开源模型，构建了文档问答相关的应用，并尝试探讨大模型在电力领域中的多种应用可能性。同时，华东理工大学的薛栋团队也借助开源的通义千问基座模型，研发出了心理健康大模型MindChat（漫谈）。此外，有鹿机器人的创始人兼CEO陈俊波，则依靠自主研发的第二代具身智能技术LPLM大模型，构建了一个软硬件高度适配且具有泛化能力的通用智能大脑。

在此过程中，诸如阿里云等科技巨头，通过利用开源基础大模型，向个人开发者、科研团队、创业公司以及大型和中型企业的开发者提供了丰富的开发工具。这些举措不仅推动了大型模型技术的普及和实际应用，还促进了我国大模型生态的蓬勃发展。

开源大模型掀起开发潮

就职于中国能源建设集团浙江省电力设计院有限公司者陶佳，是开源大模型的一名个人开发者。

在探索开源模型的过程中，陶佳采取了一种节省成本的方法。她选择在家中购买一台服务器，并配置三四块显卡，这样的投入相对较低。接下来，她下载了Qwen并将其部署在服务器上运行。为了实现更广泛的应用，她还搭建了一个FRP反向代理，这使得她能够通过外部网络访问家庭服务器。此外，她在单位内也可以利用通义千问进行相关实验。陶佳所采用的这种节省成本但功能强大的方法，为她提供了很好的开源体验。

陶佳目前正在进行的工作是基于私有知识库的检索问答应用开发，该应用能够处理大量文本信息（包括但不限于几十万乃至上百万字）。在这个项目中，用户可以输入一个特定的英文文档，然后大模型会根据文档目录来回答问题，指出答案可能位于哪一项下。

作为华东理工大学·X-D Lab（心动实验室）的一名年轻成员，颜鑫带领着他的科研团队，致力于开发一系列具有针对性的垂直领域大模型。这些模型基于开源的通义千问基座模型，分别为心理健康领域、医疗健康领域和教育/考试领域带来了三款全新的产品：MindChat（漫谈）、Sunsimiao（孙思邈）以及GradChat（锦鲤）。

“MindChat是一款心理咨询工具, 像个AI心理咨询师，打工人上班被老板骂了，心里不爽；学生党写不出论文，担心影响毕业……日常生活中遇到这些事情，都可以去跟MindChat聊聊，甚至可以语音输入。”颜鑫说道。

“医疗、心理都是非常注重隐私的场景，很多客户都要求私有化部署，因此我们选择了开源模型。”颜鑫回忆称，Qwen出现之前他们试用了一些其他模型，比如ChatGLM、Baichuan、InternLM。Qwen-7B和14B推出后，他们快速进行试验，用内部数据和自己的benchmark做了测评。“在我们的场景中，通义千问是所有的开源模型里发挥最好的，是目前最优解。”

围绕开源大模型的开发和创业浪潮不断涌动，有鹿机器人创始人、CEO陈俊波，是那个让开源大模型更接近商业化落地的人。“国内有几万家传统专业设备生产制造商，但是他们没有能力去研发人工智能系统。我们的使命就是，给每个专业设备提供一个通用的人工智能大脑。”

举例来看，在清洁行业，物业经理说“在一号楼门前有一个可乐瓶，你过来扫一扫”。有鹿机器人在路面清洁机器人中集成Qwen-7B，使机器人能以自然语言与用户进行实时交互，理解用户提出的需求，将用户的高层指令进行分析和拆解，做高层的逻辑分析和任务规划，完成清洁任务。

随着越来越多的开发者和企业加入到开源模型阵营，开源模型的生态逐渐形成气候，“高质量开源基础大模型-大模型优化-AI应用创新”的商业化落地发展路径也变得清晰起来。

为什么选择开源大模型？

2023年，是AI大模型快速发展的一年。伴随ChatGPT的横空出世，国产大模型的数量也快速增长，数据显示，截至今年10月，国内已发布238个大模型。

目前，大模型行业主要有两条技术路线，一个是以OpenAI的GPT4.0为代表的闭源路线，马斯克曾评价其一点也不Open，一条是以Meta的Llama2、阿里QWen等为代表的开源路线，后者在创投领域更受追捧。

百模大战当前胜负未分，开源、开放、开发者，或是当下能最大限度激发创业热情的连接方式。

“我们没有资源从头训练一个基座模型，选模型的第一个考量就是，它背后的机构能不能给模型很好的背书，能不能持续投入基座模型及其生态建设，为跟风、吃红利而生的大模型不可持续。”颜鑫分享称，他希望选择主流的、稳定的模型架构，它能最大限度发挥生态的力量，匹配上下游的环境。

开源大模型可以帮助用户简化模型训练和部署的过程，使得用户不必从头训练模型，只需下载预训练好的模型并进行微调，就可快速构建高质量的模型或进行相应的应用开发。

而在陈俊波看来，他需要的不是一个一成不变的、智能性水平的大语言模型，而是随着数据的积累，能变得越来越聪明的大语言模型。闭源大模型显然做不到这一点。所以在他们的业态里面，终局一定是开源模型。

同时，未来速度联合创始人兼CEO秦续业提出，开源大模型在B端大有可为，企业级用户更在意的是能不能解决问题，而非要求模型能力面面面俱到。开源大模型更可控、定制化强、更具性价比。具体而言，经过简单微调，开源大模型能满足很多B端场景需求，同时开源大模型推理成本大约只有闭源收费大模型的1/50。

通义千问助力生态繁荣

大模型开源之风渐起。优质大模型的开源有助于促进中国大模型的技术进步与应用落地，推动大模型技术普惠。然而，目前国内市面上有100多个大模型，只有少数是高质量开源的。

此前，中国大模型市场暂未出现足以对捍Llama 2-70B的优质开源模型。12月1日，阿里云开源通义千问720亿参数模型Qwen-72B，填补了国内空白，大中型企业可基于Qwen-72B开发商业应用，高校、科研院所可基于Qwen-72B开展AI for science等科研工作。

此外，阿里云同步开源了通义千问18亿参数模型Qwen-1.8B和通义千问音频大模型Qwen-Audio，至此，通义千问开源光谱覆盖18亿、70亿、140亿、720亿参数的4款大语言模型，以及视觉理解、音频理解两款多模态大模型，实现“全尺寸、全模态”开源。

作为国内最早开源自研大模型的科技公司之一，阿里云对打造大模型开源生态不遗余力，如今，补齐开源大模型的最后一片拼图，是通义千问的关键一役。

阿里云CTO周靖人表示，开源生态对促进中国大模型的技术进步与应用落地至关重要，通义千问将持续投入开源，希望成为“AI时代最开放的大模型”，与伙伴们共同促进大模型生态建设。返回搜狐，查看更多

责任编辑：

AI时代，拥有个人微信机器人AI助手！AI时代不落人后！

免费ChatGPT问答，办公、写作、生活好得力助手！

搜索微信号aigc666aigc999或上边扫码，即可拥有个人AI助手！

相关文章

发表回复 取消回复

发表回复取消回复