国内大模型商业化竞赛开启，讯飞星火如何引领新时代变革？

文章主题：大模型, 商业化, 科大讯飞

首个基于全国产算力训练的“讯飞星火V3.5”发布，语音大模型37个主流语种识别效果超OpenAI Whisper V3。作者 | 程茜编辑 | 漠影大模型毋庸置疑是去年以来科技行业的“主角”，今天，大模型产业竞争的核心已然改变。自2022年11月ChatGPT发布掀起的科技革命，到百模大战群雄逐鹿，如今随着大模型与产业落地的结合日益紧密，各类应用层出不穷，大模型商业化成为所有参与者的核心目标。2024年俨然已经成为大模型商业化元年。此前大模型受研发成本高昂、落地场景不明晰、部署成本高等困扰商业化进程缓慢。就在昨天，2024年农历春节前夕，AI国家队、国内大模型产业赛道的头部玩家科大讯飞给出了自己的破局之道。科大讯飞董事长刘庆峰、研究院院长刘聪正式发布基于首个全国产算力训练的讯飞星火V3.5，讯飞星火V3.5七大核心能力全面提升，数学、语言理解、语音交互能力超GPT-4 Turbo。

科大讯飞发布了星火语音大模型，语音识别方面首批37个主流语种效果超过OpenAI Whisper V3，基于此重磅升级了能自动识别语种的讯飞翻译机，并首次发布深度适配国产算力的讯飞星火开源大模型“星火开源-13B”，已在昇思开源社区联合首发上线。自去年5月以来，以讯飞星火认知大模型为核心的技术积累与应用经验，已经成为科大讯飞在大模型商业化应用元年的重要支撑。那么，曾困扰大模型商业化的难题如何解？科大讯飞眼中的大模型落地场景应该是什么样？科大讯飞又是如何找到一步步走出属于自己的路，成为行业引领者？我们试图从科大讯飞星火大模型V3.5的重磅升级出发，找到这些问题的答案。01.大模型进入商业化元年三大难题待解轰轰烈烈的百模大战热潮逐渐冷静，但技术变革的深远影响尚未停歇，科技发展的进阶无不是真正与产业相结合，在真正的应用中发挥价值。数据研究和分析机构Gartner预测，到2026年超过80%的企业将使用生成式AI的API（应用程序编程接口）、模型，或在生产环境中部署支持生成式AI的应用，而在2023年初这一比例不到5%。但一直以来，大模型真正在行业应用中发挥价值，走向落地的进程都十分缓慢。这与大模型的能力、应用落地场景、算力三大挑战有关。首先是模型能力的挑战。大模型的幻觉、智能化程度不够等问题，直接会影响不同行业用户对其的接受程度。不同于消费者，企业对于数据的安全隐私、大模型的可用性、生成内容的准确性要求极高，因此大模型除强大的生成、理解等能力，还需要真正解决行业问题，在业务中发挥价值。其次是应用场景的挑战。大模型需要找到有效的落地场景，其在企业内部的应用范围十分宽泛，需要和内部大量数据进行深度融合，找到企业真正的痛点，并通过大模型的能力加以解决。这才能让企业最迫切的需求与大模型能力相互匹配，在进一步提升大模型能力的同时，形成丰富的应用场景。第三是算力挑战。这既包含企业定制、微调大模型的算力成本，还包含国产大模型算力底座的自主可控。对于下游企业而言，其没有足够算力成本去定制、微调大模型。算力是大模型训练和推理阶段极为重要的物质基础，但大模型热潮涌起使得算力成本高涨，中小企业难以维系。然而，企业想要让大模型与自己业务深度结合，就必须对大模型进行定制、微调，这也成为企业面前的一大拦路虎。受波谲云诡的国际形势影响，国产化大模型产业的自主可控也是一大难题。只有建立在自主可控的国产化算力平台上，大模型产业才能实现可持续的良好发展。随着这些难题被逐渐突破，大模型的实用性更上一个台阶，结合其综合能力解决真实世界的刚需被提上日程。在这一背景下，在大模型核心能力升级、商业落地应用、算力平台部署上面有诸多经验的讯飞，已经成为大模型商业化准备最充分的玩家代表，并向着成为大模型落地的领跑者突围。02.讯飞星火V3.5升级，发语音、开源大模型均基于全国产算力平台“飞星一号”训练大模型改变世界的愿景逐渐清晰，那么站在大模型商业化元年？科大讯飞到底有哪些储备？又该如何领跑？我们可以从这场发布会的重点抽离出这家大模型头部玩家的布局逻辑，也代表了下一步大模型商业落地的竞争焦点。讯飞星火V3.5实现了文本生成、语言理解、知识问答、逻辑推理、数学能力、代码能力、多模态能力七大核心能力升级。其中，语言理解、数学能力超过GPT-4 Turbo，代码能力达到GPT-4 Turbo的96%，多模态理解能力达到GPT-4V的91%。这些强大的能力已经在解决真实世界的刚需方面展现出强大潜力。万物互联时代的人机交互方式正在被重塑，讯飞星火App上线了语音交互功能，该功能在与人的对话中能自动调用大模型的外部能力，实现全语音的自然交互。刘庆峰谈道，从DOS界面到Windows界面成就了微软的传奇，从键盘到触摸有了苹果的神话，这一次全语音的自然交互会推动整个产业出现新一次的繁荣。

语音技术一直以来都是科大讯飞的强项，自成立之初该公司就确定了实现人类和人机信息沟通无障碍的愿景。科大讯飞在通用人工智能时代，继续保持在语音交互方面领先优势的同时，看到了新技术浪潮下的更多可能性。大模型可以帮助小语种语料训练，通过更统一的多任务建模能力推动语音技术发展。讯飞星火语音大模型基于语音属性解耦表征预训练，结合常规的语音大模型架构，实现了首批37个主流语种语音识别效果超过OpenAI Whisper V3，在多语种语音合成、超拟人语音合成方面MOS分有绝对优势，MOS分指的就是生成的声音是否自然。

此次搭载星火语音大模型的讯飞翻译机还实现了重磅升级，可以实现多语种自主识别，无需用户自主选择，就可以自动识别说话人的语种并翻译成中文。

关闭

观看更多

退出全屏

刷新

视频详情

此外，为了丰富大模型应用生态，科大讯飞发布了130亿参数规模的星火开源大模型系列，包括基础模型、精调模型、微调工具和人设定制工具。星火开源-13B在多项知名公开评测任务中的文本生成、语言理解等典型场景中排名靠前。

最后就是大模型训练的坚实底座——算力平台，讯飞星火V3.5、星火语音大模型、星火开源大模型都是基于“飞星一号”训练，飞星一号就是去年10月24日讯飞宣布正式启用的首个支撑万亿参数大模型训练的国产算力平台。讯飞星火V3.5是国内首个基于全国产算力训练的大模型。星火开源大模型也基于飞星一号实现了全栈国产适配优化，训练效率达A100的90%。这也意味着，科大讯飞为企业客户提供了另外一种“大模型+算力”的选择。在这一特殊节点，大模型要立足于国产自主可控的算力平台至关重要，刘庆峰称，讯飞星火3.5正是对于国产算力平台能否支撑起未来大模型研发的一次重要检验。可以看出，科大讯飞在大模型产业的浪潮中很清楚自己要做什么，怎么做，并且在此前深厚的行业积累中，真正瞄准了行业痛点，知道自己要如何在这个行业中扎根生存并实现领先。03.大模型升级与解决行业痛点并进从通用大模型进阶到解决科研工业民生刚需

🏆🚀放眼大模型领域风云变幻，今日的商业化进程已然升级为一场国际科技角力，亦是国产生成式AI迈向全球舞台的决定性一步。国内玩家们的激战正进入崭新阶段，每一步都至关重要，引领着行业风向。🔥💥

🎉【国产大模概里程碑】🌟 从去年8月起，中国大模型已连续四次获得官方认证，正式向大众敞开怀抱！此刻，它们已在金融、教育和职场等多个领域展现出强大的实力与广泛应用。📚💼每批发布都标志着技术的进步与市场的认可，这些创新的AI工具正逐步渗透到日常生活的方方面面，引领着行业变革。🔍无论是助力精准决策的金融模型，还是智能化教学的教育大模，亦或是提升工作效率的办公神器，它们都在以实际行动推动知识和服务的普惠。👩‍💻👨‍💼SEO优化提示：关键词包括”国产大模型备案”、”公众化开放”、”金融赛道”、”教育应用”、”职场大模”和”技术进步”。记得在句子中自然融入这些词，同时保持内容连贯性。

🌟作为首批认证的大模型应用引领者，讯飞星火展现出非凡实力。自去年5月起，这款创新大脑持续进化，七大核心能力的提升不仅令人印象深刻，其在硬件和软件领域的广泛应用也日益显现。📚教育领域，我们推出了AI驱动的讯飞AI学习机，让知识更易获取；💼办公桌上，智能办公本与录音笔协同工作，提高效率；📝星火App和输入法等软件工具，为用户带来流畅无阻的文字体验。内容创作方面，我们更是推出了一系列创新工具，如音频视频制作神器“讯飞智作”，助力创作者释放无限创意；而图文创作的得力助手“星火内容运营大师”，则帮助打造丰富多样的内容世界。通过这些产品和服务，星火大模型的价值已广泛惠及大众，为用户带来了实实在在的价值提升。🌐SEO优化提示：星火大模型、讯飞AI学习机、智能办公本、讯飞听见、星火App、输入法、讯飞智作、星火内容运营大师等关键词可适当增加。

🌟🚀通过讯飞开放平台，全球创新者携手共筑智能未来！在这里，我们拥有庞大的开发者群体——总数高达35万分之璀璨，他们中不乏22万的企业精英，他们以实际行动推动着人工智能技术的革新与普及。每一行代码，每一次迭代，都凝聚了他们的智慧与热情。🌟

大量用户的体验与反馈，也在反哺大模型核心能力的不断提升。与此同时，刘庆峰谈道，大模型如今已经不是用来简单的写诗、作画，而是赋能科研、赋能工业、赋能民生的刚需场景，就是要让大模型能够提升成为数字化时代、智能化时代的全新生产力。

科技创新到产业落地的距离，需要终端企业用户与核心大模型玩家的结合，才能逐渐缩短这之中的距离，同时也让大模型商用落地的路径更为清晰。

科大讯飞已经在不同赛道上有了大量的商业化积累。面向教育行业，科大讯飞推出了星火智慧黑板，具备多模态理解与推荐、全自然交互、虚拟人辅学、智慧化录课与分享四大功能。这一功能将黑板的价值边界进一步扩宽，成为老师的AI助手。

同时，科大讯飞与中国移动联合推出5G新通话创新应用“商务速记”，可以实现用户通话过程中同步纪要语音、提炼关键待办事项等。

汽车行业头部玩家奇瑞汽车中应用的智能语音交互技术由科大讯飞提供，其出口的国家覆盖英语、俄罗斯语、西班牙语、阿拉伯语、葡萄牙语等语种。可以看出，支撑中国汽车出海也是国产大模型商业化落地的一大潜力场景。

由此可以看出，大模型正在同步驱动B端和C端商业化落地，一方面，翻译机、商务5G通话、辅助制作PPT等能力正在被大模型重塑，让前沿技术创新成为个人用户的生产力工具；另一方面各行各业的头部玩家、创企正在与以科大讯飞为代表的大模型核心玩家，进行商业化落地探索，在加速产业转型升级的同时找到新的增长机遇。更为重要的是，作为AI国家队的科大讯飞，在当下国内大模型商业化加速落地的同时，对于提供自主可控全国产算力平台方面具有天然优势。如今，大模型商业化应用已经聚集了算力、大模型、终端企业等各方玩家之力，使得大模型核心能力与应用落地进展同步推进，并且坚持安全可控。

🌟在国内AI领域，尽管曾经面临国际巨头的技术挑战，但我们已逐步崭露头角，在大模型实战能力上展现出了显著的进步。尤其是在商业化进程中，得益于本土丰富多样的场景和深厚的应用根基，像科大讯飞这样的领军人物正引领一场革新风暴，重塑着大模型的新纪元。🌍

04.结语：加码大模型商业化落地科大讯飞已快人一步大模型在生成、理解等方面展现出的强大能力，使得AI正不断拓宽其在千行百业中的应用边界。当下，AI驱动的各类应用正在变革着人们的工作、生活、学习等。

🌟💡 商业化之路：大模型在企业中的独特挑战与价值💡🌟随着大模型技术的飞速发展，其在C端消费者领域广泛应用的同时，对企业业务集成的需求也日益显现。为企业提供定制化的解决方案，大模型需深入理解并适应特定场景下的能力要求、算力瓶颈，这正是当前产业迭代升级的关键所在。🚀📊首先，模型能力的选择至关重要。企业需要评估模型的精准度、鲁棒性以及对复杂数据的处理能力，以确保在业务运营中的有效应用。🔍💪其次，应用场景的定制化是大模型商业化的核心。从生产流程优化到客户关系管理，每个行业都有其独特需求，大模型需具备高度灵活性，能够无缝融入企业的日常运营中。🌐💼再者，算力资源的合理配置不容忽视。大规模计算对硬件设施有严格要求，企业需要在成本和性能之间找到平衡，以实现高效且可持续的大规模部署。📈💻总的来说，大模型的商业化并非易事，它需要技术、应用与策略的三重融合。只有这样，我们才能见证这个领域从理论到实践的飞跃，为企业创造真正的价值。🚀🎯

大模型玩家的交锋并没有停歇，从百模大战的拼算力、拼参数，如今的大模型已经越来越具备实用属性。在这背后，既离不开业务端企业对前沿技术的深入了解，以及勇于探索尝试，也离不开拥有核心技术的企业不断突围技术创新，坚定投入。国内大模型核心玩家、企业、算力商等诸多玩家已被卷入新一波大模型浪潮中，成为大模型商业化应用生态构建的重要参与者，进一步弥补国内大模型产业与国外水平的差距。

🌟🚀展望未来，大模型已成为企业全球化竞争力不可或缺的利器，而科大讯飞凭借20多年的AI耕耘，积累了深厚的技术底蕴和先发优势。💡他们将以创新的速度，引领行业在大模型领域抢占先机，为全球市场注入强大动力。🏆

（本文系网易新闻•网易号特色内容激励计划签约账号【智东西】原创内容，未经账号授权，禁止随意转载。）

AI时代，掌握AI大模型第一手资讯！AI时代不落人后！

免费ChatGPT问答，办公、写作、生活好得力助手！

扫码右边公众号，驾驭AI生产力！

相关文章

发表回复 取消回复

发表回复取消回复