文章主题:自然语言处理, 大模型, 讯飞星火, 人工智能
原标题:大模型中场战事,讯飞星火找到领先时刻
落地为王阶段,在算力、平台、模型、应用、生态等方面,都有持续深入的企业,对产业来说有更强的吸引力。
作者|刘珊珊
编辑|杨 铭
轰轰烈烈大模型,走到市场化大规模落地前夜。
《生成式人工智能服务管理暂行办法》于8月15日正式生效。作为我国首部AIGC管理办法,该法规旨在维护行业的健康、安全和规范性,并推动生成式人工智能技术的快速 practical化应用。
在我国,“千模大战”已持续半年,引起了前所未有的关注和热度。如今,这个国内领先的模型竞赛正迈向一个全新的阶段——应用PK和“落地为王”。
在战争的烟尘背后,业界与大众普遍关注的焦点问题在于:随着大型模型的逐步转化为基础能力,我们如何实现技术上的迭代升级?同时,如何将其与更多的行业相结合,加速规模化、商业化的进程,从而在竞争的长跑中保持领先地位?
这考验着入局者的智慧,亦决定入局者未来命运走势。
作为人工智能领域的一名专家,我必须强调,通用人工智能并非仅仅是某个公司或研究机构的责任,它已经成为全社会的共同机遇。我们正在迎来一个由大型模型推动的个体和行业发展的新纪元,这一变革的规模之广、影响之大,远远超出了我们单一的预期。在8月15日的讯飞星火认知大模型V2.0升级发布会上,科大讯飞董事长刘庆峰以他独特的见解,为我们深入解读了这一趋势。他身着传统的黑西裤和白衬衫,显得庄重而优雅,与他对人工智能未来的深度洞察相得益彰。
在5月6日正式亮相以来,科大讯飞的大模型便成为了人们关注的焦点。如今,讯飞星火认知大模型已经走过了100天的历程,这期间还经历了V1.5的不断优化与迭代。
V2.0的升级,是在提升通用能力的基础上,着重强化代码能力和多模态能力。据刘庆峰所言,代码能力对于支持认知大模型的智慧至关重要,而多模态能力则被视为实现通用人工智能的必经之路。
科大的iFlyCode1.0、讯飞智作2.0和星火语伴2.0这三个应用和产品,已经成功地将这些能力整合其中,这标志着科大讯飞大型语言模型的落地应用和商业化进程迈出了关键的一步。
在技术性能方面,我们发现讯飞星火V1.5的Python表现分数仅为41分,而V2.0版本已经提升至61分,这一进步几乎 equates to ChatGPT 的水平。据规划,到今年10月24日,讯飞星火的各项代码维度能力预计将超越 ChatGPT,达到中文实力超过、英文水平相当的程度。到明年上半年,讯飞星火将挑战 GPT-4 的水平。
这意味着,伴随大模型进入“落地为王”的中场战事阶段,中国大模型也将迎来自己的领先时刻。
01大模型落地,从产业开始
命运齿轮,转动于5月6日。彼时科大讯飞躬身入局,发布星火认知大模型1.0版本。
短短几个月,大模型已在国内掀起一场场“肉搏战”。通用、行业、垂直、开源和闭源等不同类型大模型,基于GPT,就像树干上的枝丫一样,疯狂开枝散叶。互联网、人工智能巨头、创业公司、各类型中小企业、研究机构入局者数不胜数,几乎每天都有不同类型大模型推出。
比如,10亿级参数规模大模型——参数量被默认为通用大模型、垂直和行业模型区别重要因素。规模参数越高,对算力、数据、资源、技术要求就更高,但在国内,10亿级参数以上多模态大模型却超80个。
这并不意味着赛道的真正崛起。在国内,投资者逐渐趋冷,部分入局者黯然离场;在国外,ChatGPT诞生9个月花费近2亿美元,高昂成本让OpenAI有“破产风险”。
盲目烧钱不可持续,大模型成本、商业化落地两大难题,让大众开始重新审视,大模型的经济和社会价值。
各界“到底需要什么大模型”探讨中,深耕行业,与生态结合,让大模型在不同行业、不同类型企业发挥生产力作用,成为解决大模型难题,真正产生价值行业共识。
“谁能在具备社会刚需的应用场景落地,谁就能最先形成自我造血的良性循环。”刘庆峰明确断言。在他看来,对科大讯飞这样体量的公司,不做通用大模型就不可能在国际舞台上未来争得一席之地,连上桌机会都没有。
通用还是垂直选择题上,每家企业都有自己理由和抉择。多模态通用大模型,被业界视为“综合大学学生”,可能在某些垂类领域沉淀数据有所不足,却是各个行业通向智能化、通用化必由之路,也是业界公认事实。
事实上,应用落地才是衡量一切大模型价值最高标准。最大难题是,如何搞懂行业、每个客户需求,以及应用安全、易用,具备产业价值。
行业场景分为政府及大型企业(ToB、ToG)、个人(ToC)、中小企业(ToSME)等不同类型。不同行业与大模型结合本质逻辑不同,如ToB、ToG,往往要求逻辑复杂定制化场景中,必须做到可控、可追溯、可修正。ToSME同样有定制化需求,但降本增效,给企业带来增长价值,却是衡量关键。
多位观察人士认为,深入行业Know-how基础上,和大模型能力融合,是大模型产业化最有效路径。
刘庆峰认为,其前提是,要在国产算力安全和数据安全下,回归场景驱动。“场景给客户带来的价值是什么,新增效益,还是节约成本、提高质量,同时能够让用户快速地、低技术门槛训练,才能够使它赋能千行百业。”
这是科大讯飞在8月15日推出星火一体机重要原因——其与华为昇腾AI联合研发,意在为每一家企业提供专属的大模型,适合有数据安全需求的大型客户。
“开箱即使用,提供从底层算力、AI 框架、训练算法、推理能力、应用成效等全栈 AI 能力。”刘庆峰称。
对科大讯飞来说,TOB端探索出的大模型赋能路径是,在研、产、供、销、服、管等各维度赋能。例如,大模型掌握行业基本能力、通用知识后,结合企业专属知识库,让新员工也能迅速掌握经验和知识,大幅提升工作效率。
不止科大讯飞,百度、腾讯、阿里、360都试图通过为企业提供专属大模型,加快产业融合、落地速度。“落地为王阶段后,淘汰赛就会一触即发。”多位观察人士判断。
必须意识到,受制于数据、算力、场景等限制,真正能跑通大模型商业化的入局者,数量将不会太多。其一,大模型仍会像互联网、人工智能、云计算一样,以互联网、科技大厂为主导;其二,大厂不会局限于泛通用行业,而是“大模型+业务”深入垂类,走通用+垂类“并行”路径。
比如科大讯飞,星火是多模态通用大模型,却早已开枝散叶,应用在教育、医疗、办公、数字员工、汽车、金融、工业等多垂类场景。
02千模大战,讯飞星火凭啥第一?
当前,赛道各大玩家纷纷结合自身已有业务场景,试图在大模型释放更大价值前,抢占战场制高点。
但客观来看,科大讯飞目前是脱颖而出,走得最快的那个。
这从科大讯飞最新财报,大模型加持后的商业化增长,得到印证。今年上半年,教育、开放平台及消费者、智慧汽车、智慧医疗、智慧金融等业务收入分别为22.9亿元、24.2亿元、2.1亿元、1.9亿元、0.9亿元,分别同比增长3.63%、21.6%、26.14%、37.13%和22.19%。
“可以看到,大模型正实实在在推动产业前进。” 刘庆峰称。
这也让外界颇为疑惑:ChatGPT都遭遇变现难题时,科大讯飞为何领先业界,先一步尝到大模型的商业化甜头?
有人工智能从业人士对“极点商业”称,大模型应用落地,其实是一条技术—产品—场景—规模化的演变路径。“就像一个木桶,不能存在短板,才有成功接受市场考验可能。”
大模型并非短期内一蹴而就,而是长期技术沉淀下所推动。1999年成立的科大讯飞,24年来在刘庆峰博士带领下,一直是人工智能领头羊形象存在,在深度学习算法、行业大数据、知识图谱、多模态感知、系统工程等技术方面有着深厚积累。
外界未曾关注到的是,其在认知大模型上也有近十年沉淀。2014年,科大讯飞启动“讯飞超脑”计划,实现机器从“能听会说到能理解会思考”。到2022年,累计摘取16项国际人工智能大赛的冠军,其中认知智能领域有13项冠军。
这离不开研发的持续投入。2022年,科大讯飞总研发投入33.6亿元,研发人员数量占公司总人数的比例为约60%。而根据最新财报,科大讯飞上半年研发支出16.6亿元,同比去年同期16亿元增加大约3.8%。这是星火认知大模型短时间内多次重要升级关键。
研发投入、技术领先带来的,是在G/B/C端应用场景不断拓展,占据更多用户心智。根据IDC《中国人工智能软件2022年市场份额》,在语音语义AI市场,科大讯飞位于榜首,持续领先百度智能云、阿里云。
长达20年多年的技术沉淀,让科大讯飞在大模型的打造上,有了“所有技术平台完全自主研发,每一阶段技术都可控”的底气。
比如,在大模型多个关键技术,多家权威评测就将讯飞火星排在了第一位。
根据新华社研究院中国企业发展研究中心发布《人工智能大模型体验报告2.0》(以下简称《报告》),讯飞星火以总分1013分位列本次国产主流大模型测评榜首位,超过商汤商量、通义千问等大模型,在四大评测维度中的智商指数、工具提效指数两个维度获得第一。
IT之家评测中,在完善度、功能性、易用性等维度,讯飞星火同样超过文心一言、通义千问、360智脑,排在第一。
《麻省理工科技评论》则将讯飞星火称为“最聪明”的大模型。在8个一级大类的600道题目的测试和盲评中,讯飞星火认知大模型V2.0在编程能力、理科综合、逻辑思维、数学专项、语言专项和综合知识6个大类中得分率排名第一,超过文心一言、商汤商量、通义千问,获得“最聪明”的国产大模型称号。
商业化探索上,有别大多数大模型,科大讯飞采取的是“技术能力+落地应用”并行策略。
一个细节是,科大讯飞在5月6日推出讯飞星火时,尽管发布时间并不领先,却在现场明确了教育、医疗、金融、办公、汽车、工业六个行业的应用场景。
此后两次升级,也有明确加速上述行业探索边界,推进其规模化应用落地和产业生态的构建——值得一提的是,科大讯飞是第一个在发布时,即明确阶段性升级时间,并同步生态应用规划的企业。
另外,LUMIE 10系列、智能办公本X3等与讯飞星火结合的硬件产品,在展示技术能力时,也同步落地上市。
“不仅要做基础通用大模型,还要同步做落地教育、医疗、办公场景的产品应用。”今年4月,科大讯飞副总裁、研究院执行院长刘聪曾透露,为进一步提高大模型细分行业的实用性,科大讯飞实行了“1+N”攻关体系。其中,“1”是通用认知智能大模型算法研发及高效训练底座平台,“N”则是应用于教育、医疗、人机交互、办公等多个行业领域的专用大模型版本。
“‘1’ 的能力融入到 ‘N’ 的产品应用中,‘N’ 的数据和场景更新到 ‘1’ 里迭代能力,构建一个循环的系统性工程。”刘聪说,讯飞大模型的技术、产品与服务,一直是围绕产业应用场景来展开。
因此,外界也得以在短短三个月内,就清晰看到了科大讯飞大模型,在C端和B/G端的齐头并进。
C端,科大讯飞消费者产品覆盖AI办公、AI学习、AI健康三大赛道,是国内AI应用产品最丰富的企业。
其中在AI学习赛道,仅仅是5-6月,科大讯飞AI学习机GMV就分别同比增长136%和217%;讯飞AI硬件在今年6.18获得京东和天猫双平台7类销售冠军。
当前AI学习机为代表的智能学习硬件市场强敌林立、同质化严重,是各路巨头都看上的市场,包括小度、步步高、猿辅导、作业帮、读书郎等新老玩家齐聚。科大讯飞利用AI大模型能力,是其差异化突围关键。
B/G端,作为AI“国家队”,科大讯飞已在政务、电力、医疗、工业、司法、金融等行业深耕多年。
金融领域,讯飞和人保科技等达成合作,推进大模型技术在金融垂直领域的应用;工业领域,星火大模型搭载在羚羊工业互联网平台,智能匹配方案、服务商、专家等资源,实现供需匹配;医疗领域,讯飞诊后康复管理平台基于大模型技术进行了升级,与北京协和医院、四川华西医院等多所医院进行合作,覆盖20多个科室的主要病种。
在8月15日的发布会上,刘庆峰强调说,讯飞星火已完成金融、政务、汽车等领域9个专属大模型数据显示,在场景任务优化、私域知识增强等方面增效20%。
03竞赛马拉松,科大讯飞如何走更远
大模型竞赛是一场马拉松,当下大模型仍然处于一个技术不断迭代、培育市场、抢占用户心智阶段。
这意味着,眼前领跑之外,更重要的是未来如何走得更远。
对于未来,科大讯飞从未掩饰它的“野心”,在5月推出讯飞星火时,就成为国内首家明确公布时间表的企业:今年10月24日,讯飞星火代码各维度能力将超越ChatGPT,明年上半年对标GPT-4。
此前,因为种种原因,几乎所有国内大模型都被外界认为,在技术、算法、可应用性上和ChatGPT存在差距。显然,在算力、算法等底层能力上保持迭代优化,并和产业应用紧密结合,是科大讯飞能否实现上述目标的保障。
“对代码能力的逻辑、算法、方法、体系、数据准备已经全部就绪,所需要的就是时间和算力。”刘庆峰称。
技术永无止境。多次迭代后,讯飞星火大模型核心能力、应用和产品正不断扩容。比如此次讯飞星火2.0,科大讯飞就对代码能力进行5个维度的升级,包括:代码生成、代码补齐、代码纠错、代码解释、单元测试生成。
图像描述、图像问答、识图创作、文图生成、虚拟人合成等多模态能力方面,讯飞星火大模型也全面升级。在代码能力和多模态能力迭代基础上,科大讯飞推出了能够进行视频创作的讯飞智作2.0、“智能编程助手iFlyCode2.0”、一键生成课件星火教师助手等,作为AIGC内容的生产工具。
代码能力和多模态能力升级,意味着帮助专业程序员提升效率,创造更大价值。
从演示来看,借助iFlyCode1.0工具,简单几步Prompt完iFlyCode界面后,一行代码都不用写,就可以马上实现“凌空手写”功能。以前,经验丰富的工程师要半天到1天才能完成,现在只需要几分钟。
过去一个月,iFlyCode在讯飞内部有2000多名员工实现试点应用,代码采样率超过30%,编码效率提升30%以上,综合工作效率提升15%,能明显感受到大模型带来的效率提升。
此外,哪怕不是编程高手的普通人,只要发挥想象力、基于对应用场景的认知,也可以“零门槛”进入代码世界。
例如,使用Python画红色的心形线、用代码生成“贪吃蛇”等小游戏、利用小视频做表情包等需求,讯飞星火都能迅速完成。
此前,科大讯飞已将星火大模型的能力,包装为中英文类人批改、英语类人口语对话等诸多应用场景,置入进T20、LUMIE 10、T10等AI学习机产品。有经销商表示,用户对搭载星火大模型的旗舰产品,热情度非常高。
升级后的星火大模型,围绕教育落地多款产品和功能。星火教师助手应用在讯飞教育数字基座上,零编程基础的老师也能使用,并满足学校管理数字化转型中的个性需求和定制开发。AI 智能编程助手和 AI 创意绘画伙伴的推出,标志着大模型对AI学习机赋能,更全面贴近新课标的要求。
代码和多模态能力的升级,也是大模型降低门槛,解放生产力,释放想象力的关键。目前,结合原有应用数据和场景描述,集成讯飞星火的代码能力和语言理解能力,大大提升学校开发效率:原有开发应用周期从17天缩短至1天,投资成本由15万降低至1.5万元。根据科大讯飞透露,该教育数字基座已经在上海、湖北、安徽的一些学校试点落地。
产业生态上,为行业、政务提供业界领先、自主可控的私有化代码能力平台——比如星火一体机。另外,开发者生态也是大模型产业良性循环关键。
5月6日星火大模型发布后两个月内,讯飞人工智能开放平台开发者数量增加了85万家。6月9日以来,已有4000余个助手开发者团队加入进来,开发出了7800多个助手。
随着生态集中,大模型不仅与产业应用更紧密,加快赋能千行百业进程,也能通过正向反馈,促进基础研究和关键技术的自主迭代,更大程度解放生产力,释放想象力。
科大讯飞就表示,当前多模态能力已广泛应用在教育、医疗、工业、汽车、机器人等领域。真实世界获得的数据,将提升产品终端的学习、训练,从而推出更自主的工业机器人、更好的自动驾驶、走入家庭的陪伴机器人等等。
“这会是一个长期过程。在算力、平台、模型、应用、生态等方面,都有持续深入的企业,对产业来说有更强的吸引力。”一位人工智能分析人士说。
写在最后:
大模型落地道阻且长。总体而言,当前大模型尚未完全离开“喧嚣”,各行各业大多处于赋能阶段,想收获大规模产业价值,还有很长的路要探索。
如同比尔·盖茨在《人工智能时代已经开启》中所描述,自1980年图形用户界面出现以来,大模型是所见过最具革命性的技术进步。一场事关所有产业的商业变革,已经拉开了大幕。
通过技术、产品、应用深耕,讯飞星火大模型“长坡厚雪”,正率先走向产业深处。返回搜狐,查看更多
责任编辑:
自然语言处理, 大模型, 讯飞星火, 人工智能
AI时代,拥有个人微信机器人AI助手!AI时代不落人后!
免费ChatGPT问答,办公、写作、生活好得力助手!
搜索微信号aigc666aigc999或上边扫码,即可拥有个人AI助手!