引领未来交互 科大讯飞机器人超脑平台2.0正式启动
星火

引领未来交互 科大讯飞机器人超脑平台2.0正式启动

5月31日,第十四届中国国际机器人高峰论坛暨第十届恰佩克奖颁奖仪式在安徽芜湖落幕。本届论坛以“遇见恰佩克·预见新未来”为主题,聚焦机器人技术在各领域的广泛应用和深入发展,吸引了来自机器人及智能制造领域专家、企业高管、行业精英等600余人参加。作为中国人工智能“国家队”,科大讯飞受邀携机器人超脑平台2.0版亮相并进行主题演讲,展示了基于讯飞星火大模型的多模态交互系统。 安徽省人大常委会副主任、省总工会主席何树山致开幕辞 活动现场,多位国内外知名专家共同见证科大讯飞机器人超脑平台2.0项目的启动。参与启动的嘉宾包括俄罗斯工程院院士孙立宁、俄罗斯自然科学院院士朱文华、哈工大机器人研究所所长赵杰、新松机器人创始人曲道奎、宇树科技联合创始人陈立、乐聚机器人创始人冷晓琨、星动纪元联合创始人席悦、科大讯飞开放平台研发总监刘可为。此次机器人超脑平台2.0的升级,旨在实现“懂知识·善学习·能进化·更简单”四大目标的进一步提升,将以视听融合的多模感知交互和基于大模型的机器人大脑,通过软硬件一体的方式构建机器人新交互,将讯飞星火大模型进一步赋能机器人领域。 科大讯飞机器人超脑平台2.0启动仪式 随后,刘可为在会上发表了题为《机器人超脑平台,构建机器人新交互》的演讲,深入阐述了讯飞机器人超脑平台的技术特点和应用前景。他表示,多模态和端到端技术将成为人机交互的演进方向,在这一趋势和背景下,机器人超脑平台2.0正式启动,从“听得清”“听的懂”“情感交互”和“集成便捷”等方面,系统全面地阐述了机器人超脑平台2.0的升级。该平台不仅能够帮助开发者快速搭建适配多场景的机器人,还具备深厚的知识底蕴和自我进化的能力。 科大讯飞开放平台研发总监刘可为发表主题演讲 讯飞机器人超脑平台解决了机器人在嘈杂环境下听、说、理解和思考的难题。借助这套系统,机器人不仅能实现语音识别、自然语言处理等基础功能,还具备人像识别、唇形识别等多种感知能力。更令人称赞的是,这套系统能够在人流密集、环境嘈杂的服务场景中精准捕捉到用户的声音,并运用讯飞星火大模型深入分析客户的自然语言语义,精确理解用户意图。同时,讯飞拟人的语音技术使得机器人回复语言更具人性化,能够与用户进行更加亲切自然的交流。 接入星火大模型的讯飞机器人超脑平台 目前,科大讯飞的多模态交互系统已被广泛应用于各种设备中,如数字人一体机、商用及家用服务机器人等,尤其在智能家居、智慧零售、教育等领域展现出了强大的赋能作用。随着大模型技术的发展,讯飞机器人超脑平台正从终端多模态交互和大模型理解决策两个维度,构建全新的人形机器人交互方式,推动整个机器人产业的进步。 活动期间,科大讯飞还主办了“人形机器人语音交互技术标准”开题会,汇聚了来自机器人产业协会、高校、企业以及标准检测机构的专家,共同探讨了人形机器人交互的未来定义和标准要求。会议达成共识,认为多模态和端到端的交互将成为未来机器人的主要交互形态,而人形机器人的交互标准与机器人的智能化分级密切相关。下一步将继续深化讨论,细化标准细节,加快构建人形机器人领域的人机语音交互建立完善的模式体系,提高交互成效。 人形机器人语音交互技术标准开题会 此次大会,科大讯飞不仅展示了其在人工智能领域的最新成就,更向世界证明了中国在智能机器人技术方面的快速发展和创新实力。随着技术的不断进步和应用场景的不断拓展,智能机器人将成为人类生活中不可或缺的伙伴,为社会的发展带来革命性的变化。未来,科大讯飞将继续携手行业伙伴,不断推动技术创新,深化产学研合作,共同探索智能科技的无限可能。
科大讯飞明确2024大模型目标:100万生态、1000万硬件终端、1亿软件用户
星火

科大讯飞明确2024大模型目标:100万生态、1000万硬件终端、1亿软件用户

上证报中国证券网讯(记者 孙小程)2月6日,以“顶天立地 星火燎原”为主题的科大讯飞2024年公司年会在中国科技大学举行。科大讯飞董事长刘庆峰及总裁吴晓如在现场系统总结科大讯飞2023年发展情况,并明确2024年发展目标。 面向2024年,刘庆峰提出讯飞大模型战略的年度四大目标:底座大模型领先,星火通用大模型国内领先对标GPT-4;赋能软硬件产品,赋能智能硬件终端1000万、独立软件用户数过亿;行业应用领先,教育、医疗、金融、汽车、央国企、城市行业市场第一;开发者生态领先,汇聚100万开发者形成行业第一生态。 此外,2024年海外业务在C端硬件、开放平台、语言学习等方面要踏上新台阶,从战略上形成国内、国际两个市场的相互补充和风险对冲。 刘庆峰介绍,2024年,在常规业务中将夯实基本盘,围绕根据地业务、C端硬件再上台阶、渠道拓展等方面开展,而对于代码助手、高校业务、智能硬件、智慧大屏、智算平台等围绕星火的战略新机遇,则要保持敏锐的战略机动性,关键时刻饱和投入。 刘庆峰分析称,通用大模型的每次迭代都将“淹没”一批弱的行业模型和应用。通用大模型的高度决定了行业大模型最终的能力和水平,2024年是关键分水岭。据介绍,星火大模型从去年5月6日首次发布以来,一路追赶已迭代到V3.5版本,已经逼近GPT-4 Turbo的当前水平。刘庆峰进一步表示,2024年星火将以肉眼可见的速度升级,预计在今年上半年达到GPT-4 Turbo当前最好的水平。 如何抓住通用人工智能的大未来?刘庆峰认为,这不仅需要在数据、算法、算力、应用四大方面持续攻坚,更强调团队精神是创造“奇迹”的核心,让每一次星火迭代都如期而至。 以算力为例,讯飞已经发布了首个支撑万亿参数大模型训练的国产算力平台“飞星一号”,星火V3.5的如期发布,既是讯飞大模型算法能力的证明,又是全国产算力平台能力的证明。值得一提的是,在合肥诞生的“飞星一号”从酝酿到建成只用了5个月。“坚定不移地在合肥打造通用人工智能产业生态,回报桑梓。”刘庆峰说。 2024年是星火燎原元年,通用人工智能的燎原行动刚刚开始,未来是要在长跑中战胜对手,如何做到?刘庆峰认为,一是要有战略指引,顶天立地,有战略,有落地;二是要坚定不移地给客户创造价值,要有源于热爱的长期主义精神;三是通过组织的力量把底座做扎实,要对关键的战略方向全力投入,形成基本盘加增量盘的组合模式。返回搜狐,查看更多 责任编辑:
刘庆峰:讯飞星火V4.0本月发布,将提供多项GPT-4o不具备的能力
星火

刘庆峰:讯飞星火V4.0本月发布,将提供多项GPT-4o不具备的能力

IT之家 6 月 11 日消息,科大讯飞今年 3 月推出了讯飞星火大模型 V3.5,而讯飞星火 V4.0 将于今年 6 月 27 日正式发布。 科大讯飞董事长刘庆峰在公司成立 25 周年司庆活动上透露,讯飞星火 V4.0 发布时将展示最新的端到端智能语音落地成果,同时公司的端到端的语音技术建模方案也排在计划中,预计三季度推向市场。 除此之外,科大讯飞还将提供 GPT-4o 没有的一句话复刻、高噪音场景语音识别、多方言多语种免切换功能。 在刘庆峰看来,OpeanAI 发布 GPT-4o 对万物互联时代语音浪潮的推动,类似于当年 Siri 对语音应用的推动。它备受关注的原因有几个点:超拟人合成,使得说话不再是朗读腔调,而是真的像人一样自由对话;全双工交互,可以同时(瞬时)进行信号的双向传输,人机对话可以随时打断和继续;通过语音到语音的端到端建模,实现快速反应的极致交互体验。 据介绍,目前科大讯飞在超拟人合成技术方面,中英文、多语种都做到了国际领先。全双工技术方面,端到端的语音技术,背后有语音识别、文本生成、语音合成的过程,这些技术将在公司 6 月 27 日将发布的讯飞星火 V4.0 中得到体现,IT之家届时将为大家带来详细报道。 刘庆峰表示,在 5 月底上线的讯飞星火 V3.5 Max 版本,已在文本生成、知识问答、逻辑推理、数学能力上超越 GPT-4 Turbo 0429 的最新版本。 他还指出,大模型时代科大讯飞核心战略组成包括:返回搜狐,查看更多...
多领域头部企业为何“偏爱”讯飞星火?我们从这三个关键维度读懂
星火

多领域头部企业为何“偏爱”讯飞星火?我们从这三个关键维度读懂

6月9日,是科大讯飞成立的25周年。在司庆活动上,董事长刘庆峰在内部讲话中深入分析了如何看待语音和大模型的战略机遇、如何看待科大讯飞当前竞争态势、如何打赢大模型之战这三大问题,并坦言科大讯飞正经历创业以来最充满挑战、最扣人心弦、最激动人心的历史时刻。 刘庆峰从大模型底座能力、承担战略任务、行业龙头客户招标选择三个关键维度,概括了讯飞星火为何能成为多领域头部企业的首选。站在语音和大模型全新的战略机遇交汇处,他强调了从技术中来到产品中去的产品导向,通过五大核心战略来打赢大模型之战。 坚守十年,迎来语音和大模型的全新战略机遇 1999年,科大讯飞创始团队定下公司使命“让机器能听会说,实现人类和人机信息沟通无障碍”。2014年,科大讯飞作出战略判断,提出下一个发展阶段从“智能语音到认知智能”“让机器能听会说,能理解会思考”。坚守十年之后,科大讯飞在2024年迎来了前所未有的全新战略机遇。 如何看待语音产业和大模型带来的全新战略机遇? 刘庆峰以一直引领行业热潮的OpenAI为例,从通用底座的GPT-4,到有视觉功能的GPT-4V,到语音大模型Whisper、文生视频大模型Sora,再到今年5月份发布的语音和音视频能力都有所提升的GPT-4o,每一次更新都离不开底座大模型的智慧升级。同时,OpenAI把工程化也做得更加透彻,包括超拟人、全双工对话、端到端的极致体验速度,展示了人机交互能达到更好的水平,对整个语音市场都是一个非常大的推动。 刘庆峰表示,原来的语音合成、语音识别、机器翻译等单点技术,通过大模型的理解能力、文本生成能力在后台加持提升,实现了语义理解、指令跟随、多轮对话、情绪感知、超拟人合成,真正使得语音交互得到提升。 “在这个背景下,语音领域的几乎所有应用都值得用新方式重构一遍,这就是现如今语音产业的全新战略机遇。”刘庆峰表示,医疗导诊机器人、酒店服务机器人、所有企业的客服机器人等都可以重新使用;7×24小时营业场所的部分岗位、企业中的服务类岗位等都可以使用数字员工;汽车、手机、家庭助手等终端的智能语音服务也能得到很大提升。类似的应用领域非常多,产业空间巨大。 他分析,GPT-4o对万物互联时代语音浪潮的推动,类似于当年Siri对语音应用的推动。它备受关注的原因有几个点:超拟人合成,使得说话不再是朗读腔调,而是真的像人一样自由对话;全双工交互,可以同时(瞬时)进行信号的双向传输,人机对话可以随时打断和继续;语音到语音的端到端建模实现快速反应的极致交互体验。 目前科大讯飞在超拟人合成技术方面,中英文、多语种都做到了国际领先。全双工技术方面,科大讯飞早在2016年就定义了万物互联时代的人机交互标准,包括远场、多人、全双工这些特性。2020年1月,在韩国釜山举行的ISO/IEC JTC 1/SC 35全会上,科大讯飞主导提出了全双工语音交互国际标准,2023年5月正式颁发。端到端的语音技术,背后有语音识别、文本生成、语音合成的过程,今年6月27日,讯飞星火V4.0发布也将给大家展示最新的端到端落地成果;端到端的语音技术建模,科大讯飞有全栈技术方案,也排在计划中,需要算力和时间去实施,预计三季度推向市场。除此之外,科大讯飞还可提供GPT-4o没有的一句话复刻、高噪音场景语音识别、多方言多语种免切换等功能。 “大模型时代的语音技术本质上是一次推动万物互联和原有人机交互场景重构的巨大产业机会,科大讯飞一定能够抓住最好的核心技术和应用的红利。” 刘庆峰透露,下一步,科大讯飞将发力远场高噪音多人说话场景、高表现力个性化场景、云边端一体化、软硬件一体化,构建全方位持续领先优势。 大模型日益展现出的巨大潜力,让行业赛道内玩家云集,各种技术评测榜单层出不穷。刘庆峰一方面拿事实说话:讯飞星火在过程中不断迭代,5月底上线的讯飞星火V3.5 Max版本已在文本生成、知识问答、逻辑推理、数学能力上处于领先水平;一方面也要冷静分析:大模型的能力可达程度也是分台阶的,“就算是榜单第一,就算是超过了GPT-4 Turbo当前水平,面对今天的产业战略机会,还要看大模型在哪些领域能真正实用。” 刘庆峰认为,大模型能力可达的程度是分台阶的,可以分三个层次:第一,一般难度任务,比如文本摘要、文本生成、要素抽取、基本意图的识别等,使用通用基座模型或数千量级的SFT(一周左右就能做完),能达到比较好的程度;第二,中等难度任务,比如检索类知识问答,需要有一个结合检索和深度分析的场景,再如单场景的专用智能体,这就需要10万级别的SFT并做比较深的优化才能有性能的显著提升;第三,高难度任务,如高难度数学推理、长链条知识推理问答、开放领域的通用智能体等,短期内难以达到好用水平,需要更大规模参数的大模型并配合专用领域的算法模型才有可能完成,目前还在探索阶段。 举个例子,保险的知识问答是人机对话的典型应用领域。2023年11月,中国人民保险集团联合认知智能全国重点实验室和科大讯飞,研发了人保首个百亿级参数的专属问答领域大模型——“数智灵犀一人保大模型”。今年以来,通过数万量级的SFT微调并采用全新技术方案,实现长文本能力的大幅提升,使得规模文档的问答效果相对提升了70%以上。 在全新的战略机遇面前,刘庆峰亦坦言:今天大模型拼的不仅仅是底座能力,还必须围绕刚需的使用场景构建真正的核心优势。 三个关键维度看讯飞星火的领先地位 刘庆峰从大模型底座能力、承担战略任务、行业龙头客户招标选择三个方面给员工阐释了讯飞星火的领先地位。 大模型底座的技术实力上,从认知智能全国重点实验室牵头、中国科学院人工智能产学研创新联盟和长三角人工智能产业链联盟共同参与设计的通用认知大模型评测体系看,今年5月底升级的讯飞星火V3.5 Max,在国内可测的大模型中处于领先地位,尤其是在文本生成(特别是英文)、逻辑推理、数学和代码能力上领先优势显著。“当我们在通用能力上紧跟国际最先进水平以后,我们在教育、汽车、医疗等专用领域就可以实现超越。”(注:高考期间,多家媒体和专业人士用高考中英文作文题和数学题对大模型能力进行测评,讯飞星火占据榜首。)刘庆峰预告,6月27日讯飞星火V4.0发布,将会进一步强化国内的领先地位。 从使命站位看,作为国内第一个基于全国产算力平台训练的大模型,完全自主可控的讯飞星火也承担了国家发改委、工信部、科技部和中国科学院的多项重要任务,不断夯实重要地位。 第三方的客户选择是大模型竞争力的重要体现之一,讯飞星火也成为多领域头部企业的首选。 在国内市场,讯飞星火已成为国家能源集团、中国石油、中国移动等行业龙头客户的选择。其中国家能源集团的能源大模型招标后选择科大讯飞;与中国移动联合打造的5G AI商务速记和全新移动APP,在5月23日第七届数字中国建设峰会上正式发布;中国石油也选择了和科大讯飞共同建设“昆仑大模型”。 经过客户的层层比选,讯飞星火已经成为汽车、家电和机器人领域大模型应用的首选品牌。 在汽车领域,奇瑞、蔚来、广汽、一汽等国产品牌都在和讯飞合作,国际汽车品牌大众在评估后也迅速落地应用,于3月13日发布首款搭载星火大模型的车型“ID.UNYX” 。 在家电领域,海尔的家电大模型进行了招标,最终选择了科大讯飞。公司还在和美的集团、海信集团、TCL集团等家电企业开展全方面合作。 科大讯飞与优必选、傅利叶智能、宇树科技、朴津智能等品牌开展合作,赋能近400家机器人企业。 刘庆峰说:“这些都是客户慎重选择、各家竞争的结果,代表着讯飞星火真正的硬实力。” 讯飞星火的C端用户黏性也越来越强,涌现出很多热门助手。后台数据显示:绘画大师使用次数1674万;写作助手使用次数596万;文案助手使用次数400万…… 今年5月初教育部公布了首批18个“人工智能+高等教育”典型应用场景案例。其中,北京邮电大学的“‘码上’——大模型赋能的智能教学应用平台”、国家开放大学的“基于AI技术的大模型个性化英语教学创新实践”,都是由讯飞星火大模型提供的技术,刘庆峰认为:“除了大家都喜欢用的口语学习工具‘星火语伴’外,基于代码能力延伸出个人助手和学习工具,也将一定会成为每个人非常重要的助手。” 从技术中来到产品中去 打赢大模型之战的5大核心战略 站在语音和大模型全新的战略机遇交汇处,科大讯飞拥有领先的身位,那么如何打赢这场大模型之战呢? 刘庆峰分析,大模型时代科大讯飞的核心战略组成包括:第一,赋能现有的软硬件和行业产品,形成基本盘。背靠科大讯飞的根据地业务,深入教育、医疗、工业、汽车、家电等行业赛道,同时打造基于大模型的翻译机、学习机等王牌硬件产品。第二,开拓以重点企业为代表的重点行业客户市场。按照大模型能力可达程度的三个台阶,提供真正解决行业和企业刚需的方案。第三,开辟新兴赛道的软硬件一体化授权和新硬件机遇。比如机器人硬件、医疗硬件等。第四,在万物互联时代,AI助手的入口级战略机遇。以“能听会说”为前端,以“能理解会思考”为后端,将极大推动万物互联时代进程。第五,推进“讯飞超脑2030”计划,迈向家庭陪伴机器人的万亿市场。 他也透露了部分“大模型成绩单”,其中大模型赋能的智能软硬件产品成为业绩增长的关键来源:今年618实现“开门红”,C端智能硬件的销售额实现了同比82%的增长;今年1~5月份科大讯飞AI学习机销量增长153%,用户净推荐值持续居行业第一;星火大模型赋能的智慧黑板已经实现了代差级领先;中国汽车出口的多语种技术几乎全部由科大讯飞提供。此外,智医助理的能力延伸出来的家庭医生随访和慢病管理已经覆盖了中国1.3亿的居民;健康终端方面,讯飞助听器的销售额翻番增长,2023年在京东天猫618&双十一获行业第一。 讯飞的人工智能产业生态也在蓬勃发展,去年5月以来,讯飞开放平台的开发者团队增加了200万以上、总数增长了66%。大模型相关注册开发者团队51万,其中企业开发者32万、个人开发者19万。其中不仅仅提供软件,更有软硬件一体化解决方案。 刘庆峰表示,大模型应用落地的一个关键是云边端一体化和软硬件一体化,在底座能力和垂直方向上要做透还要做好,用更小的算力做出相对更优的效果。“在云侧,我们有很好的大参数的通用模型(各种不同尺寸都有),也有星火一体机、‘飞星一号’算力平台等完全自主可控的硬件支撑;在边端侧,科大讯飞有在汽车等行业落地的中等参数模型和软硬件一体化方案,也有完全能够在手机等智能终端上安装和使用的‘小’模型和方案。从而形成了云边端一体化和软硬件一体化的综合落地优势。” 船到中流浪更急,刘庆峰说,抓住大模型红利的关键,最重要的还是“顶天立地”:核心技术保持业界领先,大模型底座做到领先,云边端软硬一体化做到领先。“从技术中来,到产品中去,才能真正改变世界。”聚焦市场导向,做出典型领域的刚需产品,“把大模型赋能做到实处,把市场空间真正激发,这是我们要做的事。” 会上,刘庆峰也明确,科大讯飞价值观的第一个方向就是一切为客户创造价值,公司下一步也将通过一系列机制推动面向战略市场领域的产品聚焦,让产品最终能真正给客户创造刚性的价值,可衡量、可评价。...