以ChatGPT为代表的大模型所展现出的“智能涌现”,迅速掀起了通用人工智能发展的全新浪潮。在过去不到两年的时间里,大模型相关技术持续革新,并从文本延展向多模态;相关应用也在不断探索和落地,深刻影响着各行各业。随着技术和应用的“狂奔”,大模型面临的技术挑战也在时刻刷新。站在当下,面对前路阻碍,如何实现破局?8月19日,在北京举办的2024中国自动化与人工智能教育大会上,科大讯飞副总裁、研究院院长刘聪发表主题报告,介绍了在新挑战下讯飞星火大模型的最新进展和技术创新,以及讯飞星火如何助力教育领域高质量发展

应对通用大模型技术挑战,讯飞星火的四大“新招式”目前,大模型产品和应用已成为越来越多人日常生活、办公中离不开的好帮手,也不断提高了对其“实用”“好用”的要求,并且需要持续创新拓展技术上限和应用场景。因此,作为底座的通用大模型发展也面临诸多技术挑战,刘聪总结为四点:端到端等新框架推广性问题;大模型的可信可解释问题;大模型个性化“最后一公里”问题;支撑大模型的算力集群建设问题。“针对这些问题,讯飞也进行了许多技术创新与系统性创新尝试,给出了一些代表性的技术创新思路和方法。”现场,刘聪详细分享了四大技术挑战与讯飞的技术创新成果。

端到端等新框架推广性问题

技术创新解题:基于多模态端到端框架的极速超拟人语音交互

框架模型算法持续演进,以GPT-4o、特斯拉FSD(全自动驾驶)等为代表的多模态端到端方案,进一步提升了技术效果和用户体验。但在过程中,仍然存在多模数据获取与对齐、系统落地定制化的灵活性等问题。

8月19日,讯飞官宣发布星火极速超拟人交互,在响应和打断速度、情绪感知情感共鸣、语音可控表达、人设扮演四个方面实现突破。这背后便是从此前的级联方案,升级为统一神经网络直接实现语音到语音端到端建模,大幅缩短响应时间,做到了真正的“极速”,同时也提升了交互的拟人度和流畅度。全新的星火极速超拟人交互来啦!

基于端到端框架,再融合讯飞多维度语音属性解耦表征训练准则,将内容、音色、情感、语言、风格都信息进行解耦训练,使得星火极速超拟人交互能够更加灵活控制各类元素,还能根据需求便捷定制,让系统快速落地应用。8月30日,星火极速超拟人交互将率先全民开放使用,未来还会持续在交互上创新突破,不仅会带来更多更实用、丰富的功能,也会拓展到更多模态。

大模型的可信可解释问题

技术创新解题:基于评语模型的大模型幻想问题优化大模型幻想问题一直备受大众关注,也是影响大模型达到“实用”的关键因素之一。目前,通过RAG、搜索插件等方法,大模型的幻想问题得到了一定缓解,但在教育、医疗、金融等行业领域的实际应用场景还存在不少问题。讯飞研究院通过算法优化和多语言混合协同过滤等方法,结合实际应用场景持续改善。其中,基于评语模型的大模型幻想问题优化属于超级对齐技术方向的探索:评语模型指出大模型存在的幻觉问题,大模型得到评语模型的评价后自我完善提升。同时,评语模型也通过强化训练进一步提升发觉幻觉问题的能力,整个过程无需人参与标注,两个模型相互博弈、共同进化。除此之外,多语言混合协同过滤后进行精细数据清洗的方法也能获取高质量数据。通过多语言句子篇章的全局统一表示,再创建立体化保障机制,改善大模型的污语料和幻觉问题。今年6月,讯飞星火V4.0发布会上业内首发了溯源功能,不仅有效缓解长文档知识问答的幻觉问题,多模态溯源也能更好帮助个性化体验与使用,展现了讯飞解决大模型幻觉问题的阶段性成果。

大模型个性化“最后一公里”问题

技术创新解题:基于大模型底座+专属个人空间打造“懂你的AI助手”想要从可用到好用,个性化是大模型应用的必要能力之一。随着对大模型产品的熟悉、掌握,用户的个性化需求也在增加。但对于大模型来说,个性化的功能定义和技术实现仍然面临很大的挑战。

科大讯飞给出的答案是打造更懂你的AI助手,结合通用大模型底座和6月27日率先发布的“个人空间”,AI助手能基于用户画像进行个性化表达,基于交互历史实现记忆学习,基于个人资料进行增强学习。在“个人空间”里,用户可以上传自己的工作、学习、生活、健康等各类资料,形成每个人的专属知识库,再结合人设,让大模型生成更个性化内容。

拓展到专业领域,讯飞升级了讯飞晓医APP,能够根据电子病历、检查报告、体检报告等用户个性化资料,构建个人数字健康空间,提供了新的个人及家庭健康管理模式,展现大模型+个性化+专业领域的新可能。

支撑大模型的算力集群建设问题

技术创新解题:打造全国产化大模型算力底座,算力集群、智能框架和异构调度系统持续提升大模型参数和训练数据的不断增长,对算力的考验越发严峻;与此同时,大模型Scaling Law的验证也需要更大规模算力集群的支持。在超大规模集群下的训练推理高效算法框架,是一项极其复杂系统工程,对于国产算力集群来说,挑战更甚。为了突破“卡脖子”,科大讯飞自研平台实现大模型训练推理一体化设计,陆续与华为合作发布了星火一体机、首个国产万卡算力集群“飞星一号”,基于“飞星一号”完成了讯飞星火大模型V3.5、V4.0模型训练,实现全面对标GPT-4 Turbo。目前,“飞星一号”作为国产算力集群代表,整体训练性能已经从30%提升到95%,这一数据仍在持续优化;“飞星一号”已常态化支撑讯飞星火大模型训练,平均资源利用率超90%。在复杂系统工程能力上,讯飞自研出超大集群的智能框架和异构调度系统,保障大模型训练长时稳定运行,平均故障间隔对标Meta的Llama 3.1训练已达到相当水准星火大模型助力教育高质量发展:深度赋能教与学大模型赋能千行百业的前提,需要首先分析不同领域中有怎样的刚需场景、存在哪些亟待解决的问题,再综合考虑大模型是否能解决、怎样解决这些问题。对于事关国计民生的教育来说,基础教育聚焦减负增效、五育并举,高等教育则是科研范式变革与创新人才培养。

科大讯飞在智慧教育方向深耕多年、积累深厚,相关产品已在全国32个省级行政区应用,深度服务5万余所学校、累计超1.3亿师生,并积极助力高等教育院校数字化转型和高质量发展,推进产教融合、共建多个人工智能专业和产业学院。刘聪也分享了星火大模型如何深度赋能教与学各环节,为教师提供AI教辅、为学生提供AI辅学,释放教育想象力。

面向教师:全面助力“三新”改革“三新”(新课程、新教材、新高考)改革的不断深入给教师的备课、教学活动设计和教学创新等带来了全新挑战。

基于星火大模型,讯飞推出星火教师助手,以对话式、生成式的自然交互,为教师智能生成科学系统的单元教学规划、创新引领的教学设计、贴合情境的教学课件等内容,提高教师备课效率;在家访、班会设计等日常工作和教研场景,星火教师助手也能启发灵感,助力教师成长。根据一线教师应用数据,星火教师助手实现教学设计效率提升超56%,课件制作效率提升超64%,好评率高达93%

除此之外,基于星火大模型研发的课堂实录与分析方案能够通过课堂实录还原授课过程,对各教学环节内容总结、生成纪要;进行课堂教学深入分析,帮助教师发现潜在问题、制定改进策略;还能进行师生问答分析,优化课堂教学语言。在教学后,不仅能让教师更高效回顾课堂重点,还能让课堂教学反思更精准。

面向学生:因材施教,高效助力个性化学习目前,孩子接收到各类场景的学习资源类型各有不同,想要针对孩子具体情况规划学习路径、进行资源推荐,就需要融合多场景数据。基于星火大模型对各类学习资源的深度理解能力,目前能够实现跨场景的学生学情画像,并融合其他维度的作答行为数据,实现多维学情诊断画像,进而给出动态学习路径的规划,并基于阶段学情智能生成共性和个性的错题、分层题包,同时提供个性化学习资源,满足孩子自主学习的需求。除了传统的习题类资源,大模型的加持让推荐系统能够拓展到多模态资源,帮助孩子提升学习效果和效率。在获得合适的学习路径和资源后,怎样在写作业遇到问题时获得更高效的答疑和讲解?最传统、直接的方式是对答案,但对于不是“学霸”的孩子来说,1对1辅导才是最优解,要历经思路点拨、分布列式、个性纠因这几步。基于星火大模型所全新升级的AI交互式答疑辅学,在精准捕捉孩子每一步标准作答动作后,能以启发引导的风格发问,让孩子通过互动探究式的学习进行自主思考,实现了1对1的个性化辅导;应用试点分析显示,这种方式不仅大大提升了学生主动参与答疑的比例,也显著提升了学习效率。目前,AI 1对1答疑辅导也已经上线讯飞AI学习机,让孩子多了一位AI辅学老师。

在星火大模型的加持下,讯飞在教育领域通过软硬件协同的系统性创新应用有了更多成果,例如讯飞AI学习机、星火智慧黑板,以及今年6月全新发布的星火智能批阅机等。除了深度赋能教与学,星火大模型在智慧体育、智慧心育、信息科技、科学教育等方面也发挥了重要作用;面向高等教育,星火大模型助力打造高校数字课程建设与学习代码大模型为师生提供了高效的编程教学助手、提升编程能力,为创新人才培养踏出新路径,科技文献大模型则为科研工作者在论文研读、辅助协作等方面提效,相关高校和科研机构团队也基于星火大模型开展AI for Science前沿方向的探索。“经过过去两年的追赶对标,中国大模型处于厚积薄发,既比拼耐力、又比拼耐心的状态。”刘聪表示,中国大模型发展要从对标、追赶走向原创创新,并且要落入应用带来真正价值。

\ \ \ \ \ \  END  \ \ \ \ \ \

发表回复

您的电子邮箱地址不会被公开。 必填项已用 * 标注