以ChatGPT为代表的大模型所展现出的“智能涌现”,迅速掀起了通用人工智能发展的全新浪潮。在过去不到两年的时间里,大模型相关技术持续革新,并从文本延展向多模态;相关应用也在不断探索和落地,深刻影响着各行各业。随着技术和应用的“狂奔”,大模型面临的技术挑战也在时刻刷新。站在当下,面对前路阻碍,如何实现破局?8月19日,在北京举办的2024中国自动化与人工智能教育大会上,科大讯飞副总裁、研究院院长刘聪发表主题报告,介绍了在新挑战下讯飞星火大模型的最新进展和技术创新,以及讯飞星火如何助力教育领域高质量发展。

端到端等新框架推广性问题
技术创新解题:基于多模态端到端框架的极速超拟人语音交互
框架模型算法持续演进,以GPT-4o、特斯拉FSD(全自动驾驶)等为代表的多模态端到端方案,进一步提升了技术效果和用户体验。但在过程中,仍然存在多模数据获取与对齐、系统落地定制化的灵活性等问题。8月19日,讯飞官宣发布星火极速超拟人交互,在响应和打断速度、情绪感知情感共鸣、语音可控表达、人设扮演四个方面实现突破。这背后便是从此前的级联方案,升级为统一神经网络直接实现语音到语音端到端建模,大幅缩短响应时间,做到了真正的“极速”,同时也提升了交互的拟人度和流畅度。全新的星火极速超拟人交互来啦!
大模型的可信可解释问题
技术创新解题:基于评语模型的大模型幻想问题优化大模型幻想问题一直备受大众关注,也是影响大模型达到“实用”的关键因素之一。目前,通过RAG、搜索插件等方法,大模型的幻想问题得到了一定缓解,但在教育、医疗、金融等行业领域的实际应用场景还存在不少问题。讯飞研究院通过算法优化和多语言混合协同过滤等方法,结合实际应用场景持续改善。其中,基于评语模型的大模型幻想问题优化属于超级对齐技术方向的探索:评语模型指出大模型存在的幻觉问题,大模型得到评语模型的评价后自我完善提升。同时,评语模型也通过强化训练进一步提升发觉幻觉问题的能力,整个过程无需人参与标注,两个模型相互博弈、共同进化。除此之外,多语言混合协同过滤后进行精细数据清洗的方法也能获取高质量数据。通过多语言句子篇章的全局统一表示,再创建立体化保障机制,改善大模型的污语料和幻觉问题。今年6月,讯飞星火V4.0发布会上业内首发了溯源功能,不仅有效缓解长文档知识问答的幻觉问题,多模态溯源也能更好帮助个性化体验与使用,展现了讯飞解决大模型幻觉问题的阶段性成果。大模型个性化“最后一公里”问题
技术创新解题:基于大模型底座+专属个人空间打造“懂你的AI助手”想要从可用到好用,个性化是大模型应用的必要能力之一。随着对大模型产品的熟悉、掌握,用户的个性化需求也在增加。但对于大模型来说,个性化的功能定义和技术实现仍然面临很大的挑战。科大讯飞给出的答案是打造更懂你的AI助手,结合通用大模型底座和6月27日率先发布的“个人空间”,AI助手能基于用户画像进行个性化表达,基于交互历史实现记忆学习,基于个人资料进行增强学习。在“个人空间”里,用户可以上传自己的工作、学习、生活、健康等各类资料,形成每个人的专属知识库,再结合人设,让大模型生成更个性化内容。
支撑大模型的算力集群建设问题
技术创新解题:打造全国产化大模型算力底座,算力集群、智能框架和异构调度系统持续提升大模型参数和训练数据的不断增长,对算力的考验越发严峻;与此同时,大模型Scaling Law的验证也需要更大规模算力集群的支持。在超大规模集群下的训练推理高效算法框架,是一项极其复杂系统工程,对于国产算力集群来说,挑战更甚。为了突破“卡脖子”,科大讯飞自研平台实现大模型训练推理一体化设计,陆续与华为合作发布了星火一体机、首个国产万卡算力集群“飞星一号”,基于“飞星一号”完成了讯飞星火大模型V3.5、V4.0模型训练,实现全面对标GPT-4 Turbo。目前,“飞星一号”作为国产算力集群代表,整体训练性能已经从30%提升到95%,这一数据仍在持续优化;“飞星一号”已常态化支撑讯飞星火大模型训练,平均资源利用率超90%。在复杂系统工程能力上,讯飞自研出超大集群的智能框架和异构调度系统,保障大模型训练长时稳定运行,平均故障间隔对标Meta的Llama 3.1训练已达到相当水准。
科大讯飞在智慧教育方向深耕多年、积累深厚,相关产品已在全国32个省级行政区应用,深度服务5万余所学校、累计超1.3亿师生,并积极助力高等教育院校数字化转型和高质量发展,推进产教融合、共建多个人工智能专业和产业学院。刘聪也分享了星火大模型如何深度赋能教与学各环节,为教师提供AI教辅、为学生提供AI辅学,释放教育想象力。
面向教师:全面助力“三新”改革“三新”(新课程、新教材、新高考)改革的不断深入给教师的备课、教学活动设计和教学创新等带来了全新挑战。除此之外,基于星火大模型研发的课堂实录与分析方案能够通过课堂实录还原授课过程,对各教学环节内容总结、生成纪要;进行课堂教学深入分析,帮助教师发现潜在问题、制定改进策略;还能进行师生问答分析,优化课堂教学语言。在教学后,不仅能让教师更高效回顾课堂重点,还能让课堂教学反思更精准。
面向学生:因材施教,高效助力个性化学习目前,孩子接收到各类场景的学习资源类型各有不同,想要针对孩子具体情况规划学习路径、进行资源推荐,就需要融合多场景数据。基于星火大模型对各类学习资源的深度理解能力,目前能够实现跨场景的学生学情画像,并融合其他维度的作答行为数据,实现多维学情诊断画像,进而给出动态学习路径的规划,并基于阶段学情智能生成共性和个性的错题、分层题包,同时提供个性化学习资源,满足孩子自主学习的需求。除了传统的习题类资源,大模型的加持让推荐系统能够拓展到多模态资源,帮助孩子提升学习效果和效率。在获得合适的学习路径和资源后,怎样在写作业遇到问题时获得更高效的答疑和讲解?最传统、直接的方式是对答案,但对于不是“学霸”的孩子来说,1对1辅导才是最优解,要历经思路点拨、分布列式、个性纠因这几步。基于星火大模型所全新升级的AI交互式答疑辅学,在精准捕捉孩子每一步标准作答动作后,能以启发引导的风格发问,让孩子通过互动探究式的学习进行自主思考,实现了1对1的个性化辅导;应用试点分析显示,这种方式不仅大大提升了学生主动参与答疑的比例,也显著提升了学习效率。目前,AI 1对1答疑辅导也已经上线讯飞AI学习机,让孩子多了一位AI辅学老师。\ \ \ \ \ \ END \ \ \ \ \ \