《讯飞星火认知大模型：国产大模型的领先者》

文章主题：讯飞星火, 国产大模型, 测评榜, 人工智能

原标题：新华社研究院发布国产大模型报告：讯飞星火总分第一

《人工智能大模型体验报告2.0》于8月12日由新华社研究院中国企业发展研究中心发布。在此次测评中，讯飞星火模型以总分1013分的好成绩名列国产主流大模型测评榜榜首，同时在该领域的智商指数和工具提效指数两个维度上位居第一。这表明，讯飞星火模型在提升工作效率方面表现尤为突出。

《报告》指出，讯飞星火认知大模型凭借其7大核心能力——文本生成、语言理解、知识问答、逻辑推理、数学能力、代码能力和多模态能力，展现出了卓越的跨领域知识和语言理解能力。该模型能够通过自然对话的方式，理解和执行各种任务。同时，它能在海量数据和大规模知识的海洋中不断进化，实现了从问题提出、规划到解决的全流程闭环。

在我国自主研发的大模型“涌现”的背景下，讯飞星火认知大模型的成长之路充满了紧凑的节奏：从项目启动到产品发布，再到持续的迭代升级，每一个环节都充满了紧张的气氛。首先，在5月6日，我们成功发布了讯飞星火认知大模型，并将其在教育、办公、汽车、人机交互、医疗等各个领域的实际应用进行了落地。紧接着，在6月9日，我们在开放式问答方面取得了重要突破，同时也在数学能力上对大模型进行了迭代升级。现在，我们正面临着即将到来的8月15日，这是一个关键的时刻。在这一天，我们将实现代码能力的重大突破，并在多模态交互能力上实现升级。这标志着我们的技术正在不断向前发展，向更高的目标迈进。最后，我们将在10月24日迎接一个重要的日子。这一天，我们将努力达到与ChatGPT相当的水平，实现中文的超越，英文的相当。这是我们对自身技术的坚定信念，也是我们对未来科技发展的期待和承诺。

《报告》指出，尽管人工智能在某些领域表现出色，但在智商评估上，人类依然占据显著优势。为了全面衡量这一问题，研究小组从常识知识（占20%）、逻辑能力（占50%）以及专业知识（占30%）三个方面对大型AI模型进行了评价。最终，我国讯飞星火模型在各项指标中脱颖而出，位居榜首。

作为讯飞星火“高智商”基础能力的核心要素，其代码技能将在8月15日迎来重要升级，并同步推出一系列相关代码产品成果。这无疑是一个令人振奋的时刻，值得我们充满期待。

《报告》指出，AI技术为人类在工作中提供了强大的助力，尤其是在处理速度上，其表现远超人类。然而，在面临复杂性和创新性较高的任务时，人类的智慧与想象力依然不可忽视。为此，研究组重点关注了工具提效和生成创新两个方面，最终得出了讯飞星火以350分的优异成绩位居榜首，且遥遥领先于其他竞争者的结论。

《报告》认为，与2023年6月相比，当前中国大模型产品进步显著。但与接受过高等教育的人类相比，大模型在智商、情商等方面还存在一定程度差距。虽然在不同领域中，AI和人类表现出不同的优劣势，但在整体上，AI大模型的发展为人类工作和生活的提质增效带来了重要的积极影响，大模型正在加速走进生活、走进产业。返回搜狐，查看更多

责任编辑：

讯飞星火, 国产大模型, 测评榜, 人工智能

AI时代，拥有个人微信机器人AI助手！AI时代不落人后！

免费ChatGPT问答，办公、写作、生活好得力助手！

搜索微信号aigc666aigc999或上边扫码，即可拥有个人AI助手！

相关文章

发表回复 取消回复

发表回复取消回复