文章主题:世界人工智能大会, 百度, 王海峰, 文心大模型
在2023年7月6日,第21届世界人工智能大会(WAIC)于上海世博中心盛大开幕。在这次盛大的会议中,我国知名科技公司百度的首席技术官兼深度学习技术及应用国家工程研究中心主任王海峰,深入剖析了文心大模型3.5版的重大核心技术,并介绍了飞桨生态的最新发展情况。此外,他还详细阐述了人工智能产业的新模式,为我国人工智能技术的最新发展动态提供了有力支撑。
飞桨已凝聚750万名开发者,文心3.5效果提升50%,推理速度提升30倍
如今,人工智能技术以大语言模型为核心在全球范围内引发了一场科技创新和产业变革的狂潮,从而推动产业升级和经济增长。各行各业都将面临深刻的变革。IT技术栈正在经历一场根本性的转变,从传统的芯片、操作系统和应用三层架构,逐渐转向芯片、框架、模型、应用四层架构。其中,深度学习框架和大模型作为产业智能化的基石,将支持各行各业的智能化应用重塑,进而推动经济的高质量发展。
据深入了解,我们发现百度在人工智能的四层技术架构中,都拥有自身研发的领先技术,尤其是在框架层和模型层,这是其独特的优势所在。值得一提的是,文心大模型的最新突破,也离不开飞桨平台和文心的共同优化。飞桨,作为我国首个自主研发的产业级深度学习开源开放平台,已经吸引了大量开发者的参与。王海峰在现场透露,截止到2023,飞桨已经汇集了超过750万名的开发者,这是我们首次从百度处获得飞桨生态的最新数据。
自2019年3月推出1.0版本以来,百度文心大模型经过四年的技术深度挖掘和研发的不断迭代,已经升级至3.5版本。王海峰透露,文心大模型3.5在效果、功能和性能方面都实现了显著的提升。它不仅实现了基础模型的升级,而且在精调技术创新、知识点增强以及逻辑推理增强等方面都有所突破。这些优化使得模型的效果提升了50%,训练速度增加了2倍,推理速度则提升了30倍。
核心技术持续突破,效果和效率齐跃升
今年三月份,百度在全球科技巨头中率先推出了文心一言这款大语言模型产品。作为一款知识增强型的大语言模型,文心一言首先通过学习海量的数据和丰富的知识库,构建出了一个庞大的预训练模型。在此基础上,它运用了有监督精调、人类反馈的强化学习以及提示等技术,进一步优化自身的性能。此外,文心一言还具备知识增强、检索增强和对话增强等多重技术优势,使其在同类产品中脱颖而出。
王海峰深入剖析了文心大模型3.5的关键技术创新。在基础模型训练方面,其运用了飞桨的最先进的自适应混合并行训练技术以及混合精度计算策略。此外,通过多元化的方法优化数据源和数据分布,从而加速模型的迭代过程,进而显著提升模型的效果和安全性。同时,该版本还创新性地引入了多类型多阶段有监督精调、多层次多粒度奖励模型、多损失函数混合优化策略以及双飞轮结合的模型优化等技术,进一步强化了模型的效果以及其对不同场景的适配能力。
原内容表达:文心大模型3.5在知识增强和检索增强的基础上,提出了一种名为“知识点增强技术”的创新方法。这种技术能够深入分析理解用户输入的查询和问题,发掘出生成答案所需的关键知识点。接着,通过知识图谱和搜索引擎的技术优势,将这些知识点快速定位并找到对应的答案。最后,利用这些知识点,构建出更加精确、详尽、专业的提示信息,从而为大模型注入了更具针对性、深度和广度的知识点,有效提升了大模型在世界知识领域的掌握和运用能力。改写后的内容:基于知识增强和检索增强的基础,文心大模型3.5创新性地引入了“知识点增强技术”。这一技术通过深入分析用户输入的查询和问题,揭示出生成答案所需的必要知识点。随后,借助知识图谱和搜索引擎的高效运作,迅速将这些知识点定位并匹配到相应的答案。最终,通过将这些知识点转化为提示信息,为大模型提供了更具针对性和专业性的知识补充,从而显著提升了大模型在世界知识领域的理解和应用能力。
为了在推理领域提高文心大模型的性能,我们采用了多种方法:首先,通过处理大规模逻辑数据,构建了逻辑知识模型;其次,运用多粒度语义知识组合技术,增强了模型的表达能力;最后,结合符号神经网络技术,提升了文心大模型在逻辑推理、数学计算和代码生成等任务上的表现。
新增插件机制,拓展大模型能力边界
文心大模型3.5新增了插件机制,文心一言已经于6月17日对外发布官方插件百度搜索和ChatFile。百度搜索是默认的内置插件,使得文心一言具备生成实时准确信息的能力。ChatFile是长文本摘要和问答插件,支持超长文本输入。
王海峰表示,文心一言将发布更多优质的百度官方和第三方插件,让用户能够更好地应用文心大模型,同时也将逐步开放插件生态,帮助开发者基于文心大模型打造自己的应用。
广泛应用于各类场景,加速产业智能化升级
现场王海峰展现了文心一言在办公、会议、编码等场景的应用,文心一言成为工作中的“超级助理”,帮助总结工作沟通要点,实时记录会议内容,形成会议议题、摘要及总结等关键信息,可以通过各类插件完成指令任务,包括查询日程、创建会议、设置待办、申请休假等,也可以在工程师编码过程中自动推荐和生成代码。据悉,目前这些功能已通过智能工作平台“如流”应用于百度的工作流程中,帮助提升工作效率,提高决策质量。
王海峰表示,凡是要跟语言文字或程序代码打交道的应用场景,都可能有文心一言的用武之地。已经有很多在积极应用文心一言的场景,例如能源、金融、教育、办公、媒体,等等。在文心一言这类大模型产业落地的进程中,可以采用“集约化生产,平台化应用”的模式,即具有算法、算力和数据综合优势的企业将模型生产的复杂过程封装起来,通过低门槛、高效率的生产平台,为千行百业提供大模型服务。
世界人工智能大会, 百度, 王海峰, 文心大模型

AI时代,拥有个人微信机器人AI助手!AI时代不落人后!
免费ChatGPT问答,办公、写作、生活好得力助手!
搜索微信号aigc666aigc999或上边扫码,即可拥有个人AI助手!

