混合大模型_Page 2_666AI大模型

文心一言

文心一言：中国科技“元实力”的一次喷发

· 这是第5096篇原创首发文章字数 4k+ · · 秦朔 | 文关注秦朔朋友圈 ID：qspyq2015 · “我们正处在一场新的重大科技革命的序章。” 这是“两会”之后的一个晚上，我在一场科技发展与新型举国体制的夜话中，不止一次听到的判断。去年11月30日ChatGPT上线，人工智能迎来了iPhone时刻。3月16日下午，百度宣布正式推出基于百度新一代大语言模型的生成式AI产品文心一言（英文名：ERNIE Bot），也就是之前一段时间人们所期待的“中国的ChatGPT”。当人工智能多年积蓄的力量喷薄而出，无数被其赋能的新物种、新应用的大爆发也就水到渠成。勇气与厚积薄发的信心从去年9月通过“健全关键核心技术攻关新型举国体制的意见”，到“两会”宣布重组科学技术部，组建中央科技委员会，科技创新在中国现代化建设全局中的核心地位已毋庸置疑，它既是未来中国经济的关键变量，也是高质量发展的最大增量。在人工智能这一具有战略性、全局性、辐射带动性的科创高地上，中国将有何新作为？百度推出文心一言最大的意义，可能不止于技术本身，而在于直面国际科技竞争赛场的格局与勇气，这是一个远比文心一言更重要的问题。 3月5日，科技部部长王志刚在十四届全国人大一次会议首场“部长通道”上说，中国在自然语言处理和理解方面进行了多年的研究，既要通过科学研究、技术牵引，又要通过场景驱动、用户需求，使得人工智能能为中国经济社会发展、为中国科技作出贡献。他还谈到了ChatGPT，认为ChatGPT要做到算法的实时性和有效性并不容易。“从源头来看是自然语言理解、自然语言处理两个技术，之所以引起关注，在于它是一个大模型，对应大数据、强计算、好算法，原理是这样，就像踢足球都是盘带、射门，但要做到梅西那么好也不容易。” 从底层技术看，文心一言和ChatGPT都采用了SFT（模型微调）、RLHF（强化学习）、prompt（用户指令）等技术。这跟大模型通过海量无标注数据的训练是不同的，还需要人的参与，作用是更好地理解人的意图，生成符合人的价值观、表达习惯的回复。从演示看，文心一言和ChatGPT相比，在文学创作、商业文案写作、数理逻辑推算等方面的能力是“你有我有大家有”。但在中文理解上，文心一言非常领先，处于独一无二的位置。这是因为文心一言的训练数据包括万亿级网页数据，数十亿搜索数据和图片数据，百亿级语音日均调用数据，以及5500亿事实的知识图谱。研究表明，数据规模大，参数达到千亿级，大模型就可能发生“智能涌现”，涌现出知识和逻辑推理能力。而百度不仅数据规模大，数据形态也最贴合回答和生成需求，在百度搜索中问答和生成类的搜索请求占比很高。因此文心一言大模型在自然语言问答和创意内容生成上有着非常突出的表现。文心一言刚刚发布，就如同ChatGPT刚发布一般，注定有不完美的地方，但当其开始使用后，经由真实的用户反馈、开发者的调用和模型迭代，将飞速成长。面对世界各个科技巨头躬身入局的大模型赛道，百度是全球第一个对标ChatGPT的互联网大厂，这不仅是一种魄力，更是一种厚积薄发的势能。我在夜话中认识的一位投资人曾在百度人工智能部门工作多年。我问她怎么看文心一言。她说，Robin（李彦宏）可能是互联网公司创始人中最有技术情怀的，百度在人工智能方面投资最久、最多，人才和技术底子最厚，所以率先推出“中国的ChatGPT”是很自然的事。放在中美科技角逐的背景下，文心一言的推出更显重要，它证明在人工智能的这一关键应用上，中国并未落后。 “就像百度在无人驾驶方面投了几百亿，给今天的很多车企铺了路，其作用就像‘黄埔军校’一样，百度做科技，从来不止是服务于它本身。” “元实力”的一次喷发从眼下看，对消费者来说，文心一言的价值在于，当它嵌入百度搜索，用户能直接与大语言模型交互，实现搜索体验的升级。对企业来说，则丰富和强化了百度智能云的能力，通过向公众开放大语言模型，可以帮助企业主和创业者在云上构建自己的模型和应用，提高效率、帮助决策和改善客户体验。接下来，文心一言将与小度进行集成，升级小度的智能设备和服务；也将整合到百度的Apollo智舱系列产品等汽车解决方案中，让智能汽车具备领先的人车交互体验。事实上，在最近的一个月内，已有超过600家合作伙伴宣布加入文心一言生态，期待尽早用上最新的大语言模型。对他们来说，百度智能云所提供的不仅是存储、带宽、数据库等基本功能，更是包括飞桨和文心大模型等在内的全栈人工智能能力。这里简单梳理一下百度的人工智能能力体系。在进入人工智能时代之前，IT技术的技术栈一般分为三层：底层的芯片，中间的操作系统，上层的应用。进入人工智能时代后，百度的理解是四层：芯片层、框架层、模型层和应用层，并以此展开进行布局，即：芯片层的昆仑芯，2018年发布后已部署了几万片；框架层的“深度学习框架”飞桨，截至2022年底飞桨平台上已凝聚535万开发者，创建了67万个人工智能模型，服务20万家企事业单位；模型层的信息分布大模型、交通大模型、能源大模型等等，以及应用层的搜索、智能信控、电力等等。这一四层全栈能力体系的好处是，针对一些场景在四层之间有非常多的反馈，从而进行极致优化。比如在搜索场景上，百度的人工智能芯片已经优化了10年，是全球效率最高成本最低的，在搜索场景下可以超过全球优秀的通用芯片。文心一言位于四层架构中的模型层，它只是AI系统中承上启下的一环，假如脱离整个架构无异于空中楼阁。假如框架层和芯片层不能满足模型的需求，即使模型再好也无法发挥最大效果。虽然文心一言刚刚推出，但它生在一个充满阳光雨露的强大的生态中，与之相关的基础技术如深度学习、自然语言处理、大模型等百度已沉淀多年。对于百度的大模型，这里也稍作回顾。随着数据井喷、算法进步和算力突破，效果好、泛化能力强、通用性强的预训练大模型，开始成为人工智能产业应用的基础底座。2019年，百度推出了文心大模型ERNIE 1.0这一产业级知识增强大模型。通过大模型与深度学习框架的融合发展，百度打造了自主创新的人工智能底座，大幅降低了开发和应用门槛，真正发挥大模型驱动人工智能规模化应用的产业价值。文心大模型已迭代到了ERNIE 3.0，每天接受数十亿用户的搜索请求和其他百度移动生态app的训练。百度以文心通用大模型为基础，和各行各业的合作伙伴一起共建行业大模型，从行业及企业的特有数据和知识中，融合学习，提升大模型对行业应用的适配性。截至目前，文心行业大模型已经达到11个，覆盖能源电力、金融、航天、传媒、影视、汽车、城市管理、燃气、保险、电子制造和社科等多个领域，在产业化落地的过程中使大模型真正赋能千行百业。在我看来，在全球新一轮人工智能技术的普惠化、创造性应用的大潮中，着眼于芯片和算力的企业具备“硬实力”，着眼于算法和模型的企业具备“软实力”，着眼于垂直场景应用创新的企业具备“巧实力”，而全栈技术能力强、底层核心技术过硬，并能将技术广泛赋能于个人、产业、城市、交通以及社会方方面面的企业，则具备“元实力”。中国经济需要硬实力，软实力，巧实力，更需要元实力。天地成于元气，万物之生皆禀元气。“元实力”的积累，需要长期的积累。...

2 days前 1

文心一言：中国科技“元实力”的一次喷发

巨头加速布局！百度OPPO/vivo合作升级，季度营收创新高，AI未来已来?

百度Q1财报亮眼，核心营收增4%，搜索业务能否破浪前行？

百度Q1营收微增2%,净利润暴增22%,智能云业务带动增长,股价上涨的背后信号?