文心一言:中国科技“元实力”的一次喷发
文心一言

文心一言:中国科技“元实力”的一次喷发

· 这是第5096篇原创首发文章  字数 4k+ · · 秦朔 | 文  关注秦朔朋友圈 ID:qspyq2015 · “我们正处在一场新的重大科技革命的序章。” 这是“两会”之后的一个晚上,我在一场科技发展与新型举国体制的夜话中,不止一次听到的判断。 去年11月30日ChatGPT上线,人工智能迎来了iPhone时刻。3月16日下午,百度宣布正式推出基于百度新一代大语言模型的生成式AI产品文心一言(英文名:ERNIE Bot),也就是之前一段时间人们所期待的“中国的ChatGPT”。 当人工智能多年积蓄的力量喷薄而出,无数被其赋能的新物种、新应用的大爆发也就水到渠成。 勇气与厚积薄发的信心 从去年9月通过“健全关键核心技术攻关新型举国体制的意见”,到“两会”宣布重组科学技术部,组建中央科技委员会,科技创新在中国现代化建设全局中的核心地位已毋庸置疑,它既是未来中国经济的关键变量,也是高质量发展的最大增量。 在人工智能这一具有战略性、全局性、辐射带动性的科创高地上,中国将有何新作为? 百度推出文心一言最大的意义,可能不止于技术本身,而在于直面国际科技竞争赛场的格局与勇气,这是一个远比文心一言更重要的问题。 3月5日,科技部部长王志刚在十四届全国人大一次会议首场“部长通道”上说,中国在自然语言处理和理解方面进行了多年的研究,既要通过科学研究、技术牵引,又要通过场景驱动、用户需求,使得人工智能能为中国经济社会发展、为中国科技作出贡献。 他还谈到了ChatGPT,认为ChatGPT要做到算法的实时性和有效性并不容易。“从源头来看是自然语言理解、自然语言处理两个技术,之所以引起关注,在于它是一个大模型,对应大数据、强计算、好算法,原理是这样,就像踢足球都是盘带、射门,但要做到梅西那么好也不容易。” 从底层技术看,文心一言和ChatGPT都采用了SFT(模型微调)、RLHF(强化学习)、prompt(用户指令)等技术。这跟大模型通过海量无标注数据的训练是不同的,还需要人的参与,作用是更好地理解人的意图,生成符合人的价值观、表达习惯的回复。 从演示看,文心一言和ChatGPT相比,在文学创作、商业文案写作、数理逻辑推算等方面的能力是“你有我有大家有”。但在中文理解上,文心一言非常领先,处于独一无二的位置。 这是因为文心一言的训练数据包括万亿级网页数据,数十亿搜索数据和图片数据,百亿级语音日均调用数据,以及5500亿事实的知识图谱。 研究表明,数据规模大,参数达到千亿级,大模型就可能发生“智能涌现”,涌现出知识和逻辑推理能力。而百度不仅数据规模大,数据形态也最贴合回答和生成需求,在百度搜索中问答和生成类的搜索请求占比很高。因此文心一言大模型在自然语言问答和创意内容生成上有着非常突出的表现。 文心一言刚刚发布,就如同ChatGPT刚发布一般,注定有不完美的地方,但当其开始使用后,经由真实的用户反馈、开发者的调用和模型迭代,将飞速成长。 面对世界各个科技巨头躬身入局的大模型赛道,百度是全球第一个对标ChatGPT的互联网大厂,这不仅是一种魄力,更是一种厚积薄发的势能。 我在夜话中认识的一位投资人曾在百度人工智能部门工作多年。我问她怎么看文心一言。她说,Robin(李彦宏)可能是互联网公司创始人中最有技术情怀的,百度在人工智能方面投资最久、最多,人才和技术底子最厚,所以率先推出“中国的ChatGPT”是很自然的事。放在中美科技角逐的背景下,文心一言的推出更显重要,它证明在人工智能的这一关键应用上,中国并未落后。 “就像百度在无人驾驶方面投了几百亿,给今天的很多车企铺了路,其作用就像‘黄埔军校’一样,百度做科技,从来不止是服务于它本身。” “元实力”的一次喷发 从眼下看,对消费者来说,文心一言的价值在于,当它嵌入百度搜索,用户能直接与大语言模型交互,实现搜索体验的升级。对企业来说,则丰富和强化了百度智能云的能力,通过向公众开放大语言模型,可以帮助企业主和创业者在云上构建自己的模型和应用,提高效率、帮助决策和改善客户体验。 接下来,文心一言将与小度进行集成,升级小度的智能设备和服务;也将整合到百度的Apollo智舱系列产品等汽车解决方案中,让智能汽车具备领先的人车交互体验。 事实上,在最近的一个月内,已有超过600家合作伙伴宣布加入文心一言生态,期待尽早用上最新的大语言模型。对他们来说,百度智能云所提供的不仅是存储、带宽、数据库等基本功能,更是包括飞桨和文心大模型等在内的全栈人工智能能力。 这里简单梳理一下百度的人工智能能力体系。 在进入人工智能时代之前,IT技术的技术栈一般分为三层:底层的芯片,中间的操作系统,上层的应用。 进入人工智能时代后,百度的理解是四层:芯片层、框架层、模型层和应用层,并以此展开进行布局,即:芯片层的昆仑芯,2018年发布后已部署了几万片;框架层的“深度学习框架”飞桨,截至2022年底飞桨平台上已凝聚535万开发者,创建了67万个人工智能模型,服务20万家企事业单位;模型层的信息分布大模型、交通大模型、能源大模型等等,以及应用层的搜索、智能信控、电力等等。 这一四层全栈能力体系的好处是,针对一些场景在四层之间有非常多的反馈,从而进行极致优化。比如在搜索场景上,百度的人工智能芯片已经优化了10年,是全球效率最高成本最低的,在搜索场景下可以超过全球优秀的通用芯片。 文心一言位于四层架构中的模型层,它只是AI系统中承上启下的一环,假如脱离整个架构无异于空中楼阁。假如框架层和芯片层不能满足模型的需求,即使模型再好也无法发挥最大效果。 虽然文心一言刚刚推出,但它生在一个充满阳光雨露的强大的生态中,与之相关的基础技术如深度学习、自然语言处理、大模型等百度已沉淀多年。 对于百度的大模型,这里也稍作回顾。 随着数据井喷、算法进步和算力突破,效果好、泛化能力强、通用性强的预训练大模型,开始成为人工智能产业应用的基础底座。2019年,百度推出了文心大模型ERNIE 1.0这一产业级知识增强大模型。通过大模型与深度学习框架的融合发展,百度打造了自主创新的人工智能底座,大幅降低了开发和应用门槛,真正发挥大模型驱动人工智能规模化应用的产业价值。 文心大模型已迭代到了ERNIE 3.0,每天接受数十亿用户的搜索请求和其他百度移动生态app的训练。百度以文心通用大模型为基础,和各行各业的合作伙伴一起共建行业大模型,从行业及企业的特有数据和知识中,融合学习,提升大模型对行业应用的适配性。 截至目前,文心行业大模型已经达到11个,覆盖能源电力、金融、航天、传媒、影视、汽车、城市管理、燃气、保险、电子制造和社科等多个领域,在产业化落地的过程中使大模型真正赋能千行百业。 在我看来,在全球新一轮人工智能技术的普惠化、创造性应用的大潮中,着眼于芯片和算力的企业具备“硬实力”,着眼于算法和模型的企业具备“软实力”,着眼于垂直场景应用创新的企业具备“巧实力”,而全栈技术能力强、底层核心技术过硬,并能将技术广泛赋能于个人、产业、城市、交通以及社会方方面面的企业,则具备“元实力”。 中国经济需要硬实力,软实力,巧实力,更需要元实力。 天地成于元气,万物之生皆禀元气。“元实力”的积累,需要长期的积累。...
文心一言,不止调戏
文心一言

文心一言,不止调戏

距离我上次发文提及「文心一言」已过去五个月了,它们终于闯关成功对公众开放服务。值得一提的是,它是国内首批拿到「牌照」的大模型,并率先面向全社会开放体验,今天在社交网络上能频繁看到用户分享的心得体会。 尽管在正式发布之前,人们可以通过申请内测的方式体验相关功能,但当 APP获准上架后,方能得以窥见百度对 AIGC 产品方向的全局思考。 「文心一言」APP 界面设计采用了流行的「三列式」,版块分别为:对话、社区与发现。 这对用惯了小红书、抖音的互联网基本盘用户而言,操作认知度方面足够友好,使用习惯上会有顺滑迁移的过程。 而且经过观察,网友最频繁使用的也是「文心一言」的对话功能,刁难它,看它出糗似乎成了保留曲目。「对话」是大众感知 AI 能力的第一步,任何大模型都如此。 「社区」这个版块的设计,我能猜想到百度的「野心」所在。 目前阶段,它提供的是——用户可将自己与「文心一言」互动生成的内容一键分享到社区,启发更多用户进行同类话题的讨论。 而当这些内容聚合到社区里,用户若想表达「态度」,只有一个点赞键,并无留言互动功能。 看起来「社区」更像是一个产品启动阶段,「用户教育」功能的延伸而已。就像,当你首次触及「文心一言」APP时,它们对于「提示词」的反复强调。 没错,这个阶段的「文心一言」似乎将用户默认到一个刚迈入 AI 丛林的探索者,让他们会玩是首要的破冰使命。 可以想象的是,或许未来用户可以在「社区」里自由发布 AI 创作的内容,关于音乐的、绘画的、时尚设计的……互动功能亦全面开放,那么它就可以变成  AIGC 类小红书,成为国内首个该领域 UGC 聚合类社区。 当然,实现这一点,最难的关卡当然是管理部门的合规审查,我不知道这条路会有多远哦。 OK,我们再聊聊产品的最后一列——发现。 所谓「发现」,在我看来就是生产力工具的聚合页。 我始终说的是,「对话」是碳基人使用 AI 最浅表的动作,你得让它做牛做马干活、君逸而臣劳才是终极归宿。 「发现」页里有短视频脚本生成、PPT大纲生成、知乎回答生成等模块化的功能,它有望成为人们工作上的最强辅助,也理当成为「文心一言」APP里最能产出社会价值的版块。未来这里甚至可以成为一个 AI应用商店,做成开放平台,链接生态伙伴。 由于我下载体验的时间也不长,无法提供更多功能上的测评意见。 持中作评的话,百度先于过去的百度比,「文心一言」APP 的设计在我这边打破了以往对百度用户侧产品设计的刻板印象,目的性、功能性、简洁性都有很大的提升。 意义上,考虑到还有更多垂直赛道的大模型相继问世,百度作为用户群更为庞大的品牌,它推出的「文心一言」APP 大概率会成为中国绝大多数民众第一次使用的AI类产品,用户侧认知及体验上的突破是它目前能给予的最大贡献。尽管可能在舆论上  ChatGPT  的声浪及美誉度更高,但我们讨论大多数在地用户无法体验的产品,似乎意义也不大。 过去讲,要想富先修路,又常听一句话——完成比完美更重要。「文心一言」APP发布更像是宣布一个赛道正式开启了,流程上跑通,政策上放行,千模万型,直面用户的检验吧,究竟谁更适合中国宝宝体质呢? 思考题:请冷静客观的随便说说吧? 你还可以看: 小红书「涉黄」,还有这种「好事」? 京东露出羊毛
Untitled
文心一言

Untitled

#文心一格##百度回应文心一言文生图功能# 最近,热心网友们利用文心一言的绘画功能,创作出了无数稀奇古怪的作品。并以此为依据认为文心一言对中文的理解力非常差,甚至要翻译成英文之后才能创作。 笔者也去亲身实验了一下。 手头没有文心一言的账号,因此我直接使用文心一格的AI作画功能。 也许是在不停的改进吧,其实文心一言对中文的识别还是很强的。但是对于数字和字母的识别反而成问题了。尤其是对于“画一架J20”之类的中英文混合的请求,文心一言直接表示看不懂。 笔者试验了网友们广泛测试的创作菜品的创作。发现网友们之所以弄出各种各样稀奇古怪的菜肴,其实怪不到文心一言的头上,而是作画风格的问题。 需要说明的是,如果从文心一言进入,是对话模式,所以如果不提要求,是只能使用默认模式的,所以才会出现这些风格的画作。 而从文心一格进入,则提供了较为丰富的创作风格选择。进入文心一格。选择自定义,就会出现4个AI画师,可以自由选择画出不同风格的画面。 笔者试着选择不同风格画了几个菜品。 比如鱼香肉丝,如果选择“创意 发挥艺术想象”,画出来就是这个样子,很惊艳把,但是看起来很诡异的画风。 如果选择“具象,擅长精细刻画”,画出来就是这个样子,这个就已经很像了。 “创意 发挥艺术想象”风格的烤乳猪: “具象,擅长精细刻画”风格的烤乳猪: “创意 发挥艺术想象”风格的四喜丸子: “具象,擅长精细刻画”风格的四喜丸子: “创意 发挥艺术想象”风格的烤全羊: “具象,擅长精细刻画”风格的烤全羊: “创意 发挥艺术想象”风格的红烧黄河鲤鱼: “具象,擅长精细刻画”风格的红烧黄河鲤鱼: 尤其是这个黄河鲤鱼,画的可谓是中规中矩吧?#文心一言#