最新推荐最新文章推荐展示,精彩尽在咫尺

AI变革的关键一步:文心一言3.5落地实践
文心一言

AI变革的关键一步:文心一言3.5落地实践

人工智能,作为全球科技发展的关键矛头和各国竞相制定的新一代战略性新兴技术,正处于风口浪尖。其中,人工智能产业创新人才的竞争力已经逐渐成为衡量一个国家人工智能产业发展水平的关键指标。在我国,人工智能产业人才的需求日益增长,人才竞争力的提升也在不断加速。 近日,中国信息通信研究院发布了《中国人工智能产业创新人才竞争力报告(2023年)》。《报告》具有三大亮点,一是从专利视角提出了产业创新人才竞争力模型,深入挖掘专利的大数据信息,根据人工智能人才团队创新成果规模、团队成长性、创新能力、技术影响力、市场影响力、知识产权保护和团队规模等多个维度进行评价。二是基于一个模型客观评估不同地域、不同创新主体的创新能力。三是深入企业研发团队进行分析。 从《报告》中我们得知专利产出被视为衡量产业人才竞争力的重要指标。《报告》利用全球公开专利数据库的数据,选取了近十年和近三年的专利申请量及发明专利授权量数据进行深入挖掘,并通过加权计算得出最终的竞争力分数。 在各个公司中,百度以高达85.5分的分数,占据了产业人才竞争力的领先地位。百度在近十年间的人工智能发明专利分布国家/地区29个,AI全球申请专利2.4万,AI中国专利申请1.8万。在申请国际同族专利数量和专利权利保护范围方面,百度的团队发明专利均处于高位。 百度专利事务部总经理崔玲玲介绍道,自2010年以来,百度全面布局了人工智能领域,是全球为数不多的全栈布局的人工智能公司之一。从昆仑芯片、飞桨深度学习平台、文心大模型,到人工智能应用,百度在AI四层技术栈的各个层面都有深入布局。其中,飞桨深度学习平台位于框架层,能够向上支撑大模型的生产,提高模型部署的效率和灵活性,同时向下适配各类硬件,提高硬件适配的效率和降低成本。 今年3月,百度推出了大模型产品“文心一言”。到6月份,百度的CEO李彦宏宣布,百度的文心大模型已经升级到了3.5版本,这不仅仅是技术的升级,也是安全性的升级。他强调,“在数据质量、生成效果和内容安全性上,都得到了明显的提升。” 百度AI技术生态总经理马艳军指出,文心大模型3.5版本在效果、功能、性能上全面提升,实现了基础模型的升级、精调技术创新、知识点增强、逻辑推理增强等。模型效果提升了50%,训练速度提升了2倍,推理速度提升了30倍。马艳军透露,文心大模型3.5在基础模型训练上采用了飞桨最先进的自适应混合并行训练技马艳军透露,百度文心大模型已经应用在百度在线咨询、百度文库、百度问答以及百度对话系统等场景,效果卓越。目前,百度文心大模型已经准备就绪,正在对接百行百业,广泛应用在各个行业,发挥出巨大的商业价值。 在人工智能领域,大模型已经成为了一个重要的趋势,许多知名的科技公司都在积极地开发和应用这种先进的技术。除了百度的文心一言,全球范围内还有诸多公司如谷歌、OpenAI、Facebook等都在这个领域有着深入的研究。谷歌推出的BERT模型、T5模型,OpenAI的GPT系列模型,Facebook的BART模型等都代表了大模型技术的最新进展。 然而,百度文心一言模型在这个领域的地位十分显著。其以自身对中文的深度理解,强大的语义理解能力和广泛的应用场景,展示了中国在大模型领域的强大实力。 随着文心大模型的不断发展,中国将在人工智能领域取得更大的突破,以更高的科技水平,推动中国的高质量发展。这种发展,将更好地提升我国在全球经济版图中的地位,为实现科技自立自强的战略目标打下坚实的基础。
中兴服务器支持百度“文心一言”,助力AI产业发展
文心一言

中兴服务器支持百度“文心一言”,助力AI产业发展

前段时间,中兴和百度正式对外宣布中兴服务器将会支持百度“文心一言”,为其提供更加强劲的算力支撑,从而加速“文心一言”的完事升级与更新迭代,助力AI产业化应用和生态的繁荣发展。 “文心一言”是百度基于文心大模型技术推出的生成式AI产品,直至现在,百度已经在人工智能领域深耕十多年,已经拥有了产业级知识增强文心大模型,具备跨模态、跨语言的深度语义理解与生成能力,而“文心一言”将通过百度智能云对外提供服务,为产业带来AI普惠。 中兴与百度双方合作广泛,而在服务器产品领域中兴服务器产品全面满足百度定制化要求,目前已规模应用于百度智能云,充分满足百度智能云不同业务场景差异化配置需求、资源分配和上云服务。 针对百度智能云AI、深度学习的需求,中兴服务器产品采用了高密度、模块化、精细化设计,具有高性能、高可靠、易扩展、易管理等优势,在AI、云计算、大数据、NFV等领域均有出色表现,适用于百度大脑、飞桨深度学习平台。 同时中兴最新发布的G5系列服务器产品,还具备高密度算力、灵活扩展、异构算力、海量存储、稳定可靠等特性,采用最新的英特尔®至强®第四代可扩展处理器,双路最大支持120核,AI性能提升10倍,能够提供强大的算力支持。 未来,中兴将会继续通过中兴服务器及存储产品提供的智慧算力筑路数字经济,致力打造出更高品质的产品,构建强劲有力的算力基础设施,为百度提供更多的支持,并且亦会携手百度在产品定制化研发、AI产业化应用等方面继续努力,连接通往AI新时代的道路,加速推动数字经济的繁荣发展。
用ChatGPT和文心一言写诗歌,差距一目了然,我差点就吐了
文心一言

用ChatGPT和文心一言写诗歌,差距一目了然,我差点就吐了

首先是文心一言 我今天喝了奶茶。写一段诗歌 奶茶一杯,心情倍儿爽, 甜味香浓,思绪飞扬。 入口滑润,奶香浓郁, 与好友共享,快乐无限。 茶香悠然,世界美好, 每一口都是幸福的味道。 心情愉悦,烦恼忘掉, 奶茶的魅力,无法抵挡。 香甜滋味,留在心间, 仿佛拥有了无限力量。 奶茶在手,快乐我有, 与朋友共度,更加欢畅。 接下来,是ChatGPT 我今天喝了奶茶。写一段诗歌 在这个指尖舞动的时代, 我今天品味了一杯奶茶的芬芳。 馥郁的香气逸散开来, 轻柔的口感滋养心房。 白茶与牛奶的相遇, 交织出奶茶独特的韵味。 悠然的茶香缭绕空气, 温暖的滋味沁入灵魂。 世界似乎停滞了片刻, 只留下我与奶茶相伴。 品味着每一滴润泽, 在味蕾间流淌的温暖。 奶茶,是生活中的一道风景, 是我静坐时的知己。 喝一口,暖心又满足, 仿佛一切困扰都舒缓。 时光如奶茶般美好, 绵长而又温情流转。 让我珍惜每一次邂逅, 在喧嚣中找到宁静安宁的瞬间。 再换一种提问,还是用文心一言开始 我今天偷拿了老婆的私房钱,300块坐了一趟动车,经过广西桂林,窗外面的景色太美了。写一首诗歌 偷拿私房钱, 坐上动车, 经过广西桂林, 欣赏窗外面的景色。 偷拿私房钱, 坐动车前往桂林。 文心一言好像不太聪明的样子 接着换ChatGPT...
我在文心一言App的内测版中,与「马斯克」和「甄嬛」聊天|最前线
文心一言

我在文心一言App的内测版中,与「马斯克」和「甄嬛」聊天|最前线

文心一言App的125个AI细分功能落在定制角色社交、营销文案/视频生成、点评生成等垂直场景。 文|周鑫雨 编辑|邓咏仪 来源|智能涌现(ID:AIEmergence) 封面来源|视觉中国 近日,文心一言低调上线了App Store内测,App下载量已经爬上了IOS系统免费App下载榜的第二位。 2023年3月16日上线内测的文心一言网页版,提供的是类似ChatGPT的多轮对话能力。而近期上线的App版本,更像是AIGC功能的“大杂烩”——125个细分应用落到了AI绘画、AI定制角色社交、PPT制作、代码写作、脚本生成等场景中。 3月16日上线内测的文心一言网页版。图源:作者截图 近日上线的文心一言App内测版。图源:作者截图 从功能而言,文心一言App分成“对话”和“发现”两个板块。“对话”保留了网页版的多轮对话功能,而“发现”则是针对不同的应用场景所开发的AIGC新功能。 百度方告诉36氪,文心一言App还在小范围内测中,此次上架IOS系统国区App Store,是为了针对用户反馈对新旧功能进行优化。 迭代旧的:对话能力有所升级 网页版内测之初,文心一言虽然能根据提示词完成基本的文案写作、角色扮演式回答,但在对常识性问题、逻辑推理问题的理解上依然存在较大的短板。 比如询问“香蕉的平方根是什么?”,文心一言本该指出这一问题的不合理性,但其仍然试图得出数学答案:  3月文心一言网页版得出的错误解答。图源:作者测试3月文心一言网页版得出的错误解答。图源:作者测试 而此次,针对常识性问题,文心一言App的理解能力已经有所提高。 文心一言App对上述问题已经能做出合理的解答。图源:作者测试 2023年5月25日举办的百度万象大会上,百度将文心一言的对话入口搬进了百度App,这也标志着文心一言的联网。而独立内测的文心一言App,依然能给出最新的信息。 文心一言App给出的关于近期百度热搜的回答符合2023年7月4日的热点。图源:作者测试 测试同日百度App的热搜榜,与文心一言App回答一致。图源:作者截图 不过,所谓的“联网”,值得是文心一言与百度搜索数据的互联。对其余平台的消息,文心一言目前没有数据权限。 关于微博热搜,文心一言App的数据库更新到2023年2月12日。图源:作者测试 试水新的:AIGC大杂烩,收集反馈 打开“发现”板块,最直观的感受是:百度什么都想做。 在“角色”“创作”“点评”等11个垂直应用场景中,文心一言上线了125个细分功能,涵盖了目前AIGC领域最为主流的玩法。 比如Replika、Character.AI主打的AI角色定制社交,文心一言给出了更适合中国人口味的玩法,上线了“甄嬛小传对话篇”“孔夫子评图”等角色聊天功能。当然,近期处在舆论风口浪尖的马斯克也在其中,不过,对话对人物特质的展现还存在局限性。 文心一言App上线的角色定制功能。图源:作者截图 除了开头的“本宫”,文心一言不演了。图源:作者测试 而办公Copilot,也出现在了文心一言的新功能中。比如“PPT大纲生成”“日报生成”“SWOT分析”等。 文心一言App的PPT大纲生成功能。图源:作者测试 针对细分的用户情感需求,文心一言App推出了“约会指导”“高情商回复”等功能。 文心一言App针对尴尬情景给出的“高情商回复”,问题源自网络。图源:作者测试 文心一言App释出如此多的AI功能,最首要的或许是收集互动数据和用户反馈,对模型能力进行优化迭代。与此同时,这或许也是一次小型的AIGC市场反应试水。 36氪旗下AI公众号 👇🏻 真诚推荐你关注 👇🏻 来个“分享、点赞、在看”👇 我在文心一言App内测版中聊天
文心一言,可以用了
文心一言

文心一言,可以用了

标签:ChatGPT,文心一言 大约在10天前,我在手机上下载了文心一言App,也进行了使用申请,然而一直都没什么消息,就在我以为还要继续排队时,今天下午收到了可以使用的短信。 于是,我连忙打开文心一言App,结果就是下面这个样子。 当然是接受邀请了,结果如下面。 我问了一个简单的问题,即求单元格区域之和的公式,结果如下。可以看出,对于这样简单的公式,文心一言还是做得非常好的。 继续进行试验! 我又输入了一段稍微复杂的话,这次是想让文心一言帮我找到一个用于查找数值的公式,结果如下,想不到还是比较符合我的需要,且有详细的解释,唯一不足的是它把单元格区域中的行号没写上。 我又要求它列出Excel中的数学函数,它给我列出了9个函数,并有详细的解释,结果如下所示。看来,利用文心一言还可以学习Excel函数。 最后,让文心一言讲个冷笑话放松一下。似乎不太好笑! 有使用过文心一言的朋友吗?欢迎分享使用经验。
“文心一言”测试申请通过,常识测试完胜“通义千问”
文心一言

“文心一言”测试申请通过,常识测试完胜“通义千问”

经历了漫长的等待,终于通过了“文心一言”的内测申请,用两个同样的问题分别测试了“文心一言”和“通义千问”,主要结论: 1 常识测试方面,“文心一言”完胜“通义千问”。测试问题是“复旦大学的校长是谁”,“文心一言”回答准确,“通义千问”的答案是之前的老校长。“通义千问”有一个联网按钮,用上了回答依然错误。 “文心一言”常识测试 “通义千问”常识测试 2 “文心一言”集成了画图功能,“通义千问”没用整合作图功能 ,但是阿里有一款专门作图的应用“通义万相”,目前我还没用申请测试。 “文心一言”画图测试 “通义千问”画图测试
“文心一言”未至先火,大语言模型加持将开启百度发展新纪元
文心一言

“文心一言”未至先火,大语言模型加持将开启百度发展新纪元

近期,随着ChatGPT爆火出圈,百度的语言大模型“文心一言”也未至先火,引发了全社会的广泛关注。目前“文心一言”还在内测,要到三月份才能面向公众开放,但有关“文心一言”的资讯却屡次登上热搜。包括新闻、金融、互联网、制造业等数百家行业头部企业机构纷纷宣布加入百度“文心一言”生态。中国工程院院士邬贺铨更是直接表达了对“文心一言”的肯定与期望:“基于百度对中国文化的感悟和对中国市场的理解,相信能够做出不逊于国外公司的AI(人工智能)应用。”2月22日,百度(NASDAQ:BIDU,HKEX: 9888)发布了2022年四季度及全年财报。财报显示,2022年,百度实现营收1236.75亿元,归属百度的净利润(非美国通用会计准则)206.8亿元,同比增长10%。而在财报发布前,多家机构对百度2022年业绩都给出稳中向好的判断,并认为“文心一言”将给百度带来新增长空间。其中海外机构Seeking Alpha分析师表示,百度当前被低估了40%:“自2016年战略聚焦人工智能以来,百度一直走在中国人工智能技术发展的前沿。人工智能技术将有利于百度的智能云和搜索业务,同时让第三方应用程序受益。对百度的目标价约为209美元,较当前水平上涨 40%。”“2022年是充满挑战的一年,百度利用这段时间为迎接更好的时代做好了准备。对于2023年,百度核心收入恢复加速增长的道路已经明确,我们将充分把握中国经济复苏带来的机会。”百度创始人、董事长兼首席执行官李彦宏表示,“凭借在AI领域的长期投入,百度将抓住即将到来的AI拐点,为我们的整个业务组合——从移动生态到智能云、自动驾驶、智能硬件等——开拓全新的机遇。”百度已在NLP领域深耕十余年“文心一言”之所以能够博得领军企业、业界专家甚至投资机构的青睐,离不开百度对自然语言处理(NLP)、大语言模型的布局和探索。以搜索引擎起家的百度,或是国内最早接触NLP的互联网企业,因为NLP技术本身就是搜索技术的重要组成部分。用户从“百度一下”得到的搜索反馈,都包含着NLP技术对搜索的理解与优化,NLP伴随着百度快速发展,也在同步甚至更快地发展壮大。2010年初,百度对NLP的工作进行了重新梳理与规划,百度自然语言处理部正式成立,并不断在语音、图片等技术上布局,敲定了在知识图谱技术上长期投入的战略。2021年4月,百度创始人、董事长兼CEO李彦宏在接受媒体采访时预判道:“未来,自然语言理解会成为主角,当机器可以真正理解人们在说什么的时候,一大批应用就会应运而生,而且会比现在的应用更加流行。”同年9月,百度发布了PLATO-XL,这是全球首个百亿参数的对话大模型,也是全球首个百亿参数中英文对话预训练生成模型,再次刷新了开放域对话效果,打开了对话模型的想象空间。攀登技术的高峰,需要资本加持。刚刚发布的2022年财报显示,百度去年的研发投入达到了214.16亿元人民币,占百度核心收入比例达22.4%。回顾过去10年,百度的研发投入超过了1400亿元,并且几乎每一年的同比增长都超过100%。“文心一言”在中国乃至全球范围均具有综合优势数以千亿计的投入,奠定了百度在NLP开发的基础优势,“AI的三要素包括算力、算法和数据,我们认为百度在这三项上拥有领先优势。百度在芯片层、框架层、模型层和应用层进行全方位布局。”中金互联网行业首席分析师白洋称,百度同时具备人工智能需要的算力、算法和数据,开发“文心一言”在中国乃至全球范围均具有综合优势。在算法方面,百度的文心大模型和Open AI的GPT模型类似,在2019年就已经推出,并且已经迭代了多代。从单一的自然语言理解延伸到多模态,包括视觉、文档、文图、语音等多模态多功能,因此“文心一言”所基于的ERNIE系列模型也已经具备较强的泛化能力和性能。在算力方面, 百度自研AI芯片“昆仑”已在多场景实际部署几万片,在搜索业务中也已形成较强工程化实践,因此,“文心一言”底层算力有所保证。此外,百度也拥有多个云计算可用区、庞大的超算集群,奠定大模型训练的基础设施。目前百度拥有阳泉、徐水、定兴三个云计算中心,其中,阳泉智能云数据中心仅一期就可承载16万台服务器,预计整个百度阳泉云计算中心可承载24万台服务器,能为语音大模型应用提供高并发、高弹性、高精度等不同计算需求。数据层面,ChatGPT模型训练使用主要来自互联网的文本数据库,包括从网络文本、维基百科、文章中获得高达 570GB的数据,百度的搜索业务在真实数据和用户需求理解方面的积累有较强的先发优势,这些大规模结构化非结构化数据有望支撑ERNIE bot的充分预训练。“文心一言”作为本土化的大模型,相比于国外模型在中文领域也更有优势。当前已有很多头部企业宣布加入“文心一言”生态圈,对此,北京社科院研究员王鹏在接受媒体采访时表示,对百度来说,与众多上市公司合作能够有更多的数据积累进行训练,另外,可以有更多的场景,进行更多垂直化、专业化的开发。同时还能为未来产品商业化运作提供更多经验。对于这些接入的行业和企业来说,王鹏认为,他们本身对于新技术,以及信息的精准性、交互性有非常强的需求,且都是高频领域,所以双方的合作可以说是强强联合。未来推广之后,对于传统行业提质降本增效都有影响,会有更多行业从中受益。NLP将变革云市场游戏规则,选云主要看AI能力不久前,微软已宣布将OpenAI整合进微软云服务中,接入微软旗下的搜索引擎必应(Bing),还将整合OpenAI的技术以改进Office应用。随后,百度也表示会将“文心一言”通过百度智能云提供给企业和机构客户。AI原生时代正在加速到来,所有用户、企业都被席卷其中。其对云计算的需求,也将更多体现于对智能化的需求,AI大模型将成为云服务中不可或缺的一部分。早期就选择在智能云方向深耕的百度,先一步拿下了通向未来的船票。去年底,百度提出了“AI大底座”,旨在标准化地输出智能化的底层能力,把芯片、大模型、深度学习框架等高门槛的技术,变成像水电一样供客户按需取用。NLP与云业务密不可分,也必将变革云市场的游戏规则。百度在NLP领域占据的优势也会帮助百度智能云赢下更多的市场空间。Gartner杰出分析师、研究员Rajesh Kandaswamy分析称:“我认为AI从根本上变革了计算,可能比云计算的威力更大。”摩根士丹利认为,百度推出“文心一言”与公司的云业务战略方针步伐相同,可达到云业务中长期增长,并领跑行业。在发给百度全员的财报信中,李彦宏表示:“人类进入人工智能时代,IT技术的技术栈发生了根本性的变化。过去基本分为三层:芯片层,操作系统层和应用层。现在可以分为四层:芯片层、框架层、模型层和应用层。”“‘文心一言’的能力将通过百度智能云率先在内容和信息相关的行业和场景落地。”百度集团执行副总裁、百度智能云事业群总裁沈抖表示,“文心一言”是基于百度智能云技术打造出来的大模型,它将根本性地改变云市场的游戏规则,云服务将从数字时代跃迁到智能时代。“文心一言”赋能,或将开启百度发展新纪元“文心一言”加速落地,或将成为人工智能发展史上的里程碑与分水岭。“文心一言”背后的大型语言模型是一项面向未来的先进生产力,让世界看到人工智能技术进化、迭代远高于人类、生物体的速度。可以预见,拥有强大学习和分析能力的Al在很多领域会迅速超过人。而加入基于人类反馈的强化学习训练而成的“文心一言”,也正带来弱人工智能向通用智能的阶跃,或许,实现跨领域的通用人工智能已为期不远。目前,“文心一言”最主要的应用领域是搜索。搜索会通过嵌入“文心一言”进行技术升级,实现搜索代际变革。“百度一下”将呈现更好的搜索和答案,全新的交互和聊天体现,以及独特的生成内容,吸引更多的用户,由此创造出下一代互联网新的流量入口,并显著扩大搜索的服务场景和市场规模。同时它也将帮助平台上的广告商、内容创作者和商家。此外,“文心一言”将通过百度智能云提供服务,会吸引大量企业和机构客户使用百度智能云提供的API和基础设施,搭建AI模型、开发应用,并显著提高生产力,为产业带来AI普惠。云服务从数字时代跃迁到智能时代,智能化对各行各业效率的提升将显著显现。基于“文心一言”带来的变革,有分析称,当下应重新评估和认识(re-read)百度。近期,机构投资者看好百度,包括摩根大通、瑞银集团、美银证券等券商评级均为买入,并认为百度新财年或将实现新飞跃。摩根士丹利预计百度全年将继续保持高于行业的增长,亏损大幅收窄。老虎国际则对百度长期投资论点(云和人工智能推动收入加速)保持不变,认为市场正围绕复苏的方向进行交易,这应该会持续到3月初。麦格理则预计,百度今年广告及云服务收入增长将会有所回升,受惠于有效的成本控制措施,整体利润率提高,而“文心一言”等人工智能(AI)聊天机器人或将成为可见的上行惊喜机会。
“文心一言”背后,藏着中国科技向上突破的关键秘密
文心一言

“文心一言”背后,藏着中国科技向上突破的关键秘密

 ► 文  辟疆 百度“文心一言”终于在3月16日邀请测试。与此前爆火的ChatGPT相比,中国大模型提供了不少亮点。“文心一言”一步到位,首发版本就具备多模态功能——同时支持文本、图片、音频,未来还将支持视频的生成,可以对标OpenAI最新发布的GPT-4版本。 从新闻发布会信息来看,“文心一言”显然是中国目前为止、也可能是未来相当一段时间内最好的大语言模型,势必带来百度的价值重估。这种重估并不简单取决于“文心一言”眼下的能力。毕竟AI大模型还处在成长过程之中,哪怕已经展现出让人惊叹的能力,也难以避免一些“一本正经的胡说八道”。OpenAI也坦言,GPT-4仍然会产生幻觉、生成错误答案,并出现推理错误。事实上,“文心一言”最大的意义,在于其诞生本身。为什么中文版“类GPT”模型首先诞生于百度?这可能是一个决定未来数十年中美科技竞争格局的问题,是一个远比“文心一言”更重要的问题。我们还可以提出一个类似的问题:为什么ChatGPT出自微软旗下的OpenAI,而谷歌、Meta的类似模型却相继“翻车”?数据、算法和算力,是支撑AI技术的三要素,而对于大模型的讨论中,最令人印象深刻的无疑是其庞大的算力需求。算力换一个说法,就是“烧钱”。 机器学习领域最先进的英伟达A100显卡,每张售价超过1万美元。市场调查机构TrendForce最新报告显示,ChatGPT的运行需要使用30000块A100显卡,总成本高达3亿美元。这还只是显卡的价格,整个算力中心的建设更是一笔巨资。资料显示,ChatGPT的总算力消耗约3640PF-days(即每秒一千万亿次计算,运行 3640 天)。作为对比,中国近期规划的一座500P算力的数据中心,总投资达到30亿元人民币。AI大模型离不开“钞能力”的支持。去年一年,OpenAI预计亏损5.44亿美元,今年有消息称,微软还将向OpenAI投资100亿美元。不过微软对OpenAI的真实投入并没有这么高,因为OpenAI租用的算力,来自微软自家的云服务Azure,部分运算费用会回流到微软。美国投行Jefferies的研究报告也指出,微软“认为 AI 创新推动了 Azure AI 服务的增长”。换句话说,同时拥有OpenAI的算法、以及Azure云服务器的微软,通过垂直一体化大大节省了成本,同谷歌等对手相比自然具有了优势。百度则是比微软更加垂直一体化的企业。百度从十几年前就大力投入AI研发,而且是全球为数不多进行全栈布局的人工智能公司。 AI技术架构分为芯片层、框架层、模型层和应用层,分别对应百度的高端芯片昆仑芯、飞桨深度学习框架、文心预训练大模型,以及最为人熟知的搜索引擎。在整个AI垂直体系中,百度都有领先业界的关键自研技术。在国内众多云服务厂商中,百度也率先整合AI能力。去年12月27日,百度智能云发布国内首个全栈自研的AI基础设施“AI大底座”,并全面升级25项产品和技术。IDC《2022 H1中国AI云服务市场研究报告》报告显示,2022上半年,百度在AI公有云服务市场份额占比28.1%,已连续四年市场份额第一。截至目前,百度已经拥有阳泉、徐水、定兴三个云计算中心,其中,阳泉智能云数据中心仅一期就可承载16万台服务器,预计整个百度阳泉云计算中心可承载24万台服务器。百度自研AI芯片“昆仑”已在多场景实际部署几万片,在公司搜索业务中也已形成较强工程化实践,为“文心”大模型提供了强大的底层算力保证。十年累计研发投入超过 1000 亿元,百度马拉松式的研发正在“文心一言”上开花结果。垂直一体化的产业布局,既证明了百度雄厚的技术实力,更节省了大量中间成本。而在激烈的技术竞争中,成本往往会成为决定性因素。对一家企业如此,对一个国家更是如此。日本经济学家野口悠纪雄,是最初为日本泡沫经济“吹哨”的人。在他看来,垂直一体化与水平分工,这两种产业结构的差异,是工业时代大国兴衰背后的根本原因。在上世纪六七十年代,日本带有浓厚计划色彩的经济体制,催生了不少垂直一体化布局的大企业。在钢铁、化工以及后来的电子产业中,垂直布局让企业可以进行高额的资本开支,从而带动科技创新,帮助日本在这些领域一度超越美国。以电子产业为例,日本一度拥有从光刻机,到芯片制造,再到消费级电子产品的完整产业链,让美国感受到巨大威胁。然而到了90年代之后,世界产业趋势发生逆转,电子行业底层技术基本成型,互联网应用开始兴起,企业竞争的核心,变成谁能做出更迎合消费者的应用级产品。资本开支不再重要,轻资产的美国企业反而能够灵活调整产品策略,获取竞争优势。这也是日本“失去20年”的根本原因。 今天,我们或许站在了历史又一次逆转的前夜。过去十年轻资产、高利润的互联网模式正在失效,AI技术再次带来底层颠覆性创新,庞大的算力成本让科技行业回到重资产时代,垂直一体化的企业正在重新获得优势。百度能够成为中国“大厂”中第一个推出大语言模型的公司,或许正是开启这一趋势的信号之一。如果“文心一言”能够取得成功,百度的内在价值将获得彻底重估。不计成本的研发投入,曾经伤害了百度的财务报表,让资本市场心存怀疑,但这样的逻辑有可能被彻底颠覆。市场将重新认识资本开支的意义。无论对于中国企业,还是对于整个国家产业战略而言,这或许才是“文心一言”带来的最大启示。政府引导下的长期主义产业投资,从来都是中国经济体制的独特优势,在未来数十年中,更有可能成为中美科技竞争中的决胜因素。“文心一言”背后,隐藏的或许是中国科技向上突破的关键秘密。
百度文心一言登录安卓、苹果
文心一言

百度文心一言登录安卓、苹果

安卓: 1、手机浏览器在百度搜索中输入“文心一言” 2、下拉找到“文心一言”APP,下载登录获得资格的百度账号即可使用 苹果: 1、打开应用商店搜索“文心一言” 2、下载登录获得资格的百度账号即可使用
文心一言:中国科技“元实力”的一次喷发
文心一言

文心一言:中国科技“元实力”的一次喷发

· 这是第5096篇原创首发文章  字数 4k+ · · 秦朔 | 文  关注秦朔朋友圈 ID:qspyq2015 · “我们正处在一场新的重大科技革命的序章。” 这是“两会”之后的一个晚上,我在一场科技发展与新型举国体制的夜话中,不止一次听到的判断。 去年11月30日ChatGPT上线,人工智能迎来了iPhone时刻。3月16日下午,百度宣布正式推出基于百度新一代大语言模型的生成式AI产品文心一言(英文名:ERNIE Bot),也就是之前一段时间人们所期待的“中国的ChatGPT”。 当人工智能多年积蓄的力量喷薄而出,无数被其赋能的新物种、新应用的大爆发也就水到渠成。 勇气与厚积薄发的信心 从去年9月通过“健全关键核心技术攻关新型举国体制的意见”,到“两会”宣布重组科学技术部,组建中央科技委员会,科技创新在中国现代化建设全局中的核心地位已毋庸置疑,它既是未来中国经济的关键变量,也是高质量发展的最大增量。 在人工智能这一具有战略性、全局性、辐射带动性的科创高地上,中国将有何新作为? 百度推出文心一言最大的意义,可能不止于技术本身,而在于直面国际科技竞争赛场的格局与勇气,这是一个远比文心一言更重要的问题。 3月5日,科技部部长王志刚在十四届全国人大一次会议首场“部长通道”上说,中国在自然语言处理和理解方面进行了多年的研究,既要通过科学研究、技术牵引,又要通过场景驱动、用户需求,使得人工智能能为中国经济社会发展、为中国科技作出贡献。 他还谈到了ChatGPT,认为ChatGPT要做到算法的实时性和有效性并不容易。“从源头来看是自然语言理解、自然语言处理两个技术,之所以引起关注,在于它是一个大模型,对应大数据、强计算、好算法,原理是这样,就像踢足球都是盘带、射门,但要做到梅西那么好也不容易。” 从底层技术看,文心一言和ChatGPT都采用了SFT(模型微调)、RLHF(强化学习)、prompt(用户指令)等技术。这跟大模型通过海量无标注数据的训练是不同的,还需要人的参与,作用是更好地理解人的意图,生成符合人的价值观、表达习惯的回复。 从演示看,文心一言和ChatGPT相比,在文学创作、商业文案写作、数理逻辑推算等方面的能力是“你有我有大家有”。但在中文理解上,文心一言非常领先,处于独一无二的位置。 这是因为文心一言的训练数据包括万亿级网页数据,数十亿搜索数据和图片数据,百亿级语音日均调用数据,以及5500亿事实的知识图谱。 研究表明,数据规模大,参数达到千亿级,大模型就可能发生“智能涌现”,涌现出知识和逻辑推理能力。而百度不仅数据规模大,数据形态也最贴合回答和生成需求,在百度搜索中问答和生成类的搜索请求占比很高。因此文心一言大模型在自然语言问答和创意内容生成上有着非常突出的表现。 文心一言刚刚发布,就如同ChatGPT刚发布一般,注定有不完美的地方,但当其开始使用后,经由真实的用户反馈、开发者的调用和模型迭代,将飞速成长。 面对世界各个科技巨头躬身入局的大模型赛道,百度是全球第一个对标ChatGPT的互联网大厂,这不仅是一种魄力,更是一种厚积薄发的势能。 我在夜话中认识的一位投资人曾在百度人工智能部门工作多年。我问她怎么看文心一言。她说,Robin(李彦宏)可能是互联网公司创始人中最有技术情怀的,百度在人工智能方面投资最久、最多,人才和技术底子最厚,所以率先推出“中国的ChatGPT”是很自然的事。放在中美科技角逐的背景下,文心一言的推出更显重要,它证明在人工智能的这一关键应用上,中国并未落后。 “就像百度在无人驾驶方面投了几百亿,给今天的很多车企铺了路,其作用就像‘黄埔军校’一样,百度做科技,从来不止是服务于它本身。” “元实力”的一次喷发 从眼下看,对消费者来说,文心一言的价值在于,当它嵌入百度搜索,用户能直接与大语言模型交互,实现搜索体验的升级。对企业来说,则丰富和强化了百度智能云的能力,通过向公众开放大语言模型,可以帮助企业主和创业者在云上构建自己的模型和应用,提高效率、帮助决策和改善客户体验。 接下来,文心一言将与小度进行集成,升级小度的智能设备和服务;也将整合到百度的Apollo智舱系列产品等汽车解决方案中,让智能汽车具备领先的人车交互体验。 事实上,在最近的一个月内,已有超过600家合作伙伴宣布加入文心一言生态,期待尽早用上最新的大语言模型。对他们来说,百度智能云所提供的不仅是存储、带宽、数据库等基本功能,更是包括飞桨和文心大模型等在内的全栈人工智能能力。 这里简单梳理一下百度的人工智能能力体系。 在进入人工智能时代之前,IT技术的技术栈一般分为三层:底层的芯片,中间的操作系统,上层的应用。 进入人工智能时代后,百度的理解是四层:芯片层、框架层、模型层和应用层,并以此展开进行布局,即:芯片层的昆仑芯,2018年发布后已部署了几万片;框架层的“深度学习框架”飞桨,截至2022年底飞桨平台上已凝聚535万开发者,创建了67万个人工智能模型,服务20万家企事业单位;模型层的信息分布大模型、交通大模型、能源大模型等等,以及应用层的搜索、智能信控、电力等等。 这一四层全栈能力体系的好处是,针对一些场景在四层之间有非常多的反馈,从而进行极致优化。比如在搜索场景上,百度的人工智能芯片已经优化了10年,是全球效率最高成本最低的,在搜索场景下可以超过全球优秀的通用芯片。 文心一言位于四层架构中的模型层,它只是AI系统中承上启下的一环,假如脱离整个架构无异于空中楼阁。假如框架层和芯片层不能满足模型的需求,即使模型再好也无法发挥最大效果。 虽然文心一言刚刚推出,但它生在一个充满阳光雨露的强大的生态中,与之相关的基础技术如深度学习、自然语言处理、大模型等百度已沉淀多年。 对于百度的大模型,这里也稍作回顾。 随着数据井喷、算法进步和算力突破,效果好、泛化能力强、通用性强的预训练大模型,开始成为人工智能产业应用的基础底座。2019年,百度推出了文心大模型ERNIE 1.0这一产业级知识增强大模型。通过大模型与深度学习框架的融合发展,百度打造了自主创新的人工智能底座,大幅降低了开发和应用门槛,真正发挥大模型驱动人工智能规模化应用的产业价值。 文心大模型已迭代到了ERNIE 3.0,每天接受数十亿用户的搜索请求和其他百度移动生态app的训练。百度以文心通用大模型为基础,和各行各业的合作伙伴一起共建行业大模型,从行业及企业的特有数据和知识中,融合学习,提升大模型对行业应用的适配性。 截至目前,文心行业大模型已经达到11个,覆盖能源电力、金融、航天、传媒、影视、汽车、城市管理、燃气、保险、电子制造和社科等多个领域,在产业化落地的过程中使大模型真正赋能千行百业。 在我看来,在全球新一轮人工智能技术的普惠化、创造性应用的大潮中,着眼于芯片和算力的企业具备“硬实力”,着眼于算法和模型的企业具备“软实力”,着眼于垂直场景应用创新的企业具备“巧实力”,而全栈技术能力强、底层核心技术过硬,并能将技术广泛赋能于个人、产业、城市、交通以及社会方方面面的企业,则具备“元实力”。 中国经济需要硬实力,软实力,巧实力,更需要元实力。 天地成于元气,万物之生皆禀元气。“元实力”的积累,需要长期的积累。...
新版文心一言实测:一周工作5分钟完成,秒秒钟出广告片!
文心一言

新版文心一言实测:一周工作5分钟完成,秒秒钟出广告片!

金磊 发自 凹非寺量子位 | 公众号 QbitAI 家人们,百度文心一言的插件,现在可以联动着用了—— 只要几十秒,立马给你生成一个专业广告大片! 话不多说,直接先来看一下成品: 00:22 不信? 没关系,我们现在就来手把手地实操演示一下。 首先就是要把要用到的文心一言的相关原生插件“火力全开”: 百度搜索:也就是大家常说的“联网”,可以保证大模型的时效性和准确性(默认开启);说图解画:把图片丢进去,就可以根据它写故事、文案、回答问题等;一镜流影:根据主题词、语句或段落,一键创作生成视频(依托文心跨模态大模型,突破了不同模态之间语义对齐等技术难题,创新融合文本、视觉、语音、跨模态等一系列技术能力)。 然后我们将一张可爱的奶牛照片丢进去: 让文心一言先做一个理解: 从解析的结果上来看,文心一言精准无误地做到了“看图说话”: 一头黑白相间的奶牛,站在蓝天下,正凝视着镜头。它似乎有些好奇或惊讶,又或许在思考着自己的存在和命运。它的耳朵竖立,眼睛炯炯有神,仿佛在寻找什么重要信息。它是一只充满生命力的动物,充满了活力与好奇心,让人不禁想要靠近观察它的世界。 接下来,我们让文心一言帮忙取一个品牌名称: 在给出的品牌名称的风格之上,我们再让文心一言写一段广告语: 最后,只需要求文心一言根据以上内容生成一个视频,“啪的一下”,数十秒时间,广告视频就诞生了! 或许有朋友要说了,职场人拍个广告片,前期可是要做大量的调研工作才能保证视频内容的真实性与精准度。 确实如此,不过现在,借助文心一言多个插件的联动,这项工作也会变得异常轻松容易: 览卷文档:根据给定的文档,可以完成摘要、问答和创作等任务;E 言易图:仅需简单的数据图表需求,或输入待生成图表的数据内容,即可生成可交互图表,已支持7类图表的生成,包括数据图、饼状图、折线图、雷达图、漏斗图、思维导图、散点图。在将文档“喂”给文心一言之后,不论是对内容的总结亦或是对数据的分析,都变成了一句话的事了: 如此一来,原本要消耗数天甚至数周的工作,直接压缩到了几分钟的时间里。 网友们在看到这般效果之后,也是纷纷惊呼“泰酷辣”、“给工作带来了很多帮助”。 为了能够打造更多的插件,文心一言还发布了大模型插件统一开发范式及工具集,邀请第三方为文心一言开发插件。感兴趣的小伙伴可以去尝鲜了(链接见文末)。 (注:除百度搜索外,目前可最多联动3个插件。) 而以文心一言为代表的大语言模型,也意味着跨入了一个新的台阶,正如百度首席技术官王海峰在大会中首次对外所表示的那般: 人工智能具有多种典型能力,理解、生成、逻辑、记忆是其中的核心基础能力。这四项能力越强,越接近通用人工智能,而大语言模型具备了这四项能力,为通用人工智能带来曙光。 升级后的文心大模型,还能做什么? 作为开发者大会,定然是少不了代码场景下的能力升级。 百度集团副总裁吴甜在现场便抛出了一个让很多程序员头疼的问题——接手代码: “前人”留下的代码太难懂、太晦涩了。 现在,程序员们再遇到这样的问题就不用愁了,一个“复制粘贴”的动作,把烦恼统统交给文心一言来解决。 它会逐行地对代码的功能做出解释,并且在结尾处会总结整个代码的作用: 这个函数的功能是计算给定文本中单词的频率,并按照频率对结果进行排序。 若是依旧不是很好理解,也只需让文心一言对代码做一个改写: 当然,我们还可以让它写一个测试用例,并给出运行结果。 至于在代码输出能力,吴甜在现场也演示了生成展示词云的代码,并将它实时运行了出来: 可见文心一言已经具备了很强的代码解释、代码改写、代码注释、代码生成等能力。程序员防秃头,就用文心一言呀。 WAVE SUMMIT大会上百度为开发者提供的福利可不止这个。大模型社区“星河”上线了! 在星河大模型社区,开发者可以获得一体化大模型开发体验。飞桨+文心贯通全开发流程,与开发者持续共创大模型项目和应用。 它的前身其实很多小伙伴都已经比较熟悉了,正是飞桨的AI...
百度文心一言会带来哪些新机会?
文心一言

百度文心一言会带来哪些新机会?

对于大部分创业者和企业来说,新的机会在于基于新的技术平台开发新应用服务。就像移动互联网时代,最成功的商业产品不见得是安卓和iOS,而是基于安卓和iOS开发的微信、淘宝、抖音等各种超级应用 图/视觉中国 文|《财经》记者 刘以秦 顾翎羽   编辑|谢丽容2023年3月16日,百度启动生成式对话产品“文心一言”邀请测试。这是国内第一款对标ChatGPT的生成式对话产品。当天,百度创始人李彦宏说,大家对它的期望值是对标ChatGPT,甚至要对标GPT-4,这个门槛还是很高的。3月16日,百度新闻发布会后,百度港股股价单日跌幅6.4%。3月17日,股价回弹,单日上涨13%。李彦宏在现场接受《财经》记者的采访时表示,内测中“文心一言”并不完美,之所以现在目前这个节点发布邀请测试,主要两大原因:一是去年开始全球人工智能技术发展从过去的判别式AI(数据库比对)转为生成式AI(生成新内容),百度加快研发脚步,近半年市场验证了这个判断;二是更多的机会出现在了生成式AI这些方面,无论是百度内部产品还是合作伙伴都有强烈需求。全球最先在生成式对话领域掀起风浪的是微软投资的美国创业公司OpenAI。该公司在去年12月推出的基于GPT-3.5大模型的ChatGPT火爆全球,3月15日OpenAI进一步推出新升级的GPT-4大模型,相比前一代有了不小的提升;3月17日,微软在发布会上宣布,将GPT-4的能力融入Office系列产品。AI大模型的特点是能够在更宽泛、更大规模的数据上进行训练,效率更高,学习能力更强,但耗费资源更大。ChatGPT火爆后,多家公司宣布也在研发类似产品,百度是目前中国头部科技公司中第一个落地产品的。文心一言基于文心大模型技术。2019年,百度推出文心大模型ERNIE1.0,2022年11月,该模型进化成3.0版本。李彦宏称,文心大模型每天接受数十亿次用户搜索请求,这也为文心一言提供了庞大的数据池。生成式对话产品并非一个全新形态的产品。它的典型同类产品是对话式AI产品,包括各类语音助手、聊天工具等。第三方数据机构IDC数据显示,2022年,对话式AI市场规模达到54.6亿元,市场渗透率已经饱和。但此前的产品并未引入大模型,新一代产品的出现,将重新激活市场。文心一言除了能够生成文字内容,还能生成图片、音频和视频内容,由于成本原因,文心一言的视频生成内容暂未对外开放。无论是ChatGPT还是文心一言,目前都是比较初级的产品,且尚未找到清晰的商业模式,这也是目前行业里最关心的话题。ChatGPT是面向C端用户收费,但依然严重亏损,2022年全年预计亏损5.4亿美元,且用户量越大,亏损越严重。百度目前对文心一言的定位更偏向B端,李彦宏称,文心一言的定位是一个通用的赋能平台,金融、能源、媒体、政务等千行百业,都可以基于这个平台来实现智能化变革,创造商业价值。李彦宏的判断是,生成式AI代表了一个新的技术范式,是一个每家企业都不可以错过的巨大的机会。AI市场即将迎来爆发性的需求增长,其商业价值的释放将是前所未有的、指数级的。据百度官方数据,截至3月17日上午10点,申请文心一言API服务测试的企业已达7.6万家。某中国AI创业公司CEO向《财经》记者评价,中国需要有自己的大模型产品,从算力、数据、人才储备等方面,百度在中国市场优势明显,尽管目前和美国还有差距,但“必须要有勇气走出第一步”。 有差距也有亮点 新闻发布会现场,李彦宏展示了文心一言的5个场景,分别是:文学创作、商业文案创作、数理推算、中文理解、多模态生成。《财经》记者对比文心一言和GPT-4针对同一问题的回答,发现文心一言对于中文的理解,在某些时候是优于GPT-4的,例如当问题是病句或容易造成歧义的表述时,文心一言能够理解提问者的意思,GPT-4的回答会有所偏离。同时,它们都存在“胡说八道”的情况,不过,新版Bing中的GPT-4会附上内容来源链接,便于用户二次确认。文心大模型训练使用的数据以中文为主,因此文心一言能够更好理解中文,甚至能生成不同方言的音频。文心一言也支持英文互动,但效果相对较差,其他语种目前还不支持。此外,文心一言会选择性回答问题,若问题中涉及敏感词,它会说“我无法回答这个问题”。李彦宏提到,整体而言,这类大语言模型还远未到发展完善的阶段,它们有时候会有很惊艳的表现,但不少场景下,细究起来还有明显的问题,进步空间很大。大模型训练成本高昂,需要有大算力、大数据和大模型,每一次训练任务都耗资巨大。百度拥有全栈式AI能力,从芯片(昆仑芯),到深度学习框架(飞桨),再到预训练大模型(文心),到搜索、智能云、自动驾驶、小度等应用,各个层面都有自研技术。李彦宏表示,全栈式布局可以大幅提升效率,显著降低成本。另外,芯片、框架、大模型、和终端应用场景,可以形成一个高效的反馈闭环,帮助大模型不断优化迭代。 新商业机会 马斯克是OpenAI最早的创始人之一,后期退出。今年2月,他在社交平台上公开批评OpenAI“最初是作为一家开源的非营利性公司而创建的,这也是为什么我把它命名为OpenAI,旨在抗衡谷歌,但现在它已经成一家闭源的营利性公司,并由微软控制……这完全不是我的本意”。由于OpenAI选择了封闭,只对接微软全系产品,外界将它类比为苹果的iOS操作系统。百度的文心大模型走的是开源模式,类似于谷歌的安卓操作系统。百度对文心一言的定位是“一个通用的赋能平台”,金融、能源、媒体、政务等行业,都可以基于这个平台来做智能化改造,实现效率提升。除此之外,按照规划,文心一言也将全面嵌入现有业务中,包括搜索、智能音箱、百度智能云、智能驾驶等。在搜索场景中,文心一言可以补充、升级搜索体验,类似目前Bing中集成了GPT-4的体验。搜索引擎能以此形成新的流量入口,获得新的数据。在智能驾驶场景中,可以与百度阿波罗自动驾驶舱、车路协调做融合,提升无人驾驶的可靠性。李彦宏提到,大模型时代将产生三大产业机会:第一类是新型云计算公司。之前企业选择云厂商更多看算力、存储等基础云服务。未来,框架、模型的质量,以及模型、框架、芯片、应用这四层之间的协同能力,会变得更重要。微软已经将ChatGPT的能力融入Azure云服务,多位业内人士提到,这将有助于Azure提高市场份额,也是微软投资OpenAI的商业回报之一。在中国市场,目前百度云的市场份额低于阿里云、华为云和腾讯云。不过,智能云是目前百度增速最快的业务,2022年营收同比增长23%,这一增速也高于另外三家云厂商。文心一言的出现,或许能够帮助百度云拿下更多市场份额。第二类是通过调用大模型能力,为行业提供解决方案的公司。目前文心大模型已经在电力、金融、媒体等领域,发布了10多个行业大模型,在各行各业都可能创造机会。第三类是基于大模型底座开发应用的公司,即应用服务提供商。李彦宏说,“今天,基于文本生成、图像生成、音频生成、视频生成、数字人、3D等场景,已经涌现出很多创业明星公司,他们可能就是未来的新巨头。” 中国AI大模型进展 基于大模型的生成式AI已经成为新一轮市场热点。数据服务商Dealroom报告显示,全球生成式AI企业估值已达480亿美元,在过去2年里翻了6倍。中国投资人和创业者们也已经入局。前美团联合创始人王慧文成立AI公司“光年之外”,多家知名投资机构立即跟进,天使轮估值已经达到2亿美元。一家在几年前就开始做大模型的AI创业公司,一度无人问津,近期该公司创始人告诉《财经》记者,几乎每天都有不少投资机构来询问是否接受融资。目前,中国初创公司中,能够做出真正有影响力产品的还很少。多位投资人表示,短期内能够看到实际应用效果的,可能是抖音、快手这类视频平台。目前,字节跳动和快手均有布局AI大模型和生产式AI。其他头部科技公司中,腾讯、阿里巴巴、华为也在行动。2022年4月,腾讯对外披露“混元”大模型,协同了腾讯预训练研发力量,覆盖NLP(自然语言处理)大模型、 CV(机器视觉)大模型、多模态大模型及多个领域任务模型。2022年9月,阿里巴巴在世界人工智能大会上,发布 “通义”大模型系列,并宣布相关核心模型向全球开发者开源。华为云团队于2021年4月发布“盘古”大模型, 2022年11月,在华为全联接大会2022中国站上,华为云发布盘古大模型的新技术能力,扩展盘古大模型的服务范围,发布盘古气象大模型、盘古矿山大模型、盘古OCR大模型三项新服务。ChatGPT火了之后,中国不少公司都在尝试研发类似产品。但这件事成本极高。OpenAI每年的研发费用高达几十亿美元,GPT-3.5语言大模型包含1750亿个参数,微软为ChatGPT构建了超过1万枚英伟达A100GPU芯片的AI计算集群。GPT-4的参数值在此基础上又大幅提高。谷歌3月6日推出的多模态大模型PalM-E,参数值达到了5620亿。一位长期关注AI的投资人告诉《财经》记者,中国的创业公司从零去做类似产品,非常不划算,也很难追赶进度,应该将重心放在行业应用上。另一位投资人提到,由于监管因素,文心一言为代表的国产替代产品未来才是主流。文心一言的出现,或许能够帮助中国公司更好地理清思路。李彦宏称,对于大部分创业者和企业来说,新的机会在于基于通用大语言模型,抢先开发重要的应用服务。“就像移动互联网时代,最成功的商业产品不见得是安卓和iOS,而是基于安卓和iOS开发的微信、淘宝、抖音等各种超级应用。” 星标我们 了解更多财经独家资讯 责编 | 田洁本文为《财经》杂志原创文章,未经授权不得转载或建立镜像。如需转载,请添加微信:caijing19980418
文心一言,究竟能够替代谁?
文心一言

文心一言,究竟能够替代谁?

原标题:文心一言,究竟能够替代谁? ChatGPT 的快速进化,吸引了全球目光,作为国内最知名的同类型产品,百度的 ” 文心一言 ” 已经拥有最大的产业应用规模。 目前,网络中有诸多对“文心一言”的测试,结果是它在知识问答、语言表达、逻辑推理、常识问答等方面表现比较出色。因此,社会上也有这种AI工具能够替代人工的说法。 作为一直从事传媒行业的人,之前一直没有用“文心一言”,感觉自己好像错失了什么。恰好,朋友要为喜爱的球队助威,拜托我帮忙策划海报,我就下载了文心一言,看它能否给生成比较好看的助威海报。 不过,当我输入“国安VS申花”的信息后,并不能得到想要的海报。感觉涉及到具体品牌的时候,生成的图片多半不太符合需求。于是,我改了需求,想让它画一幅足球少年画像,便得到了这张图片。 说实话,这张图很符合AI气质。 再来看看文心一言的绘画的想象力,输入“九尾狐与黑龙大战”得到下面的图片。 坦白说,非常符合我的预期,双方战斗氛围感拉满! 然后,我要写一个短视频脚本,就用文心一言试了试。说实话,这个需求比较难,因为我想写的是关于汽车行业股权投资的事,但是这个话题涉及的领域知识比较杂,我在需求中没有特别指明方向,所以我得到了一个比较套路化的脚本(模版)。 也就是说,如果我没有给到非常具体的逻辑和核心信息点,AI呈现的可能是比较肤浅的内容。 接下来,我给了文心一言一个比较发散思维的机会,让它为我手中的打火机给出一个Slogan。如果要为这个结果打分的话,在企业品牌传播中,恐怕难以被入选。感觉这部分功能应该在文心一言和具体行业深度结合后,生成的行业大模型给出的结果会更精准且令人满意,这个需要行业使用者的调教,假以时日,应该结果不凡。 除了工作应用之外,我还尝试了一下文心一言对于生活的一些帮助功能。 比如男生想“挽回感情”,我给的假设是对方有了“不轨”,该如何挽回,结果文心一言给了一封长长的“道歉信”,也是很有意思。不过,在现实生活中,就算自己无错,想挽回一段感情,除了道歉,还有什么更好的办法么?反正我没想到。 再来看看,文心一言在角色扮演方面的能力。这个功能对于很多社恐的宅男男女打法寂寞或许能派上用场。最近热播剧《长相思》中的人物相柳很受女生喜欢,于是我提了下面的问题。 其中好几个问题回答都很符合相柳在剧中的口吻,特别是最后对待感情的回答,基本就是电视剧的台词。不得不感叹,文心一言智商在线,信息更新很及时。 再来看一组文心一言扮演傲妞女友生成的对话。 不得不说,这个对话已经非常有说话技巧,估计宅男看到,要禁不住嘴角上翘偷着乐了! 再来体验个实用功能——旅游路线规划。比如输入“北京 通州”,得出下面的结果。感觉还不错,可以做个参考。如果能将通州最近几年新建的绿心公园和环球影城纳入规划就更完美了,估计这个需要网上信息足够丰富。 实际上,百度在人工智能领域拥有产业级知识增强文心大模型ERNIE,有跨模态、跨语言的深度语义理解与生成能力,所以文心一言,也被认为是中国的ChatGPT。 根据百度自己的介绍,文心一言具备了一定的思维能力,能够学会数学推演及逻辑推理等相对复杂任务。也就是说,在锻炼人类逻辑思维的经典题面前,文心一言能理解题意,并有正确的解题思路,并会像学生做题一样,按正确的步骤,一步一步算出正确答案。 当然,上述准确解题的前提是,提出经典问题,并确保数据库内有相应信息。 所以当得到的结果中规中矩的时候可以尝试调整问题角度,这样就能得到不同的答案了,对于文案工作者而言,通过问题的提出得到不同回答,整理之后就是一篇有着不错小标题的文章了。 比如写影评《封神第一部》,输入影片名称可以得到一个中规中矩的影评。但是如果特定的某个角度去进行提问,就能得到不同答案。 最后,我突发奇想,让文心一言识别一张图片。 这是我在南京一个非开放单位拍摄的上世纪30年代的建筑,交给文心一言后,在没有任何提示的情况下,它给出的答案是“南京总统府”,虽然答案不正确(实际是南京体育学院),但其锁定的图片地理位置和建筑年代是很靠谱的。 当然,顺着已有的信息,让文心一言给出一些相关的资料并编纂成文,可以得到相对满意的结果。 根据百度介绍,文心一言 ” 作为百度全新一代知识增强大语言模型,采用一对一的对话式聊天场景,能够与人对话互动,回答问题,协助创作,同时在文学创作、商业文案创作、数理逻辑推算、中文理解、多模态生成等多个应用场景中高效便捷地帮助人们获取信息、知识和灵感。 初步使用下来,对于文心一言,我们可以给出这样几个判断: 1、背靠百度,在中文信息存储和理解方面有一定优势。 2、对于具有标准答案的常规问题,通常能给到参考性强的答案。 3、商业创作(商业设计、商业文案)方面,目前只能按照品类提需求,不支持涉及具体品牌的需求。 4、简单文学与纯粹文学的创作,基本可以支持,但涉及具体领域的深度创作,还有待提升。 因此,文心一言后续能进一步加强融合学习、逻辑性等方面能力的话,将会突破目前更多的商业应用限制,对一些初级创意和内容工作的人力替代性更强。今后可以可以把自己的工作让文心一言先干一遍,然后再此基础上优化,能大大节省时间。 不久前,百度表示文心一言大模型还在继续升级,已经成功上线了五个原生插件,包括百度搜索、览卷文档、E 言易图、说图解画和一镜流影。 如果按照理想的趋势发展,对于文心一言,我们都只需要提供业务需求和少量精调数据,就能在短时间内得到适合的结果。当然,当前的文心一言距离这一理想状态,还有很大的进化空间。返回搜狐,查看更多 责任编辑:
激活生态创新,“文心一言”面向开发者推出三大举措
文心一言

激活生态创新,“文心一言”面向开发者推出三大举措

日前,第九届WAVE SUMMIT深度学习开发者大会在京举办。百度集团副总裁、深度学习技术及应用国家工程研究中心副主任吴甜分享了百度自研大语言模型“文心一言”的最新进展,并重磅发布5个原生插件,面向开发者正式推出AI Studio星河大模型社区、插件机制以及文心大模型“星河”共创生态计划。 吴甜表示,“文心一言”自今年3月发布至今快速成长,熟练掌握的创作体裁超过200个,内容丰富度是发布初期的1.6倍,思维链长度是初期的2.1倍,知识点覆盖达到初期的8.3倍。 ▲百度集团副总裁、深度学习技术及应用国家工程研究中心副主任吴甜/图源 百度 “文心一言”通过插件机制进一步扩展能力。吴甜现场发布并演示了“文心一言”官方上线的5个原生插件:百度搜索、览卷文档(基于文档的交互)、E言易图(数据洞察图表生成)、说图解画(基于图片的交互)、一镜流影(文字转视频)。据介绍,目前在“文心一言”的网页版,可以同时使用3个插件,并通过大模型的能力进行理解、分析及调度,以适应需求场景。 现场演示来看,“文心一言”只需要5分钟就完成了原本大概需要一两周才能完成的工作,从行业调研、品牌分析选择,到产出宣传片,有了AI的辅助,工作效率得以大幅提升。不仅如此,文心一言还具备了超强的代码解释、改写、注释、生成能力。 据介绍,技术能力快步升级的“文心一言”正加快建设生态,推动大模型应用的发展。会上,吴甜重磅发布了“文心一言”面向开发者的三大生态举措,包括大模型社区、大模型插件机制与文心大模型“星河”共创计划。 吴甜透露,中国最大AI社区“飞桨AI Studio”(星河社区)现已凝聚了609万开发项目。伴随大模型的发展,百度正式推出星河大模型社区。目前,星河大模型社区已积累超300个大模型创意应用。 插件机制是拓展大模型能力边界及构建大模型应用生态的重要举措。百度基于“文心一言”的核心技术,为开发者提供低门槛的插件开发工具集(ERNIE Bot SDK),可以支持信息服务类、工具类、基于大语言模型创新类等多类型的插件开发。开发完成后,通过插件接入平台,更好地对接“文心一言”大模型,与应用层生态紧密结合。 “飞桨和文心大模型紧密结合,现在已经凝聚了800万开发者。我们和广泛的硬件伙伴、技术伙伴、数据伙伴一起持续共建生态,围绕最新推出的大模型插件机制,继续共建共创,高效支持千行百业的应用。”吴甜表示,“我们一起抓住大模型时代的机遇。” 上游新闻 杨昕华 编辑:吴嘉雯 责编:刘莹 审核:赵蕾 举报/反馈
智谱ChatGLM3震撼发布:超越想象的AI大模型,引领智能科技革命!
ChatGLM-6B

智谱ChatGLM3震撼发布:超越想象的AI大模型,引领智能科技革命!

原标题:智谱ChatGLM3震撼发布:超越想象的AI大模型,引领智能科技革命! 智谱AI在2023中国计算机大会(CNCC)上推出了全新的ChatGLM3基座大模型及其系列产品。这款最新的模型采用了创新的多阶段增强预训练方法,以实现更加充分的训练效果。 智谱AI的首席执行官张鹏亲自进行了新品发布,并通过实时演示展示了产品的最新功能。据介绍,通过使用更丰富的训练数据和优化的训练方案,ChatGLM3的性能得到了显著提升。与之前的ChatGLM2相比,MMLU提升了36%,CEval提升了33%,GSM8K提升了179%,BBH提升了126%。 此外,ChatGLM3还进行了针对GPT-4V的迭代升级,引入了一些全新的功能。其中包括具备多模态理解能力的CogVLM-看图识语义,在10余个国际标准图文评测数据集上取得了领先水平;代码增强模块Code Interpreter能够根据用户需求生成并执行代码,自动完成数据分析、文件处理等复杂任务;网络搜索增强模块WebGLM-接入搜索增强,能够自动查找互联网上与问题相关的资料,并在回答时提供参考的相关文献或文章链接。ChatGLM3的语义能力和逻辑能力得到了极大的增强。 此外,ChatGLM3还集成了自研的AgentTuning技术,激活了模型的智能代理能力,特别是在智能规划和执行方面,相较于ChatGLM2提升了1000%;同时还实现了对国产大模型的原生支持,包括工具调用、代码执行、游戏、数据库操作、知识图谱搜索与推理、操作系统等复杂场景。 除了以上功能,ChatGLM3还推出了可在手机上部署的端测模型ChatGLM3-1.5B和ChatGLM3-3B,支持多款手机品牌,包括vivo、小米、三星等,甚至支持移动平台上CPU芯片的推理,速度可达20 tokens/s。在精度方面,1.5B和3B模型在公开benchmark上的性能与ChatGLM2-6B模型相当。 通过最新的高效动态推理和显存优化技术,ChatGLM3的推理框架在相同硬件和模型条件下,相较于其他开源实现,如伯克利大学的vLLM和Hugging Face TGI的最新版本,推理速度提升了2-3倍,推理成本降低了一倍,每千tokens的成本仅为0.5分。这使得ChatGLM3成为当前最具竞争力和高效性能的大模型之一。 智谱AI的新一代ChatGLM3基座大模型以其强大的性能和丰富的功能,将为用户提供更加高效、智能的交互体验,并在各个领域展现出巨大的潜力。返回搜狐,查看更多 责任编辑:
适配更多国产芯片 智谱AI推出第三代基座大模型ChatGLM3
ChatGLM-6B

适配更多国产芯片 智谱AI推出第三代基座大模型ChatGLM3

原标题:适配更多国产芯片 智谱AI推出第三代基座大模型ChatGLM3 10月27日消息,智谱AI于2023中国计算机大会(CNCC)上,推出了全自研的第三代基座大模型ChatGLM3及相关系列产品,这也是智谱AI继推出千亿基座的对话模型ChatGLM和ChatGLM2之后的又一次重大突破。 此次推出的ChatGLM3采用了独创的多阶段增强预训练方法,使训练更为充分。评测显示,在44个中英文公开数据集测试中,ChatGLM3在国内同尺寸模型中排名首位。智谱AI CEO张鹏在现场做了新品发布,并实时演示了最新上线的产品功能。 ChatGLM3全新技术升级 更高性能更低成本 通过更丰富的训练数据和更优的训练方案,智谱AI推出的ChatGLM3性能更加强大。与ChatGLM2相比,MMLU提升36%、CEval提升33%、GSM8K提升179% 、BBH提升126%。 同时,ChatGLM3瞄向GPT-4V本次实现了若干全新功能的迭代升级,包括多模态理解能力的CogVLM-看图识语义,在10余个国际标准图文评测数据集上取得SOTA;代码增强模块Code Interpreter根据用户需求生成代码并执行,自动完成数据分析、文件处理等复杂任务;网络搜索增强WebGLM-接入搜索增强,能自动根据问题在互联网上查找相关资料并在回答时提供参考相关文献或文章链接。ChatGLM3的语义能力与逻辑能力得到了极大的增强。 ChatGLM3还集成了自研的AgentTuning技术,激活了模型智能体能力,尤其在智能规划和执行方面,相比于ChatGLM2提升了1000% ;开启了国产大模型原生支持工具调用、代码执行、游戏、数据库操作、知识图谱搜索与推理、操作系统等复杂场景。 此外,ChatGLM3本次推出可手机部署的端测模型ChatGLM3-1.5B和 ChatGLM3-3B,支持包括vivo、小米、三星在内的多款手机以及车载平台,甚至支持移动平台上CPU芯片的推理,速度可达20 tokens/s。精度方面1.5B和3B模型在公开benchmark上与ChatGLM2-6B模型性能接近。 基于最新的高效动态推理和显存优化技术,ChatGLM3当前的推理框架在相同硬件、模型条件下,相较于目前最佳的开源实现,包括伯克利大学推出的 vLLM 以及Hugging Face TGI的最新版本,推理速度提升了2-3倍,推理成本降低一倍,每千tokens仅0.5分,成本最低。 免责声明: 1、本号不对发布的任何信息的可用性、准确性、时效性、有效性或完整性作出声明或保证,并在此声明不承担信息可能产生的任何责任、任何后果。 2、 本号非商业、非营利性,转载的内容并不代表赞同其观点和对其真实性负责,也无意构成任何其他引导。本号不对转载或发布的任何信息存在的不准确或错误,负任何直接或间接责任。 3、本号部分资料、素材、文字、图片等来源于互联网,所有转载都已经注明来源出处。如果您发现有侵犯您的知识产权以及个人合法权益的作品,请与我们取得联系,我们会及时修改或删除。 返回搜狐,查看更多 责任编辑:
清华出品 | 超强AI大模型ChatGLM第3代整合包来了!
ChatGLM-6B

清华出品 | 超强AI大模型ChatGLM第3代整合包来了!

原标题:清华出品 | 超强AI大模型ChatGLM第3代整合包来了! 今天给大家带来一款令人兴奋的AI大模型,它就是清华出品的ChatGLM。 ChatGLM3简介 由清华系创业公司智谱AI推出的ChatGLM,是国内首个全线对标OpenAI产品线的公司。他们近期推出ChatGLM第三代,并且6B版本的大模型直接开源。 官方描述中,ChatGLM3在44个中英文公开数据集测试中排名首位,性能非常强悍。 ChatGLM3离线整合包来了 老规矩,大家自行在本地部署比较麻烦,所以我已经为大家制作好了一款离线整合包了,下载到本地解压即用! 大家下载离线整合包,解压到本地。 ①根据需要,选择不同的启动方式: 一键启动-CPU:适用于几乎任何电脑,但处理速度较慢(Windows 7不支持) 一键启动-GPU:适用于带英伟达独立显卡的电脑,建议2060显卡及以上 一键启动-综合demo:适用于带英伟达独立显卡的电脑 ②双击一键启动程序后,会打开一个命令提示窗口,项目会自动运行。加载成功后,会自动在浏览器打开项目主界面,如果没有自动打开的话,就自行复制以下链接,然后在浏览器打开“ http://127.0.0.1:7860/”。 以下是CPU运行: 以下是GPU运行: 运行成功后,就可以在浏览器看到项目主界面了。我们快速问它几个问题,发现ChatGLM3都能回答得比较快也比较正确。经典的,拿来给孩子辅导作业一点问题没有。🤣 以下是综合demo运行,这是我比较推荐的使用方法,也是官方提供的一个体验方法。综合demo提供了三种使用ChatGLM3模式: Chat:对话模式,该模式下可以与模型进行对话,回答更偏向于日常聊天。先来拿来试试做英语阅读理解题,回答也是一点问题没有。 工具:工具模式,可以通过模型内部自带的工具进行一些操作,比如调用获取天气的工具,然后询问当前某地的天气情况。 代码解释器:该模式下,模型可以在一个 Jupyter 环境中执行代码并获取结果,以完成复杂的任务。 好家伙,有种在本地就可以跑一个ChatGPT的感觉,关键还是免费的!清华毕竟是清华,出品的大模型还是比较强的👍🏻! 注意事项: ①该项目CPU和GPU(仅支持英伟达显卡,10G显存以上为佳)均可运行,但CPU运行较慢(CPU运行比较吃内存,需要16G以上内存)。 ②请确保解压到本地的路径不包含中文,不然可能会引起奇怪的适配问题。 关注并私信回复【ChatGLM3】,免费获得本文资源~返回搜狐,查看更多 责任编辑:
国产大模型ChatGLM3发布:用华为芯片推理速度提升超3倍,多能力对标GPT-4V钛媒体APP2023-10-27 17:28钛媒体APP2023-10-27 17:28
ChatGLM-6B

国产大模型ChatGLM3发布:用华为芯片推理速度提升超3倍,多能力对标GPT-4V钛媒体APP2023-10-27 17:28钛媒体APP2023-10-27 17:28

(图片来源:unsplash) 钛媒体App获悉,10月27日下午举行的中国计算机大会(CNCC2023)一场论坛上,阿里、腾讯投资的人工智能(AI)独角兽公司智谱 AI 正式发布全新自研的第三代基座大模型ChatGLM3系列。 新的ChatGLM3包括ChatGLM3-1.5B(15亿)、3B和6B参数三种,不仅在多模态理解、代码模块、网络搜索等能力上有所提升,而且相对最佳开源模型推理速度提升2-3倍。同时,基于集成自研AgentTuning技术,在智能规划和执行上比ChatGLM-2提升1000%。另外,ChatGLM3还利用华为昇腾生态,使算力推理速度提升3倍以上。 智谱 AI CEO张鹏表示,最新的自研模型ChatGLM3就是瞄准GPT-4V(多模态版的GPT-4)的跨模态能力,是ChatGLM全新一代的技术升级。 “对标OpenAI是智谱 AI 成立以来的目标。智谱 AI 致力于让机器像人一样思考,我们希望利用ChatGLM3通用基座模型能力,与合作伙伴一起共同的支撑千行百业,进入生成式 AI‘第二阶段’。”张鹏称。 据悉,智谱 AI 成立于2019年,脱胎于清华大学计算机系知识工程研究室团队,是清华大学知识成果转化的创业公司,瞄准 AI 大模型研发落地,公司CEO张鹏毕业于清华计算机系,总裁王绍兰为清华创新领军博士,清华大学计算系教授唐杰也参与研发中国最大规模预训练模型悟道2.0。 2020年,智谱AI 开始GLM预训练架构的研发,并训练了100亿参数模型GLM-10B;2021年利用MoE架构成功训练出万亿稀疏模型;2022年公布1300亿级超大规模预训练通用模型GLM-130B,并以此打造大模型平台及产品矩阵。 2023年,智谱AI 推出千亿基座的对话模型ChatGLM,并开源单卡版模型ChatGLM-6B等,部署于个人开发者和企业应用领域。今年6月,智谱AI 迭代出ChatGLM2,包括6B、130B、12B(120亿参数)、32B、66B等参数的模型,推理速度增长42%。据张鹏透露,相比GPT-4版的ChatGPT,ChatGLM2-12B、32B和66B性能分别提升16%、36%和280%。 当前,智谱 AI 开源模型在全球下载量已超过1000万次。同时,该公司也进行商业化探索,打造AIGC(生成式 AI)模型及产品矩阵,包括已获批上线的智谱清言、高效率代码模型CodeGeeX等。 融资方面,创立至今的四年多,智谱AI 共完成四轮融资。10月20日,智谱 AI 宣布年内累计融资额超过25亿元人民币,投资方包括社保基金中关村自主创新基金(君联资本为基金管理人)、美团、蚂蚁、阿里、腾讯、小米、金山、顺为、Boss直聘、好未来、红杉、高瓴等多家机构,而君联资本等部分老股东跟投,华兴资本担任独家财务顾问。 截至目前,智谱 AI 公司估值已超过100亿元,是国内 AI 领域独角兽企业。公司称,上述融资将用于基座大模型的进一步研发,更好地支撑行业生态。 此次,智谱 AI 发布的最新ChatGLM3通用基座大模型,在性能、推理、算力、Agent智能体能力、API商业化等方面均有提升。 其中,性能方面,ChatGLM3-6B在44个中英文公开数据集测试中国内同尺寸模型排名首位,相比ChatGLM2-6B,多个排名提升33%以上,GSM8K基准提升179%;推理方面,相较于目前伯克利大学开源的vLLM,速度提升2-3倍,推理成本降低一倍。 同时,新的模型还集成自研AgentTuning技术,激活模型智能体能力,在智能规划和执行方面比ChatGLM2提升1000%,支持工具调用、代码执行、游戏、数据库操作、知识图谱搜索与推理、操作系统等复杂场景,最新AgentBench基准测试上ChatGLM3-turbo和GPT-3.5接近;国产算力层面,以昇腾生态为例,ChatGLM3推理速度提升达3倍之多。 而在模型尺寸上,ChatGLM系列首次增加1.5B、3B这类小参数模型/张鹏称,主要原因是用户需求和算力成本之间的平衡,而且支持国产芯片的边缘侧模型ChatGLM3-1.5B可在笔记本电脑、手机、汽车等场景部署,速度达20 Tokens/s,精度上1.5B和3B模型与ChatGLM2-6B模型性能接近。 现场演示中,对标ChatGPT、基于ChatGLM3的 AI...