文章主题:百度, 工程师, 文心一言, 大模型平台

666AI工具大全,助力做AI时代先行者!

据文心一言发布已过去50余天,5月9日,百度工程师首次现场演示了“文心千帆”如何可视化微调大模型。

百度智能云最近宣布启动内测的“文心千帆大模型平台”是首个全球性的企业级大模型生产平台。这个平台不仅提供了包括“文心一言”在内的大模型服务以及第三方大模型服务,而且还为大模型开发和应用提供了一套完整的工具链,从而为企业用户提供了更加便捷、高效的大模型应用体验。

在3月16日这个备受瞩目的时刻,文心一言终于揭开了神秘的面纱。然而,由于其展示的Demo采用的是录屏形式,许多网友表达了失望之情。 even 李彦宏 也多次强调,这种大型语言模型尚处于发展的初级阶段,仍有很大的提升空间。

近两个月的时间过去了,经过多次迭代升级和首批企业内测后,百度的底气似乎足了一些。

300余家生态伙伴参与内测,大模型推理成本降为十分之一

自3月16日起,百度智能云大模型平台启动了初始的企业内测阶段,并为企业客户提供文心一言API接口调用服务。仅仅一个月后的3月27日,该平台又正式推出了面向公众的“文心千帆”大模型平台。

文心千帆大模型平台是一款功能强大的工具,能够满足用户的多种需求。据相关介绍,该平台具备生成合同、邀请函、数字人文案、直播文案、预订机票以及修改行程等多元化的能力。举例来说,当用户输入“五一期间,我想从北京出发前往云南游玩五天”的关键信息时,文心千帆不仅会提供详细的行程攻略,还能自动匹配相关的门票和机票信息。如果用户对行程细节有任何不满,都可以随时提出更改请求,从而实现个性化定制。

在收费策略方面,文心千帆的推理服务采用0.012元/1000 tokens的方式进行调用,同时按照输入输出的总字数进行收费。据百度集团副总裁袁佛玉透露,截至训练时间,已有超过300家生态合作伙伴参与文心一言的内部测试,并在400多个企业内部场景中取得了显著的测试成果。

目前,文心千帆大模型平台提供公有云服务、私有化部署两大交付模式。

在公有云服务领域,我们将为您呈现三大便捷选择,全面助力您轻松应对各种复杂场景:首先,我们提供直接调用大型模型推理的能力,让您能够迅速、准确地获取所需结果;其次,通过精准标注业务数据,我们将协助您高效训练出专属于您行业的大模型,从而确保您的模型具备高度行业特化,满足独特需求;最后,我们将为您提供模型托管服务,将您的模型发布至百度智能云,确保其稳定、高效地运行,进一步降低您部署大型模型的门槛。

在私有化部署方面,文心千帆大模型平台支持软件授权(提供在企业环境中运行的大模型服务)、软硬一体(提供整套大模型服务及对应的硬件基础设施),租赁服务(提供机器和平台的租赁满足客户低频需求)三种方式。私有化部属能够满足对数据监管有严格要求的企业客户需求。

4月25日,在文心一言开启内测一个月之际,百度智能云曾表示,其已完成4次技术版本升级,相较最初版本推理效率提升了10倍,模型算力利用率提升了1倍,大模型推理成本随之降为原来的十分之一。

互联网产业时评人张书乐向记者指出,文心一言依托百度的庞大搜索数据和算法优势,其学习资料极为丰富,关键在于其学习方法(算法)上的迭代完善,能否支撑其从一个寻章摘句的“书虫”变为有独立思考能力的“优等生”。目前,文心一言的完善程度应该在国产大模型中是比较高的,而且依托“中文”这个护城河,较之国外大模型有更多地缘优势。

被质疑、被回怼,文心一言需要“螃蟹”的觉悟

虽然过去近两个月时间,但关于文心一言的讨论一直不断。

3月底,文心一言推出不到两周,便迎来了质疑声。有微博博主发文质疑其文生图功能抄袭“StableDiffusion”,同时在中文语义理解方面存在局限。彼时,百度方面回应称,文心一言完全是百度自研的大语言模型,文生图能力来自文心跨模态大模型ERNIE-ViLG。

随后,在接受36氪采访中,李彦宏表示,“早在文心一言发布之前,大家用文心一格(指代百度基于文心大模型的文生图系统)就能体验文生图这个能力。”

此外,李彦宏指出,“百度的文心一言和OpenAI差距可能在两个月左右”。这番言论却让王小川不以为然。

他直言,这肯定是平行宇宙里的李彦宏说的,不是我们这个世界里的。并指出,文心一言不可能和OpenAI差距只有两个月,如果真是如此,那肯定是另一个宇宙。他认为国内目前的大模型和GPT的差距不可能是2个月是三年。但这是很动态的,大家很努力就有可能快一些。

5月4日,李彦宏在内部活动中回应了此番争议,他表示,“说实话这有点断章取义,我后面紧接着还说,这不是重点,重点是这两个月的差距我们要用多长时间才能赶上,也许很快,也许永远也赶不上。”

同时,他认为,算力不能保证我们能够在通用人工智能技术上领先,算力是可以买来的,创新的能力是买不来的,是需要自建的。据悉,目前全球算力规模美国占34%,中国占33%,算力差不多。

在今天的演示会上,百度智能云云计算产品解决方案和运营部总经理宋飞表示,“大家可能会觉得堆积算力、写好代码、然后进行模型训练,把它跑起来就行了。实际上在训练过程中会遇到各种各样的挑战,很少有人能够使得一个大模型训练过程能够在连续一两天内不出问题。百度AI大底座可以为大模型提供高效、稳定的训练和有效的收敛。千卡加速比达到90%,资源利用率70%,开发效率提升100%。这是AI大底座为大模型的开发和应用带来的价值。”

从目前的实践来看,以文心一言为代表的大模型主要应用于B端,在张书乐看来,这主要是因为C端延伸存在难度。

他指出,一是个体用户需求太过庞杂、无序,难以有效满足不同层次用户使用需求;二是个体用户主流需求过于浅显。大多数C端体验仅仅是尝鲜,缺乏深度应用能力。就如办公软件在C端大多停留在文字处理一般,而少有人涉及深层使用,这让GPT的应用场景既杂且浅,缺乏战略纵深;三是可实现的多模态对于C端大多数用户而言较为鸡肋,加上目前的生成能力依然是“小升初”阶段,无法真正意义上满足C端用户所谓“一键式傻瓜操作”。

至于能否追上ChatGPT,百度需要培养AI原生应用的思维方式和理念,也需要有做“敢于吃螃蟹的人”的觉悟,争议和期待会在一段时间内共存。

正如李彦宏所言,“改变思维方式会是痛苦的,会经历各种挫折和煎熬,需要用毅力去克服这种惯性,用发现和探索的眼光来看待这个新的世界。”

(责任编辑:王治强 HF013)

AI时代,拥有个人微信机器人AI助手!AI时代不落人后!

免费ChatGPT问答,办公、写作、生活好得力助手!

搜索微信号aigc666aigc999或上边扫码,即可拥有个人AI助手!

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注