文章主题:百度, 工程师, 文心一言, 大模型平台
据文心一言发布已过去50余天,5月9日,百度工程师首次现场演示了“文心千帆”如何可视化微调大模型。
百度智能云最近宣布启动内测的“文心千帆大模型平台”是首个全球性的企业级大模型生产平台。这个平台不仅提供了包括“文心一言”在内的大模型服务以及第三方大模型服务,而且还为大模型开发和应用提供了一套完整的工具链,从而为企业用户提供了更加便捷、高效的大模型解决方案。
在3月16日这个备受瞩目的时刻,文心一言终于揭开了神秘的面纱。然而,由于其展示的Demo采用的是录屏形式,许多网友表达了失望的情绪。 even 李彦宏 也多次强调,这种大型语言模型尚处于发展的初级阶段,仍有很大的提升空间。
近两个月的时间过去了,经过多次迭代升级和首批企业内测后,百度的底气似乎足了一些。
300余家生态伙伴参与内测,大模型推理成本降为十分之一
自3月16日起,百度智能云大模型平台启动了初始的企业内测阶段,并为企业客户提供文心一言API接口调用服务。仅仅一个月后的3月27日,该平台又正式推出了面向公众的“文心千帆”大模型平台。
文心千帆大模型平台是一款功能强大的工具,能够满足用户的多种需求。据相关介绍,该平台具备生成合同、邀请函、数字人文案、直播文案、预订机票以及修改行程等多元化的能力。举例来说,当用户输入“五一期间,我想从北京出发前往云南游玩五天”的关键信息时,文心千帆不仅会提供详细的行程攻略,还能自动匹配相关的门票和机票信息。如果用户对行程细节有任何不满,都可以随时提出更改请求,从而实现个性化定制。
在收费策略方面,文心千帆的推理服务采用0.012元/1000 tokens的方式进行调用,同时按照输入输出的总字数进行收费。据百度集团副总裁袁佛玉透露,截至训练时间,已有超过300家生态合作伙伴参与文心一言的内部测试,并在400多个企业内部场景中取得了显著的测试成果。
目前,文心千帆大模型平台提供公有云服务、私有化部署两大交付模式。
在公有云服务领域,我们将为您呈现三大便捷选择,全面助力您轻松应对各种复杂场景:首先,我们提供直接调用大型模型推理的能力,让您能够迅速、准确地获取所需结果;其次,通过精细标注的业务数据,我们能够高效训练出专属于您行业的个性化模型,从而实现更优化、更精准的解决方案;最后,我们将模型托管于百度智能云平台,确保您的模型能够享有更加稳定、高效的运行环境。这三大服务的推出,将大幅降低您部署大型模型的门槛,助您更快、更好地应用人工智能技术。
在私有化部署领域,文心千帆大模型平台提供了多元化的解决方案,包括软件授权、软硬一体化以及租赁服务。这些方案共同为企业客户提供全面的大模型服务及相应的硬件基础设施,以满足不同企业的需求。此外,针对那些对数据监管有严格要求的客户,私有化部署方案还能够提供高度可靠的支持。
在文心一言内测一个月的时间里,百度智能云宣布已经完成了四轮技术版本的升级。这使得该系统的推理效率相较于最初的版本有了显著提升,达到了10倍的涨幅;同时,模型的算力利用率也得到了翻倍的增长。由此,大模型的推理成本也被降低到了原来的十分之一。
互联网产业时评人张书乐向记者指出,文心一言依托百度的庞大搜索数据和算法优势,其学习资料极为丰富,关键在于其学习方法(算法)上的迭代完善,能否支撑其从一个寻章摘句的“书虫”变为有独立思考能力的“优等生”。目前,文心一言的完善程度应该在国产大模型中是比较高的,而且依托“中文”这个护城河,较之国外大模型有更多地缘优势。
被质疑、被回怼,文心一言需要“螃蟹”的觉悟
虽然过去近两个月时间,但关于文心一言的讨论一直不断。
3月底,文心一言推出不到两周,便迎来了质疑声。有微博博主发文质疑其文生图功能抄袭“StableDiffusion”,同时在中文语义理解方面存在局限。彼时,百度方面回应称,文心一言完全是百度自研的大语言模型,文生图能力来自文心跨模态大模型ERNIE-ViLG。
随后,在接受36氪采访中,李彦宏表示,“早在文心一言发布之前,大家用文心一格(指代百度基于文心大模型的文生图系统)就能体验文生图这个能力。”
此外,李彦宏指出,“百度的文心一言和OpenAI差距可能在两个月左右”。这番言论却让王小川不以为然。
他直言,这肯定是平行宇宙里的李彦宏说的,不是我们这个世界里的。并指出,文心一言不可能和OpenAI差距只有两个月,如果真是如此,那肯定是另一个宇宙。他认为国内目前的大模型和GPT的差距不可能是2个月是三年。但这是很动态的,大家很努力就有可能快一些。
5月4日,李彦宏在内部活动中回应了此番争议,他表示,“说实话这有点断章取义,我后面紧接着还说,这不是重点,重点是这两个月的差距我们要用多长时间才能赶上,也许很快,也许永远也赶不上。”
同时,他认为,算力不能保证我们能够在通用人工智能技术上领先,算力是可以买来的,创新的能力是买不来的,是需要自建的。据悉,目前全球算力规模美国占34%,中国占33%,算力差不多。
在今天的演示会上,百度智能云云计算产品解决方案和运营部总经理宋飞表示,“大家可能会觉得堆积算力、写好代码、然后进行模型训练,把它跑起来就行了。实际上在训练过程中会遇到各种各样的挑战,很少有人能够使得一个大模型训练过程能够在连续一两天内不出问题。百度AI大底座可以为大模型提供高效、稳定的训练和有效的收敛。千卡加速比达到90%,资源利用率70%,开发效率提升100%。这是AI大底座为大模型的开发和应用带来的价值。”
从目前的实践来看,以文心一言为代表的大模型主要应用于B端,在张书乐看来,这主要是因为C端延伸存在难度。
他指出,一是个体用户需求太过庞杂、无序,难以有效满足不同层次用户使用需求;二是个体用户主流需求过于浅显。大多数C端体验仅仅是尝鲜,缺乏深度应用能力。就如办公软件在C端大多停留在文字处理一般,而少有人涉及深层使用,这让GPT的应用场景既杂且浅,缺乏战略纵深;三是可实现的多模态对于C端大多数用户而言较为鸡肋,加上目前的生成能力依然是“小升初”阶段,无法真正意义上满足C端用户所谓“一键式傻瓜操作”。
至于能否追上ChatGPT,百度需要培养AI原生应用的思维方式和理念,也需要有做“敢于吃螃蟹的人”的觉悟,争议和期待会在一段时间内共存。
正如李彦宏所言,“改变思维方式会是痛苦的,会经历各种挫折和煎熬,需要用毅力去克服这种惯性,用发现和探索的眼光来看待这个新的世界。”
百度, 工程师, 文心一言, 大模型平台
AI时代,拥有个人微信机器人AI助手!AI时代不落人后!
免费ChatGPT问答,办公、写作、生活好得力助手!
搜索微信号aigc666aigc999或上边扫码,即可拥有个人AI助手!