文章主题:关键词:周鑫雨, 苏建勋, 百度文心一言, 扎堆

666AI工具大全,助力做AI时代先行者!

文 | 周鑫雨

编辑 | 苏建勋

在大模型“扎堆”发布的当下,市场亟需更直观的方式,对模型能力做出判断。

在2023年3月16日的百度文心一言发布会上,该模型采用了录播Demo的形式进行展示。在36氪的独家专访中,百度首席执行官李彦宏对此现象进行了阐述,他解释道:“之所以选择这种形式,是为了更好地呈现模型的实际应用效果。”

生成式AI所提供的答案可能存在差异性,这一点带来了一定的不确定性。然而,在各种类似发布会上,全球范围内并没有一场是现场演示的,而全部是通过录制的方式呈现的。既然其他场合都采取了这样的方式,我们也可以考虑采用这种模式。

在经过了一个月多的沉默之后,百度在最近的一次技术交流会上,展示出了他们全新的风格,他们将“文心千帆大模型平台”的的能力进行了现场 demonstration,这一举动无疑打破了他们过去保守的形象。

2023年3月27日,我国知名科技巨头百度公司推出了一款全新的文心千帆大模型平台。这款平台整合了文心一言服务的调用功能、第三方模型的训练与调优服务,以及一系列便捷的工具,堪称一站式建模解决方案的典范。值得注意的是,该平台主要分为两大服务板块:公有云服务和私有化部署。在公有云服务方面,文心千帆大模型平台为用户提供了一系列便捷的功能。其中包括:文心一言推理能力的调用、模型微调、模型托管等。这些服务可以帮助用户更高效地利用模型,提升工作效率。而在私有化部署方面,平台提供了软件授权、软硬一体以及租赁服务等多元化的解决方案。这使得用户可以根据自身需求选择最合适的方案,实现模型的快速部署和高效运行。总之,百度文心千帆大模型平台的推出,无疑为各类用户提供了一个强大且易用的建模解决方案。无论是企业还是个人,都可以通过该平台轻松实现模型构建、训练和部署,从而降低建模成本,提高工作效率。

此次现场演示,百度主要展现了文心千帆的推理能力调用和模型微调两部分。

文心一言Sugar现场生成了销售额的饼图。

在观察演示结果时,我们可以发现,文心一言旗下的数据可视化工具Sugar具有卓越的理解能力,可以迅速地对结构化数据集进行解读,并生成饼图。然而,当面临模型难以处理的“绘制折线图”的需求时,百度程序员并未气馁。他们借助了文心千帆大模型平台的力量,通过微调功能,将100条标注数据导入到Prompt中,实现了折线图的绘制。这一系列操作充分展示了百度程序员的聪明才智和专业素养。

文心千帆支持模型微调。

这表明,文心千帆已具备在仅用约100条左右的数据标注的情况下,高效地进行模型微调和定制的能力。百度智能云AI与大数据平台总经理忻舟阐述道:“文心千帆提供了直观的图形化界面,为我们提供优质的大模型训练和推理应用环境。无需深入了解代码或执行命令行操作,我们只需关注核心业务数据和应用,然后在文心千帆平台上进行各类训练和优化。”

在AI时代的大背景下,百度内部的”向内革命”正在逐步展开。其核心业务板块,包括百度搜索、推荐、地图、如流、小度等,都已经成功接入文心一言,这无疑为百度在智能化转型中增添了强大的动力。

作为一款在百度内部广泛应用的办公软件,“如流”近日正式上线了AI小助手。当谈到行业大模型训练的成本时,这个智能助手给出的答案是“10万-50万卡时”。

百度集团副总裁侯震宇表示,对客户而言,成本和模型性能才是评价大模型的两项指标

“训练一个大模型,动辄三个月,一两千万美元,假如每一个企业都需要付出这么高的代价,门槛那么高,显然百度也不会进入这个市场。”他表示,即便从头训练模型的成本依然高昂,但是使用大模型、以及基于大模型底座训练和微调模型的成本已经有显著的降低,“现在调用文心一言的成本,已经降低到模型刚发布时(3月16日)的10%”。

近期,一份从谷歌内部泄露的文件揭示了未来闭源大模型的发展趋势。据文件显示,随着 Meta 自研大模型 LLaMa 的泄露,开源模型生态系统正以前所未有的速度快速发展。此种情况的出现,意味着无论是 OpenAI 还是其他厂商开发的闭源大模型,都将不可避免地面临开源模型的冲击。此外,文件还强调,企业可以免费使用这些开源模型,从而使得整个过程变得更加灵活可控。值得关注的是,这种现象表明,未来大模型的发展方向将不再局限于封闭性,而是向开源领域敞开大门。在这个变化的时代背景下,各企业需做好应对准备,以适应未来的发展趋势。

“大家觉得大模型成本非常高,是因为大模型算力成本高,其次是大模型数据成本。开源模型也绕不开大量的GPU,所以并不是开源成本一定低。”侯震宇则向36氪给出了相反的答案。

他认为,免费开源模型的调用成本并不意味着更低:“一方面,一般企业不见得能够用得起两三千张集群卡,另一方面是不一定能够用好,在这么大的集群量中如果出现了BUG很难调整,需要有整体的调优服务能力。大模型贵是因为量大且训练时间长,在成本这方面,最终要看是否有整体端到端的成本控制能力,这样一定会比纯粹去买成本要低。”

随着大模型的落地逐渐从“摸石过河”走向实践的“中场战事”,低成本和高性能将是不同大模型厂商不断演练的课题。

36kr制图

AI时代,拥有个人微信机器人AI助手!AI时代不落人后!

免费ChatGPT问答,办公、写作、生活好得力助手!

搜索微信号aigc666aigc999或上边扫码,即可拥有个人AI助手!

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注