文心千帆大模型平台：百度引领AI技术革命的wave

文章主题：关键词：周鑫雨, 苏建勋, 百度文心一言, 扎堆

文 | 周鑫雨

编辑 | 苏建勋

在大模型“扎堆”发布的当下，市场亟需更直观的方式，对模型能力做出判断。

在2023年3月16日的百度文心一言发布会上，该模型采用了录播Demo的形式进行展示。在36氪的独家专访中，百度首席执行官李彦宏对此现象进行了阐述，他解释道：“之所以选择这种形式，是为了更好地呈现模型的实际应用效果。”

生成式AI所提供的答案可能存在差异性,这一点带来了一定的不确定性。然而,在各种类似发布会上,全球范围内并没有一场是现场演示的,而全部是通过录制的方式呈现的。既然其他场合都采取了这样的方式,我们也可以考虑采用这种模式。

在经过了一个月多的沉默之后，百度在最近的一次技术交流会上，展示出了他们全新的风格，他们将“文心千帆大模型平台”的的能力进行了现场 demonstration，这一举动无疑打破了他们过去保守的形象。

2023年3月27日，我国知名科技巨头百度公司推出了一款全新的文心千帆大模型平台。这款平台整合了文心一言服务的调用功能、第三方模型的训练与调优服务，以及一系列便捷的工具，堪称一站式建模解决方案的典范。值得注意的是，该平台主要分为两大服务板块：公有云服务和私有化部署。在公有云服务方面，文心千帆大模型平台为用户提供了一系列便捷的功能。其中包括：文心一言推理能力的调用、模型微调、模型托管等。这些服务可以帮助用户更高效地利用模型，提升工作效率。而在私有化部署方面，平台提供了软件授权、软硬一体以及租赁服务等多元化的解决方案。这使得用户可以根据自身需求选择最合适的方案，实现模型的快速部署和高效运行。总之，百度文心千帆大模型平台的推出，无疑为各类用户提供了一个强大且易用的建模解决方案。无论是企业还是个人，都可以通过该平台轻松实现模型构建、训练和部署，从而降低建模成本，提高工作效率。

此次现场演示，百度主要展现了文心千帆的推理能力调用和模型微调两部分。

文心一言Sugar现场生成了销售额的饼图。

在观察演示结果时，我们可以发现，文心一言旗下的数据可视化工具Sugar具有卓越的理解能力，可以迅速地对结构化数据集进行解读，并生成饼图。然而，当面临模型难以处理的“绘制折线图”的需求时，百度程序员并未气馁。他们借助了文心千帆大模型平台的力量，通过微调功能，将100条标注数据导入到Prompt中，实现了折线图的绘制。这一系列操作充分展示了百度程序员的聪明才智和专业素养。

文心千帆支持模型微调。

这表明，文心千帆已具备在仅用约100条左右的数据标注的情况下，高效地进行模型微调和定制的能力。百度智能云AI与大数据平台总经理忻舟阐述道：“文心千帆提供了直观的图形化界面，为我们提供优质的大模型训练和推理应用环境。无需深入了解代码或执行命令行操作，我们只需关注核心业务数据和应用，然后在文心千帆平台上进行各类训练和优化。”

在AI时代的大背景下，百度内部的”向内革命”正在逐步展开。其核心业务板块，包括百度搜索、推荐、地图、如流、小度等，都已经成功接入文心一言，这无疑为百度在智能化转型中增添了强大的动力。

作为一款在百度内部广泛应用的办公软件，“如流”近日正式上线了AI小助手。当谈到行业大模型训练的成本时，这个智能助手给出的答案是“10万-50万卡时”。

百度集团副总裁侯震宇表示，对客户而言，成本和模型性能才是评价大模型的两项指标。

“训练一个大模型，动辄三个月，一两千万美元，假如每一个企业都需要付出这么高的代价，门槛那么高，显然百度也不会进入这个市场。”他表示，即便从头训练模型的成本依然高昂，但是使用大模型、以及基于大模型底座训练和微调模型的成本已经有显著的降低，“现在调用文心一言的成本，已经降低到模型刚发布时（3月16日）的10%”。

近期，一份从谷歌内部泄露的文件揭示了未来闭源大模型的发展趋势。据文件显示，随着 Meta 自研大模型 LLaMa 的泄露，开源模型生态系统正以前所未有的速度快速发展。此种情况的出现，意味着无论是 OpenAI 还是其他厂商开发的闭源大模型，都将不可避免地面临开源模型的冲击。此外，文件还强调，企业可以免费使用这些开源模型，从而使得整个过程变得更加灵活可控。值得关注的是，这种现象表明，未来大模型的发展方向将不再局限于封闭性，而是向开源领域敞开大门。在这个变化的时代背景下，各企业需做好应对准备，以适应未来的发展趋势。

“大家觉得大模型成本非常高，是因为大模型算力成本高，其次是大模型数据成本。开源模型也绕不开大量的GPU，所以并不是开源成本一定低。”侯震宇则向36氪给出了相反的答案。

他认为，免费开源模型的调用成本并不意味着更低：“一方面，一般企业不见得能够用得起两三千张集群卡，另一方面是不一定能够用好，在这么大的集群量中如果出现了BUG很难调整，需要有整体的调优服务能力。大模型贵是因为量大且训练时间长，在成本这方面，最终要看是否有整体端到端的成本控制能力，这样一定会比纯粹去买成本要低。”

随着大模型的落地逐渐从“摸石过河”走向实践的“中场战事”，低成本和高性能将是不同大模型厂商不断演练的课题。

36kr制图

AI时代，拥有个人微信机器人AI助手！AI时代不落人后！

免费ChatGPT问答，办公、写作、生活好得力助手！

搜索微信号aigc666aigc999或上边扫码，即可拥有个人AI助手！

相关文章

发表回复 取消回复

发表回复取消回复