中国大模型热的潮水背后：百川智能的迅速崛起

文章主题：界面新闻, 李京亚, 百川智能, 王小川

界面新闻记者 | 李京亚

界面新闻编辑 |

在美国，开发大型开源模型或创建通用模型早已成为定局，投资方面也已經明确，然而在我国，谁能夠成為最佳的大模型則尚未有明確的结论。現在，每個人都有機會競爭，並且不必局限于大型企業。百川智能首席执行官王小川在8月8日的媒體發布會上如此表示。

《中国人工智能大模型地图研究报告》表明，截止到5月28日，我国已经发布的10亿级参数规模以上的基础大模型数量达到79个。从2017年谷歌发布Transformer网络结构算起，五年时间里，全球范围内已经出现了多种形态、应用在不同场景的大模型技术群体。

在8月8日的午后，我国知名科技公司百川智能正式公布了一项重要信息，即其公司旗下的第三款大型人工智能模型产品——Baichuan-53B，已经启动了首次内部测试。与此同时，该公司创始人王小川也接受了包括界面新闻在内的多家媒体进行的深度访谈。

先前，百川智能在7月11日两款量化版本，分别是拥有130亿参数的通用大语言模型Baichuan-13B-Base和对话模型Baichuan-13B-Chat，一同亮相。这一举动表明，自去年12月成立以来，百川智能仅用了四个月的时间，就已经成功研发并推出三款大模型产品。如此高效的发展速度，无疑让人为之惊叹。

王小川特别强调，尽管这三款大模型的名称均以“百川”为开头，但这些大模型并非是针对2C市场的终极沙盒型产品，而更多的是服务于2B领域。换言之，它们的名字只是作为一种象征性的表达，而非真正反映其功能和目标市场的定位。

在8日午后，我国知名的人工智能公司百川智能推出了其第三个模型——baichuan-53B，并开始了首次内测服务。经过界面新闻记者的严格测试，该款产品在处理最新且稍微复杂的问题时，展现出了出色的逻辑思维能力。

据王小川所述，baichuan-53B更大的能力是能很好理解语言泛化背后的含义，这款产品代表文科水准的抽象、类比和关联能力很强，能把各种概念有机连接，“我们这个模型在文科领域走前列。”王小川认为。

事实上，强文科能力的大模型体现了王小川的技术审美，他本人在4月创业之初一场采访中就提及，逻辑本身并不高级，更高级的人类智慧在类比和抽象之中，像分类、类别这种事情，ChatGPT就做得挺好。

B端的抉择

但无论是此前搜狗团队在语言能力上的积累，还是新产品在文法、修辞、逻辑学方面的惊艳表现，百川智能的模型并不面向2C。虽然在2B以外，百川团队已在部署包含2C的超级应用，但王小川强调，现在开放接口测试是为帮助大家在工作上取得进展，不为C端场景单独去做优化，“不管之前的7B与13B，还是53B，更多是为2B行业做准备。”下月，baichuan-53B会开放API，相关组件也会陆续开放。

这一细节表述引发了2B2C模型在同一公司内部站位的迷思。

就在近日，有头部VC相关投资人告诉记者，一级市场现在并不看好针对2B垂直领域的模型，因为在数据上很难构成壁垒。对此，王小川对界面新闻表示，B端大模型天花板确实不高，但确定性反而清楚，很多企业有B端需求，只是对接复杂性高，研发成本高，每个企业有自己的私有数据，如何做好中间层连接尤为关键，如果没有一个好的模式，会把双方都拖垮。他同时给出了一个B端大模型商业模式的愿景，“B端带有天然真实场景，有中间层做企业服务，也有后面做模型的公司（比如我们），我理解的是这样的三层结构。”王小川指出。

但他也告诉界面新闻等媒体，当2B补完之后会开始补齐2C版图，百川智能不会只瞄准一个方向。

当前侧重B端的站位也解释了王小川在开闭源上的选择，他称，大模型本身不代表2C，就不像像安卓、IOS需要二选一，今天从2B的角度，其实开源闭源都很需要。

据媒体报道，是今年3月大模型热潮兴起之后，王小川用2周时间做了入局大模型创业的决定，在这个时间节点上，少数几家头部大模型公司如智谱AI和MiniMax已经声名鹊起。

王小川坦言，相比智谱AI和MiniMax等已经具备一定市场影响力的大模型公司，百川智能是后发者进入市场，因此开源是展现技术实力的一种方式，“我们相信后面的技术发展会非常快，只要持续不断有技术迭代，就会产生自己的商业模式。”王小川很看重开源带来的价值，他认为，未来80%的企业会用到开源模型，因为开源模型小巧，而闭源没法对很多场景做出上佳适配。

今年3月以来，国内各类ChatGPT平替大模型层出不穷，进展之快令人混乱，与之相伴而来的是评测体系的构建。7月，IDC调研了14家中国市场主流大模型技术厂商，考察了大模型的10余项指标，发布《AI大模型技术能力评估报告2023》，随即引发热议，此后，更多研究机构投入资源，发布对应的评价标准。

王小川认为，在各家榜单之中，Super Clue和复旦大学推出的评测基准相对中正，可以从中洞察模型品质。据他所述，百川推出的第二款大模型13B的英文能力部分跟Meta的开源大模型LLaMA1持平，中文部分更在国内处于领先状态，这都受益于开源的迭代。

重集旧部

7月下旬，搜狗原CMO洪涛入职百川智能，负责商业化业务，至此，搜狗前CEO王小川、搜狗原COO茹立云和原CMO在百川智能重新聚首。在8月8日媒体发布会现场，还出现了另一位搜狗旧部的身影——前搜狗搜索总经理陈炜鹏，后者是百川智能的技术联创核心人物，百川智能得以在4个月间连推三款大模型产品，他功不可没。

王小川感慨，搜狗老班底之间，大家互相信任，会更优先归队，“像炜鹏、洪涛、立云，还有马昭都是老班底。”王小川介绍称。

目前，百川智能有103位成员，技术人士占比70-80%。技术联合创始人陈炜鹏对界面新闻表示，搜狗之前各个业务线最优秀的干将如今基本在百川集结完毕，但百川同时也在面向国内大厂、初创和硅谷招聘各类人才，他发现，在AI2.0时代，对产品经理等职位的能力要求已与AI1.0时代有显著不同。

谈及百模大战时代筛选技术人才的标准，陈炜鹏称，百川在技术上倾向于两类人才，第一是对复杂问题有强拆解能力，对算法体系有很好的技术审美；第二是各类技术基本功扎实，且对于做大模型本身充满渴望。

融资进展方面，4月成立之初，百川智能便被爆出已获得5000万美元启动资金，来自王小川与其业内好友的个人支持。王小川此番还透露，百川智能首次融资时，估值已经超过5亿美元，下一轮融资，估值就会超过10亿美元，目前新一轮融资也非常顺利。

界面新闻注意到一个现象，以王小川、王慧文同期创业为节点，此前是智源系的大模型公司占据些许先发优势，在王小川等互联网时代的大佬宣布创业后，资本立即表达了对“单打独斗”的AGI明星创业者的高度认可。而进入7月，一级市场暗流涌动，一些投资人牵头，AI大佬组团入局的事件开始酝酿。

对于可能面临的更为惨烈的竞争，王小川认为，一家公司需要灵魂，现今创投两侧的各类攒局者其实夹杂着诸多对技术的误解，比如之前对搜索的理解，明显有各种误判，“不论是（外界）希望由技术驱动或者内容驱动，至少从我20年的工作经验里，我觉得他们解读的还是比较浅的，”王小川还点出了他心目中搜索的本质，“以前在AI发展时期，大家慢慢遗忘搜索也是AI，而今天做大模型和做搜索有非常雷同之处。”

AI时代，拥有个人微信机器人AI助手！AI时代不落人后！

免费ChatGPT问答，办公、写作、生活好得力助手！

搜索微信号aigc666aigc999或上边扫码，即可拥有个人AI助手！

B端的抉择

重集旧部

相关文章

发表回复 取消回复

发表回复取消回复