文章主题:云栖大会, 百川智能, 王小川, 大模型
在2023年的云栖大会上,百川智能的创始人兼CEO王小川,深入探讨了百川智能在大模型时代的发展策略和实践经验。
近期,百川公司推出的全球最长上下文窗口大模型Baichuan2-192K引起了广泛的媒体关注。据公司首席技术官王小川透露,自成立以来,百川仅用了半年的时间就成功研发了7款大模型,这一迅速的迭代速度背后的关键因素则是强大的云计算支持。

【1】语言代表认知世界的边界
在2023年的四月,搜狗公司的前首席执行官王小川正式宣布创立了一家名为“百川智能”的AI大模型公司。值得注意的是,自公司成立以来,百川在短短几个月内就成功进入了科技独角兽的行列。更为惊人的是,仅仅半年的时间,百川就发布了七款基础大模型,其研发速度不仅远超出了行业的平均水平,而且这些开源模型的表现也非常出色。到了今年的八月末,百川成为了首批通过国家《生成式人工智能服务管理暂行办法》备案的公司之一,同时也是今年成立的大模型公司中唯一的的一家。
王小川,一位知名的人工智能研究者,曾預言大模型將颠覆人們對人工智能的傳統認知。他認為,我们现在正處於一场技術大爆炸的时代,而人類已經進入了通用的智能時代。早在2018年,他就提出了这样的观点:“當機器掌握了語言,通用的智能時代就到來了。”他進一步指出,語言是人类理解世界的邊界,一旦大模型掌握了語言的規律,它也就掌握了語言背後的知識、思考、溝通以及文化。在智能時代,大模型就像互联网时代的芯片一樣,将在社會各個方面發揮“點亮智能”的作用。
尽管从某种角度看,我国在大模型的发展上与OpenAI的“不计成本登月”策略还有一定差距,但从实际应用角度来看,我们的进度其实已经相当接近。王小川指出,我国大模型的现状是“理想上慢一步,落地上前三步”。虽然美国在技术创新和技术理想上具有一定的优势,但在应用落地方面,我国的实力则更为突出。以百川为例,这个团队拥有经验丰富的搜索团队,曾经成功打造过基于语言模型的超级应用,并且这些技术和产品都经过了市场的验证,具备强大的商业化能力。这样的团队不仅能够为大模型研发提供技术支持,更能弥补大模型在幻觉等问题上的不足。
凭借过往的经验和技术积累,百川已经崭露头角,成为了我国大模型创业公司的佼佼者之一。在过去的三个月里,百川开源大模型的总下载量突破了600万次。其中,Baichuan2不仅在通用领域和垂直领域都达到了领先水平,其在中英文的表现也超过了另一款热门模型LLaMA2。值得一提的是,10月30日,百川最新发布的Baichuan2-192K成为了全球支持最长上下文窗口的大模型,一次可以输入35万字,完胜了Claude2-100K。
【2】百川智能将与阿里云持续深入合作
除了团队、经验等优势外,百川实现平均每月迭代一款模型的另一重要原因是云计算的支撑。
王小川阐述,云计算对于模型的快速迭代与部署起着至关重要的作用。作为紧密协作的伙伴,百川智能与阿里云在模型预训练及模型部署等领域展开了深度合作。得益于双方的不懈努力,百川成功完成了千卡大模型的训练任务,从而有效地降低了模型推理的成本,并提高了模型部署的效率。
百川的开源模型在阿里巴巴集团的魔搭社区中赢得了广泛的关注,吸引了大量开发者的参与。通过利用社区的力量,开发者们基于百川大模型,针对各个垂直领域进行了精细的微调,并成功地将其实力集成到各种AI应用场景中。这一系列举措不仅极大地丰富了中国的大模型生态,同时也推动了AI技术的广泛应用和发展。
王小川表示,未来,百川智能将与阿里云持续深入合作,携手探索更前沿的大模型技术创新,推动大模型落地到更丰富的应用场景,共同助力大模型生态更加繁荣。
九派新闻记者 温艳丽 浙江杭州报道
【来源:九派新闻】
声明:此文版权归原作者所有,若有来源错误或者侵犯您的合法权益,您可通过邮箱与我们取得联系,我们将及时进行处理。邮箱地址:jpbl@jp.jiupainews.com
云栖大会, 百川智能, 王小川, 大模型
AI时代,拥有个人微信机器人AI助手!AI时代不落人后!
免费ChatGPT问答,办公、写作、生活好得力助手!
搜索微信号aigc666aigc999或上边扫码,即可拥有个人AI助手!