百川智能开源大模型:Baichuan2引领AI技术新潮流
Stable Diffusion

百川智能开源大模型:Baichuan2引领AI技术新潮流

百川智能在北京市科技委员会等指导下举办了一场主题为“百川汇海,开源共赢”的大模型发布会,宣布开源了微调后的Baichuan 2-7B、Baichuan 2-13B、Baichuan 2-13B-Chat及其4bit量化版本,并免费商用。此外,还开源了模型训练的Check Point,及Baichuan 2技术报告,帮助用户更深入地了解其训练过程。这两个模型在各大评测榜单上表现优异,数学、代码、安全等方面均有显著提升。百川智能秉承更开放、更透明的理念,公布技术报告以推动大模型社区的技术发展。
深度丨王小川官宣百川智能:AGI 的终局是什么?
Stable Diffusion

深度丨王小川官宣百川智能:AGI 的终局是什么?

如何用终局思维,看当下AGI的创业大潮?作者丨董子博 编辑丨岑峰 “这131天,对我来说,就像过了好几年一样。”回忆起自ChatGPT诞生至今的日子,王小川如是说道。 大模型创业,自卷起大潮后,已经过去了数月之久,王慧文将“光年之外”落在搜狐大厦,李志飞回到出门问问双线作战,王长虎则给新公司定名“爱诗”招兵买马,贾扬清则在离开阿里后还百废待兴…… 而王小川也没有闲着,在王慧文新办公室的楼下,小川召开了一个媒体沟通会,官宣了他的新厂牌——“百川智能”。会上,王小川身着一件橙红色的帽衫,不用PPT,只是在众人拥簇下侃侃而谈,有接近小川的人对AI科技评论表示:“这几年他变化很大,松弛了不少,也幽默了不少。” 早在雷峰网之前的文章——《ChatGPT群雄逐鹿:陆奇屠龙,号令天下;小川不出,谁与争锋》——中就有提过,从学术号召力、工程能力、政商能力、意愿冲劲四个维度中,王小川都不落人后,综合实力一流。 到四月底,百川的团队将达到50人的规模。“今年年底,对标ChatGPT3.5的模型就可以训练完成。”王小川如是说道。 近期,雷峰网和王小川有过一次对谈,对于生成式AI,乃至未来的AGI的可能形态、完成终局、创业者如何找准位置入局等问题,进行了深入的交流。 交流中,王小川提到,这两个月,关于未来AI大模型的打法和决策,在进行反复的思考和迭代,“基本算是把路径想清楚了”。 1百川智能,现在怎么样? 将公司定名为“百川”,王小川不仅意指大模型技术的发展路径——汇集海量数据和行业知识,以训练出足够智慧的AI;其中更是代表了他对招贤纳士的渴望,希望能人义士能够合归一处,助他在大模型的创业上更进一步。 在搜狗的后期,王小川越发能感受到人员招募的艰难;而在ChatGPT之后,随着人们对于AI热情的高涨,王小川说,聚拢人才相比几年前更容易了,到这个月末,团队的规模就能扩充至50人,甚至还有人“带资进组”。 有消息称,百川的团队招揽了大量他在搜狗的旧部,一方面,他们更懂搜索和NLP,与大模型算是近水楼台;一方面更认同小川的价值观,更有目标感;一方面也更懂得如何和他合作,知道对方想要什么。 而对于团队,王小川的目标还不止于此,他对AI科技评论表示,在厘清了现有团队的结构之后,马上还要奔赴美国“薅人”,颇有“周公吐哺,天下归心”之意。 在原先的文章中我们就有提到:王小川出身清华,并与清华大学联合创办了天工人工智能研究院,有很高的学术号召力。得道多助的小川背后,还有清华这间国内顶级高校的支持。 评价王小川的大模型创业,中国工程院院士、清华大学计算机系教授、王小川在清华的硕士导师郑伟民表示:“王小川敢于创新,敢于思考,具有丰富的系统工程经验……研究并行计算和相关的体系结构,是我所在的清华大学高性能计算研究所的重要工作,也有着丰富的经验,一定会全力配合与支持王小川。” 而中国科学院院士,清华大学人工智能研究院院长,王小川的博士导师,张钹也表示:“新创建的百川公司的团队很强,我相信他(王小川)能完成这个使命,并在未来的发展中给予全力支持。” 除郑纬民、张钹两位院士外,清华大学计算机系的尹霞、马少平、刘奕群等教授,也不乏对百川智能的溢美之词,纷纷表示将鼎力相助。 资金方面,王小川也表示,现有的资金状况可以放心,手中5000万美金的启动资金,已经可以支撑他当下的团队和算力成本。而大模型的从零到一,王小川估算,成本的规模大概在3-20亿美金。 从产品的角度上,王小川锐意进取,直言:就是要做中国最好的AI大模型。 如何做到最好?不少人盲目地迷信模型参数——参数越大,模型就越强。 但王小川并不同意这一点,他表示,盲目追求大参数,未免有些浮夸。当下,百川已经开始了参数量级在500亿左右的模型训练,而在年末对标GPT3.5的模型。 2 王小川对于AGI终局的 几个核心认知 1、语言,是打开AGI大门的钥匙 早在王小川还是研究生的时候,他研究的是基因测序的技术。而在研究中,王小川还是看到了这项技术的弱点:“而基因测序是十分混沌的——中间不确定的变量太多,有不少蝴蝶效应。在过去牛顿写了《自然科学中的数学原理》,将物理简化成数学,但生命科学还做不到。” 20年后,王小川离开搜狗,豪言:“往后二十年,若能为生命科学和医学的发展尽一份力。”时间又过去两年,王小川将生命科学的盘子转托给杨洪涛,全情投入大模型创业。对于这一点,他心中难免有波澜。 要将生命科学的秘密摸清,20年太久,也太理想主义,王小川心里清楚,理想主义和现实需要平衡。早在数年前,谷歌开发的AlphaFold就实现了以蛋白质的基因序列,预测蛋白质的 3D 结构的功能。尽管功能还远称不上完善,但这让王小川看到了从AI到生命科学的“曲线救国”。 要做AI,王小川却没有选择从生命科学入手,相反,他选择了他更轻车熟路的语言。 为什么要从语言切入,王小川的思考,是从人的认识论开始的:通过语言,才能认识这个世界。 早有不少人问他,AGI这一波来势如此汹涌,机会也不止于大模型,为什么不做文生图、CV、智能驾驶这种技术路径更成熟的领域? 而王小川的立场却相当坚定,语言是知识、思考、沟通、乃至文化的载体,如果目标的是AGI这颗“皇冠上的明珠”,那么必须从语言入手——语言距离AGI,比图像和视觉都要更近。 而同时,语言也一直是王小川的优势所在。对AI科技评论,王小川直言:“输入法是猜你想说啥,搜索引擎是猜你想要啥——而ChatGPT,则是将这两种需求进行了一站式的解决。” 2、大模型X大应用,缺一不可 “原来经常有人问我,是做模型还是做应用——这一问,就把自己绕进去了。”王小川如是说。 借鉴过去微信、淘宝的“老路”,想要突围,除了有技术以外,关键还是得做出中国自己的杀手级应用。 这一点,王小川深有体会:搜狗的成就,并非体现在搜索引擎的技术本身;正是有了搜索引擎、输入法这两个爆款应用之后,搜狗的价值才真正被人看到。 而这也是王小川入局创业,便迅速积累了一批搜狗旧部的原因;想必这一次的创业,王小川的“三级火箭战略”指导思想和打造杀手级应用的经验也将再一次发挥价值。 “智能的终极,我们肯定永远都会追求。但我们和ChatGPT不一样的地方是,我们也关注,AI大模型落地的场景,是否是真实的;产品化的AI,是否真的用得着。”王小川这么表示道。 从输入法走向搜索,未来还要走向Chat,王小川认为,明天的王道,是“Chat+搜索”的“Chat Pro”形式。 “我认为,今天的OpenAI有点‘目空一切’,AI能力很强,但并没有进攻搜索领域;New Bing则是以搜索为核心,加上了ChatGPT的能力,但仍然不够纯粹。”...
《一剑封侯》
Stable Diffusion

《一剑封侯》

抱歉,您没有提供具体的文章内容。请您提供一篇完整的文章内容,我将尽力为您做出专业的文章摘要。