文章主题:王小川, 大模型公司, 百川智能, 开源大模型
点击图片了解详情 ⇧⇧
g导读:
本文是一多加速工场【AI新商业·企业家特训营 2期(北京站线下课)】(戳此了解详情)的预习资料,旨在帮助企业家群体洞悉时代变革的底层逻辑,找到融合AI的场景,推动企业业务与组织的系统升级,把握AI新商业的早期红利。
字数:5033字 阅读时长:5分钟
4 月,王小川宣布下场,成立大模型公司「百川智能」,要「做中国的 OpenAI」。
6 月,百川智能发布 70 亿参数开源大模型,Baichuan-7B。
7 月,百川智能发布 130 亿参数开源大模型,Baichuan-13B。
两款模型在各种测评上都有不错的表现,也收获了国内外大量用户的认可。
三个月的实践,取得阶段性成果之后,他对大模型时代的创业有哪些一手认知?
本文来自百川智能创始人 & CEO 王小川在与极客公园创始人 & 总裁张鹏在近期举行的AGI Playground 大会上的访谈,经精编整理。
# 01
在中国做OpenAI跟美国的生态环境会非常的不一样
开源,是大模型的一个技术阶段。
做中国的 OpenAI 并不代表着完全要复制它完整的路径。
另外,怎么去做应用、做产品,甚至做一些更广义的技术,这可能是OpenAI的短板,或者是他们现在不是特别关注的事情。
在中国做OpenAI跟美国的生态环境会非常的不一样。
国内我们认为未来开源和闭源会有一个并行的状态。并行就有点像现在既有苹果的系统,也有安卓的系统。
# 02
开源的基础之上,中国未来有可能做一个全球最好的中文模型
Llama 和百川对比的话,明显我们现在在中文领域里面是远超 Llama 的品质。
在国内大家在用的时候不要只想着国外很好,我们现在距离OpenAI 确实更远,年底能够达到 GPT-3.5 或者接近的水准需要时间。
但在开源大模型里面我们现在已经很接近了,在中文领域现在就可以替代,也许未来还能超过 Llama,我觉得是可以做到的,我们应该有这样的自信。
# 03
百川冷启动快的背后是搜索能力和人才的积累
百川从第一天开始就是自研的,而且冷启动非常非常快。这背后的原因是什么呢?
1、我们知道高质量数据是大模型的基础,那什么公司对语言数据有广泛的理解呢?那其实搜索公司干20年,每天都在思考怎么找到这种高质量数据。
2、第二点,从人才储备来说,既要有算法能力,又要有以搜索能力为主的工程能力,这种人基本也在搜索公司。
3、做大模型还有一件事情就是评测。评测大模型好不好其实是一个痛苦的问题,包括推理的问题、精准问答的问题、创作的问题……有的变好,有的变差,怎么评价?所以这种评价体系也是搜索公司长期积累的一个能力,用评价来带动后续算法的迭代。
4、另外,创业公司又比大厂的组织效率要高很多,有非常且灵活的决策体系,所有效率就会得到最大化的体现。
# 04
AGI 的到来,一定会爆发出巨大的新物种
虽然大厂有很多人、钱、资源的优势,但组织壮大后反而会有很多很内部问题,组织效率收到了严重限制。
如果我们坚定认为 AGI 的到来,那么一定会爆发出巨大的新物种。
这些事情对创业公司来说有巨大发挥作用的机会。这个从历史推演就能论证,所以只要有AGI,未来就有新的机遇。
# 05
中国做大模型的两大难点:一是模型能力不足,二是应用难题
OpenAI 是一个以研究导向为主、在现实世界落地产品的公司。你跟着它走,研究领域可以有非常耀眼的成就。
但是今天怎么做应用,不管是 OpenAI 还是硅谷以技术驱动公司都还不是太擅长这个。我有自信中国在应用落地上比美国强很多。
全世界都到了一个转折点,现在技术已经就位,这是第一个难点;应用和需求方面是第二个难点,这一块叫做 model service(模型服务)。
所以现在的挑战是,第一,你有模型了吗?第二,有了模型就等于有了服务吗?
现在美国对于应用层比较迷茫,中国现在的问题是模型能力不足。今天很多做模型的创业公司,也是把自己的视角局限在大模型上,对其它技术栈没那么了解。
讲个最简单的例子,做模型肯定会遇到幻觉问题,时效性问题。幻觉和时效性都是光靠大模型本身能解决的。有人用扩大参数,扩大到万亿,十万亿来解决幻觉;或者用强化学习。
但其实最直接的做法就是把搜索和信息检索带进去。大模型和这些结合在一块,才能形成一个更完整的技术栈。
第二个方面,现在大模型技术逐渐实用化。然后在所谓的知识计算中,还需要加入向量数据库和搜索,才能形成更完整的技术和产品。在这个问题上,大家正在逐步形成共识。
# 06
大模型公司有没有能力做好应用,这件事中国比美国有更多看点
大模型在娱乐行业、在人物角色扮演方面有广阔前景,但这件事情需要中国公司进入才能做得更好。
另外,大模型和搜索如何结合在一起,Perplexity AI 现在做得挺好,我们则处于被动的地位,美国有机会,投资人就会找中国的对照公司。
如果这家公司,一没有大模型,只是在调用API;二没有搜索技术,只能依赖 Google、Bing 这些公司的技术,这样并不理想。
前两天 OpenAI 刚升级了 code interpreter,然后又升级了 custom instruction。对创业公司来说又形成了巨大的压力。
美国投资人也在担心,在焦虑其中还有没有机会创业公司能超过巨头,会不会做一半就被大公司取代了。
在中国的话,我觉得走大模型路线的还没有像OpenAI那样有一个占据顶端的公司出现。现在还处于“百模大战“的阶段。
今天做大模型的公司有没有能力做应用,这件事中国比美国有很多看点。
# 07
做大模型既要追求技术能力提升,又要有超级应用
为什么一定要追到GPT-4的程度?
首先是技术的跨代进步,可能对后续产品生态产生碾压式的影响。
所以在这个时候,大家应该争取在竞争激烈的领域中寻求优势。
但是在争夺优势的过程中,大家可能会面临新的困惑:到哪一代才能真正实现超级应用?
GPT-3.5在美国至今尚未形成超级应用,训练一次大约需要5000万人民币,这还不包括前期准备和实验之类的成本。GPT-4训练一次可能需要5亿人民币。到GPT-4.5代,成本可能会达5亿美元。
因此,如果没有超级应用,单纯追求技术提升也是非常危险的。
所以我们需要在这个领域同时追求第四代和第五代技术能力的提升,同时要有超级应用。
# 08
大模型的超级应用年底会水落石出
在B端里面GPT- 3 基本就已经能用了,在C端没有能用的原因我认为还是时间太短。
加之大家把目光太过聚焦在OpenAI上,它不是一个产品公司,不是一个能做超级应用的公司。
能做超级应用不仅需要技术追赶,也要对产品有一个足够的理解。
这件事我觉得年底是水落石出的时候。
# 09
技术的秘密不是在数据飞轮里面,还是时间的技术积累
今年年初在提OpenAI数据飞轮的事情,当时特别恐慌。用户的请求给了它,它知道用户要什么,然后就更好地去升级模型。
在目前看的话,这个问题并不严重。
像 Llama 2 推出之后,大家看到在微调阶段,数据要精而少,而不是精而多,现在大家开始逐步形成共识,技术的秘密不是在飞轮里面,还是时间的技术积累。
如同Claude公司的Anthropic技术实力一般,其增长速度也是相当迅速的。然而,与Anthropic相比,OpenAI的用户数量却远超前者。这一现象的出现,无疑对数据飞轮理论提出了质疑,从而使得数据飞轮的概念被证伪。
更多还是在于它的数据集里面,不管在 Pre-training阶段还是在微调阶段,怎么去搞优质的数据,如何去配比等,这是它的核心能力。
我注意到,在他们的对话中,GPT-4正在对GPT-3.5进行训练,以提高其工作效率。此外,GPT-4还在负责生成GPT-5所需的某些数据,以便进行模型迭代过程的优化。
它的迭代在内部是使在线服务更好,同时生成未来的部分数据,我觉得这是是内部的一个飞轮。
# 10
中国最后长出来的技术或应用可能都跟美国不一样
开源的、闭源的,还有应用,事实上今天大家都还在铺开来做,跟现在美国西部一样还在扩张的阶段。
在国内做搜索,比百度晚了3年,这种追赶是非常艰难的。而今天这个积累和经验放过来一看,前面都是没人的。
原来想的很难,已经晚了好几年了,但今天在我看起来处处都是机会。
我记得 2016 年 AlphaGo 之后,我当时提了两点,第一,如果(AI)能够预测下一帧视频,那就是 AGI 的到来。
但是说完之后就过了,你也没有能力去做,动力、能力、条件都没有。
所以我觉得我们自己有很多想法,并不是走在后面的。只是原来各种时机、条件不成熟。这次有机会在部分领域做到领先。
中美本来就不是一种制度,一种体系、文化,所以最后长出来的,不管是技术问题还是应用问题,都会不一样。
AI新商业·企业家特训营
北京站 第2期 正在招生中···
由一多加速工场、AI商业研究所发起的第二期AI新商业·企业家特训营线下课定于7月29日-7月30日在北京举办,感兴趣可点此了解课程详情后报名。
首期AI新商业·企业家特训营线下课,已于7月1日-7月2日在杭州成功举办。
课程由一多加速工场&AI商业研究所创始人、AI商业架构师、资深企业教练、全网首个AI分身商业博主“赵大师兄”账号主理人赵大伟老师主讲(点此了解赵老师在首期线下课的部分授课内容)。
赵大伟老师(赵大师兄)
赵老师是具有多年企业咨询和创业实战经验的企业顾问,给新希望、探路者、美的等多家企业做过咨询,也给海尔、京东、新东方、TCL等数百家企业做过培训,企业咨询与培训辅导经验相当丰富。
他的主要研究与咨询服务方向,就是基于新技术之下的传统企业转型升级,从当年的移动互联网,到后来的区块链,以及当下的人工智能,赵老师积累了丰富的新技术产业化应用方向的经验。
同时赵老师团队还实操过电商与消费品牌项目,对品牌打造、产品企划、直播运营、私域运营、渠道管理等业务实际场景有一手实战经验,对业务场景有着深刻的理解。
赵老师在AI商业领域的首部图书《AI纪元》即将面世,之前写过《分布式商业》、《互联网思维独孤九剑》(畅销40万册),对数字经济保持着持续研究。
赵老师本人还是ChatGPT、Midjourney等主流AI工具的资深玩家,其视频号“赵大师兄”发布了多条AI工具制作的爆款视频,算是AI商业领域的首个颇有影响力的AI分身商业博主,已经将AI工具引入工作流并且取得良好效果。
赵大伟老师视频号“赵大师兄”代表作品,2个月播放量近百万,受到众多学术界、产业界、投资界大咖关注在赵老师所主讲的首次课程中,30位来自消费、教育、SaaS、美业、科技等行业的企业家积极投身其中,共同营造出一个充满思维火花的交流平台,使得参与者们满载而归。
关于首期课程总结,可点此了解:拥抱AI新商业早期红利,这30位企业家已经先行一步——AI新商业•企业家特训营1期圆满结束
关于首期企业家学员的学习感受与课程评价,可参考如下视频:
点击下图 ▼ 了解课程详情
点击左下角【阅读原文】 立即报名
往期文章:
?专业人士?
➤ 人工智能教父Hinton:关于ChatGPT与AI发展的11个核心观点
➤ 读完高盛关于生成式AI的研究报告,我们帮你总结了这12个核心观点
➤ 尤瓦尔·赫拉利:关于人工智能发展的10个重要观点
➤ 国防科技大学教授胡晓峰:ChatGPT带来6大颠覆,5个能与不能,我们必须引起重视!
➤ 赵大伟:ChatGPT开启AI生产力大时代,每个创业者都需要成为AI创造家
➤ 赵大伟:关于ChatGPT引发的AI2.0 发展机遇的10个观点
➤ 中国人工智能奠基者张钹院士:只有把ChatGPT内部工作原理搞清楚,才能找到人工智能发展的“金钥匙”
➤ Nathan Baschez:AI时代,更小更快、成本更低、更富创意的创业公司组织形态已崭露头角
➤ 凯文·凯利:5000天后的人工智能时代,将会是什么样子?
?投资机构?
➤ 创新工场李开复:AI2.0时代的投资机会与典型应用场景
➤ 美国知名投资机构A16Z:关于生成式AI平台的10个核心观点
➤ 9位主流投资人眼中的ChatGPT与AI2.0,有哪些创业机会?
➤ 峰瑞资本陈石:关于AI2.0创业与投资的10个重要观点
➤ 启明创投周志峰:AI大模型的未来,是赋能万业的“水电煤”,创业机会在哪里?
➤ 知名AI投资人发文警告:我们必须放慢“上帝般AI”的发展速度
➤ 盛景嘉成王湘云:大模型时代的产业重构与创投逻辑
➤ 从OpenAI的投资的13个项目,看最有前景的AI2.0应用方向有哪些?
➤ 启明创投周志峰:我们看到的生成式AI快速发展的这些信号
➤ 经纬创投张颖:跟60多名AI创业者聊过后对于AI拐点的10点看法
?创业领袖 ?
➤ 李彦宏:ChatGPT大模型时代开启三大产业机会,10倍于移动互联网
➤ 比尔盖茨:ChatGPT是我一生中见到最具革命性的两项技术之一
➤ 英伟达CEO黄仁勋:ChatGPT类似AI界的iPhone,每个人都可以是程序员
➤ 傅盛:为什么 ChatGPT 是生产力革命?
➤ 周鸿祎:ChatGPT是革命性突破,将引发一场新的工业革命
➤ 王小川:AGI不只是工具,更是生命,通用人工智能时代已经到来
➤ Open AI创始人Sam Altman:关于ChatGPT系统设计背后的18个关键思考
➤ GPT之父、OpenAI首席科学家llya,在斯坦福大学深度访谈的10个核心观点
➤ Midjourney创始人David Holz:Midjourney成功背后的9个关键思考原创
➤ 金山办公CEO章庆元:大模型将全面颠覆软件行业
➤ OpenAI CEO Sam Altman:创业的四个必要条件–想法、团队、产品、执行
➤ OpenAI两位创始人最新访谈:关于AI典型应用场景与迎接AGI时代的相关策略
?应用场景?
➤ AI+分身:借助AI分身,女网红同时交往1000男友,预计年入4亿 | AI应用案例
➤ AI+法律:全球顶级律所Allen&Overy 旗下 3500 名律师全部用上AI产品 | AI应用案例
➤ AI+组织:网易内部AI应用实操分享 | 网易副总裁阮良:让组织像 AI一样实现自我进化
➤ AI+营销:Whale 帷幄创始人叶生晅:生成式AI应用层的最大机会是营销和游戏 | AI应用案例
AI 商业研究所
王小川, 大模型公司, 百川智能, 开源大模型
AI时代,拥有个人微信机器人AI助手!AI时代不落人后!
免费ChatGPT问答,办公、写作、生活好得力助手!
搜索微信号aigc666aigc999或上边扫码,即可拥有个人AI助手!