中国130个大模型,难超越10亿营收的ChatGPT|钛媒体深度
ChatGPT

中国130个大模型,难超越10亿营收的ChatGPT|钛媒体深度

打开凤凰新闻,查看更多高清图片 中国 AI 大模型全面“开闸”。 钛媒体App获悉,8月31日,百度(文心一言)、抖音(云雀大模型)、智谱AI(智谱清言)、中科院(紫东太初大模型)、百川智能(百川大模型)、商汤(商量SenseChat大模型)、MiniMax(ABAB大模型)、上海人工智能实验室(书生通用大模型)共8个企业/机构官方发布公告,宣布面向全社会上线大模型产品。 这是中国首批面向公众提供类似ChatGPT服务的 AI 大模型产品,大模型行业迎来关键时刻。 同时,阿里“通义千问”、360智脑以及科大讯飞“讯飞星火认知大模型”等尚未宣布全面开放,但已表示完成了备案工作,预计在未来一周左右陆续开放。 除ABAB、书生通用、紫东太初三个大模型之外,首批上线国内大模型中有5款为消费级(C端)产品,免费对外开放,有望对标成为“中国版ChatGPT”。 不过,拥有先发优势的ChatGPT,如今却开始加速商业化。据The Information 8月30日报道,创造ChatGPT大模型的OpenAI,预计在未来12个月内,通过销售人工智能软件及其计算能力,将获得超过10亿美元的收入。即便是“卖铲子”的英伟达,二季度净利润同比增长高达843%。对应的中国大模型,集体亏损、难以获得规模性收入。 钛媒体App从赛迪方面获得的一份数据显示,今年1-7月国内共发布了64个大模型。截至2023年7月,中国累计已经有130个大模型问世。 很显然,中国的130个大模型,基本难以超越已加速商业化的ChatGPT,后者营收预计达10亿美金。 8个大模型全面开放,阿里大模型1周内等待通知 今年以来,以ChatGPT为代表的 AI 大模型技术火遍全球,而在这样一个大的机遇下,百度、阿里、字节等多家国内公司陆续公布大模型产品。 今年7月13日,国家七部委联合公布《生成式人工智能服务管理暂行办法》,自2023年8月15日起施行。根据新规指导要求,AI大模型在内的生成式AI产品将面临算法备案、安全评估等两道监管手续,也称“双新评估”,只有在这两个手续都通过后,生成式AI产品才能合法上架。 随后,百度、商汤、阿里、腾讯等公司均开始进行备案过程,希望在第一批获准名单中。最终在8月31日,有8个企业/机构的 AI 大模型正式面向全社会上线。 截至钛媒体App发稿前,据七麦数据显示,8月31日,文心一言在苹果App Store应用商店下载量预估为31.3万次左右,智谱清言App则为3832次。 具体来说,据百度介绍,百度的大模型应用“文心一言”(Ernie Bot)向全社会全面开放。用户可以在应用商店下载“文心一言APP”或登陆“文心一言官网”(https://yiyan.baidu.com)体验。百度MEG群组负责人称,百度旗下各类用户侧产品正在利用大模型进行重构,百度搜索、百家号、百度文库、百度输入法等产品正在研发并陆续推出相关AI功能,未来还将推出NEWAPP等产品。 百度拥有搜索入口,通过在搜索结果顶部添加了一个“对话”按钮。单击它会弹出一个聊天窗口,允许任何人访问文心一眼,类似于微软将ChatGPT集成到其Bing搜索中的方式。 百度董事长兼首席执行官李彦宏表示,当文心一言向数以亿计互联网用户大规模开放服务后,能够获得大量真实世界中的人工反馈,这将进一步改进基础模型,并以更快速度迭代文心一言,创造更好的用户体验。 百度官方公布的数据显示,文心一言App 8月31日开放下载首日,日活跃用户超100万,过去24小时内,平台共计回复网友超3342万个问题。 据商汤介绍,即日起旗下AI聊天机器人“商量SenseChat 3.0”正式向所有用户开放,用户可通过SenseChat官网注册使用: https://chat.sensetime.com,可体验文本编辑、数理计算、编程等功能。据悉,商汤商量SenseChat 1.0于今年4月首次推出,是千亿参数的大语言模型的聊天机器人产品,拥有语义理解、多轮对话、知识掌握、逻辑推理等综合能力。 8月28日商汤披露的半年报显示,借助大装置的算力、“日日新”大模型体系的大语言模型及文生图模型研发,上半年,商汤生成式AI相关收入实现670.4%的增长,收入贡献占比超过2成。商汤预估,到2024年生成式AI业务相关收入占比预计会超30%,2025年预计将占总收入40%以上。 据百川智能介绍,旗下大模型产品“百川大模型”率先通过《生成式人工智能服务管理暂行办法》备案,今日起面向全社会开放服务,用户可以登录官网www.baichuan-ai.com进行体验。据悉,百川智能成立于今年4月10日,由前搜狗公司CEO王小川创立,成立四个月以来,百川智能相继发布了三款通用大语言模型:6月15日,百川智能发布国内首款开源可免费商用 70 亿参数量大语言模型Baichuan-7B,7月11日,发布参数量130亿的大语言模型Baichuan-13B-Base、对话模型Baichuan-13B-Chat,8月8日发布参数量530亿的大语言模型Baichuan-53B。 百川智能创始人、CEO 王小川早前向钛媒体App透露,百川智能将在今年第四季度发布千亿参数模型,预计明年一季度前后推出 “超级应用”。 据MiniMax介绍,今日起MiniMax“abab”大模型全面开放服务。用户可以登陆“MiniMax开放平台”率先体验。据称,MiniMax“abab”大模型能力适用于逻辑推理、文本续写、文案生成、内容摘要、代码生成、知识检索等大多数文本处理相关的场景,并且还提供声音大模型能力。目前,MiniMax开放平台已接入超百家付费客户,提供办公协作、互动娱乐、客服、搜索、教育等十余个行业场景。 MiniMax成立于2021年12月,由前商汤科技副总裁、通用智能技术负责人闫俊杰创立,是国内 AI 领域头部公司。据报道,今年6月,MiniMax接近完成规模超2.5亿美元的一轮融资,投资方包括腾讯、米哈游等,目前公司估值超12亿美元(约合人民币85亿元)。...
无限访问 GPT-4,OpenAI 强势推出 ChatGPT 企业版!
ChatGPT

无限访问 GPT-4,OpenAI 强势推出 ChatGPT 企业版!

原标题:无限访问 GPT-4,OpenAI 强势推出 ChatGPT 企业版! 整理 | 屠敏 出品 | CSDN(ID:CSDNnews) 继 ChatGPT 收费大降价、推出 App 版等系列动作之后,OpenAI 于今日宣布正式发布面向企业的 AI 助手——ChatGPT Enterprise 版。 与 To C 端的 ChatGPT 版本有所不同的是,该版本可以以更快速度无限制地访问 GPT-4,还可以用来处理更长输入的上下文窗口、拥有加密、企业级安全和营私以及组帐户管理功能。 具体来看,ChatGPT Enterprise 以过去九个月的更新迭代为基础,具有以下几个特性。 背靠 ChatGPT 迄今为止最强大的版本 ChatGPT Enterprise 拥有 32,000 个 token 上下文窗口,允许用户处理四倍长的输入、文件或后续操作,简单来看,这意味着它可以同时处理更多文本(或进行更长时间的对话)。token 可以被认为是单词的片段,32,000 个标记大约相当于 24,000 个单词。 目前,使用...
揭开OpenAI创业秘史,ChatGPT的真正推手原来是他
ChatGPT

揭开OpenAI创业秘史,ChatGPT的真正推手原来是他

揭秘真正的ChatGPT之父:OpenAI的秘密武器,谷歌没有的天才。作者 |  李水青编辑 |  心缘为什么全球热门应用ChatGPT诞生在OpenAI?近日,外媒The Information的一篇深度稿件试图道出原因。根据多方采访,一个长达五年的ChatGPT产品研发落地故事浮出水面,背后的第一推手也随之显现。时间追溯到2017年,OpenAI还是一家50人的非营利组织,时任OpenAI首席技术官的格雷格·布罗克曼(Greg Brockman)担心被谷歌旗下的DeepMind等对手甩在身后,因此他带头开始了一场旷日持久的作战。ChatGPT项目团队试练是在DOTA2游戏,一种很新的协作方式随之诞生,而布罗克曼则作为“游走总裁”在各个部门“搅局”,80%时间亲自下场写代码。OpenAI CEO萨姆·阿尔特曼(Sam Altman)及其他董事会成员都称他是ChatGPT产品化的第一推手、“在科技界是罕见的”、“谷歌没有这样的人”。尽管如此,他也造成了OpenAI代码的混乱,带来新的麻烦。 ▲格雷格·布罗克曼(左)和萨姆·阿尔特曼(右) 如果说阿尔特曼是OpenAI的招牌,那么布罗克曼就是OpenAI的秘密武器。布罗克曼是一个从小镇走出、从哈佛和MIT辍学创业的标准硅谷传奇人物,他在偶然的机会参与了2015年那场瑰丽酒店晚宴的OpenAI创业大筹划,而后成为OpenAI最得力的“问题解决者”。在众多项目中,他都擅长“优化OpenAI系统的速度和成本”到极致,包括ChatGPT项目。ChatGPT项目的进展并不是一帆风顺的。2017年,OpenAI由于非盈利性质面临巨大压力,创始人之一埃隆·马斯克因此退出,转而基于商业公司特斯拉做AI开发。布罗克曼是在此背景下开战DeepMind的,就像所有的AI创企面临的问题一样,AI开发成本翻番、“要理想还是面包”等问题横亘在布罗克曼面前。副总裁达里奥·阿莫迪(Dario Amodei)等人带队离职创业,也让工作更难开展,OpenAI内部一度蔓延着焦虑和担忧。 ▲萨姆·阿尔特曼(左)和埃隆·马斯克(右) 但布罗克曼的担忧并没有成为现实,相反,ChatGPT在2023年注册人数激增,让谷歌和DeepMind措手不及,追赶着开发自己的AI聊天机器人Bard。微软一直在努力将自己的AI研究转化为能够产生收入的产品,已经向OpenAI投入了数十亿美元以获得其技术,使得OpenAI成立7年估值超200亿美元。从技术展望来看,通用人工智能(AGI)系统将比ChatGPT先进得多,能够做从开创性研究到创办公司的所有事情。布罗克曼看好这一技术的前景,将和团队继续加紧研发。他说:“如果我们认为我们今天思考问题的方式会在五年后保持不变,那就太天真了。”01.ChatGPT的诞生:追溯到DOTA2游戏项目,总裁游走“搅局”一款产品的成功不是一个人的功劳,但往往有一个能力卓绝的人在主要推动。在ChatGPT产品的成功背后,人们知道有近百个全球顶尖科学家和工程师作出贡献,但鲜少听说幕后推手如何掌控全局。1、AI游戏软件项目,为ChatGPT提供研发项目范本2017年,OpenAI还是一家50人的非营利组织,时任OpenAI首席技术官的布罗克曼担心被谷歌旗下的DeepMind等对手甩在身后,因此他带头发起了一项计划:让OpenAI的研究人员和工程师协作,开发出可以玩复杂在线战斗游戏DOTA2的软件OpenAI Five。前OpenAI员工说,两个团队的职责相似——研究人员专注于训练新模型,而工程师则开发软件让这些模型工作,但在OpenAI的其他项目上,这两个团队之间的关系一直很紧张,这是科技公司内部普遍存在的一种状态。经过几个月的通宵工作,他们的软件最终在游戏中取得了成功,到2019年初,它在数千场游戏中击败了世界上最高阶的人类DOTA2玩家。这一计划的成功迅速引起了游戏和技术界轰动,并成为ChatGPT项目的模仿范本。 2、“游走”总裁:ChatGPT产品化的第一推手接近布罗克曼的人称,布罗克曼是为推动ChatGPT项目中各类技术人员实现合作贡献最大的人。ChatGPT的魔力不在于技术研发的重大突破,而在于将象牙塔里的AI技术用到了执行现实世界任务中去。与布罗克曼同为OpenAI董事会成员的问答网站Quora CEO亚当·德安吉洛(Adam D Angelo)说,过去的AI研究都大多在实验室里,要把技术转化为产品很难,布洛克曼是那个让AI成功产品化的人。虽然OpenAI的CEO萨姆·阿尔特曼(Sam Altman)是公司的形象代表,但34岁的布罗克曼是该公司的秘密武器。他是OpenAI的总裁,但没有直接下属,这让他摆脱了通常的管理苦差事;相反,他在接受The Information采访时表示,他80%的时间都花在编程上。阿尔特曼说:“格雷格有很强的能力,既能看到技术问题每一部分的极致细节,也能看到每一个层面的重点,然后还能非常战略性地思考如何把所有的部分组合在一起。”布罗克曼是一个“流动员工”,在不同的团队之间游走,设定目标,并推动他们提高软件开发效率。然后,他会转向新的项目,把这些项目交给经理管理。布罗克曼说:“我一直在‘搅局’。” ▲格雷格·布罗克曼 3、是1顶10的工程师,但也引起OpenAI代码混乱布罗克曼的做法也难以避免地带来了一些弊端。两名与布罗克曼共事过的人说,在他自己编写了项目的关键部分后,其他OpenAI工程师可能需要几个月的时间才能弄清楚布罗克曼是如何解决技术问题的。其中一名知情人士说,2022年初,布罗克曼坚持从头重写该公司用于训练模型的一个主要软件,迫使OpenAI的其他员工不得不去适应新系统。布罗克曼承认,自己插手项目,通过命令改变团队的优先事项来否决其他经理,可能会惹恼同事。他说,他已经在提高人际交往技巧,以学会少惹同事生气。“我工作方式的失败之处可能是让人感觉受到了打击。”尽管如此,布罗克曼的影响力解释了为什么其他人尊敬他。与他共事过的人形容布罗克曼是典型的“10X工程师”这是硅谷俚语,指的是比普通员工多产10倍的程序员。阿拉温德·斯里尼瓦斯(Aravind Srinivas)曾在谷歌和OpenAI工作,去年创立了人工智能搜索引擎Perplexity。他直言不讳地描述了这位前同事的影响力:“OpenAI工作最努力的人是格雷格·布罗克曼,他将编码、产品决策和团队争论结合在一起,这在科技界是罕见的。谷歌没有这样的人!”他说。02.OpenAI初创业时代:从麻省理工辍学,谋划对抗谷歌技术垄断,成为问题解决者布罗克曼来自哪里?为什么有如此的卓绝能力?这要从他的成长经历说起。1、从麻省理工辍学创业,曾在中国学编程布罗克曼在一个靠近明尼苏达州边境的一个人口约1100人的小镇长大。作为红河高中的学生,他在2006年国际化学奥林匹克竞赛中获得了银牌,在高中10年级时数学课程经达到极限,而后开始在大福克斯的北达科他州大学学习。布罗克曼说:“我的校长要求我在高中每学期上三门课,然后我可以在大学里上任何我想上的课。”2008年,布罗克曼进入哈佛大学,计划主修数学和计算机科学,在俄罗斯和中国度过Gap年期间学会了编程。但当他觉得自己无法从学校的同学那里学到更多关于软件的东西时,他就从哈佛退学了。他转到麻省理工学院,认为那里的学生更了解软件。布罗克曼的目标是成立自己的软件公司,之后他遇到了创业家帕特里克和约翰·科里森(Patrick and John Collison),支付公司Stripe的创业者,跟他一起干。2010年的一个周四,布罗克曼从麻省理工学院辍学,并于下一周的周一登上飞机,前往旧金山加入科里森夫妇的公司。布罗克曼在Stripe工作了五年,最终成为该公司的首席技术官。在此期间,Stripe经历了爆炸式增长,成为科技行业最有价值的初创公司之一。 ▲格雷格·布罗克曼 2、2015年瑰丽酒店晚宴,结识OpenAI发起者OpenAI的起源可以追溯到2015年底在瑰丽酒店(Rosewood Hotel)举行的一场晚宴,布罗克曼和十几位其他科技名人一起出席了晚宴,包括特斯拉首席执行官埃隆·马斯克(Elon Musk),以及当时的谷歌研究科学家伊利亚·苏茨克弗(Ilya Sutskever)和达里奥·阿莫代(Dario Amodei)。布罗克曼说,阿尔特曼是通过帕特里克·科里森(Patrick Collison)认识他的。当时,阿尔特曼将该项目定位为Alphabet等AI技术巨头囤积的关键平衡力量。他认为,将先进的AI交到强大的企业利益集团手中,可能会导致一项技术只惠及少数人,而不是全人类。当时布罗克曼刚离开Stripe,对这个项目很心动。OpenAI最早的支持者包括布罗克曼、阿尔特曼、马斯克、领英联合创始人里德·霍夫曼、Y Combinator创始合伙人杰西卡·利文斯顿和PayPal联合创始人彼得·蒂尔,他们共同承诺为这个新的非营利组织提供10亿美元的资金。在OpenAI的早期,每个人的职责是不固定的,有时也很平淡和普通。布罗克曼上班的第一天,就在与OpenAI的联合创始人萨茨克弗和约翰·舒尔曼(John Schulman)的头脑风暴会上四处寻找一块白板,以便在上面写字。3、成为“问题解决者”,极限优化AI系统速度和成本布罗克曼说:“我只是一个解决问题的人,花几周时间找到第一个工程问题,而后成为这个问题的解决者。”据两位相关人士透露,在OpenAI成立的头几年里,布罗克曼和萨茨克弗做出了大部分日常决策,布罗克曼管理初创公司的软件工程师,萨茨克弗监督研究人员。布罗克曼说,同时他在工作中一直在与阿尔特曼通电话。布罗克曼公司必须解决的一个难题是,如何让研究人员和工程师从同样的角度出发去工作。内部人士称,一些OpenAI工程师低估了研究人员贡献的重要性,研究人员则把工程师视为技术人员而不是科学家。但布罗克曼领导的DOTA2项目帮助打破了僵局。为了推动这项工作,布罗克曼与DOTA2的开发人员进行了数小时的电话交谈,以弄清楚如何让玩游戏的软件工作,这是一个技术挑战,因为游戏和OpenAI的算法是用不同的编程语言编写的,三位知情人士说。前员工说,这些进步也将帮助布罗克曼成为OpenAI的生成式AI模型开发的关键人物。在谷歌的研究人员发表了一篇题为《注意力机制是你所需要的(Attention Is All You Need)》的研究论文之后,这些模型的研究工作也于2017年开始。这篇论文展示了一种名为“Transformer”的深度学习模型如何帮助人们更有效地构建更大的模型。一位知情人士表示,虽然GPT主要不依赖于OpenAI的底层研究突破,但它帮助这家初创公司开发了一款不会因为数百万人使用而崩溃的产品。致力于优化OpenAI系统的速度和成本,布罗克曼称自己“痴迷于可以获得的每一点收益”。 03.AI军备竞赛打响:平息“理想和面包”之争,ChatGPT一战成名ChatGPT的诞生并非一番风顺,而是一开始就伴随着激烈的内部分歧和不断的组织震荡。1、研发成本翻番,非盈利的OpenAI面临压力2017年底,马斯克在OpenAI的办公室召开了一次会议,表达了对OpenAI的担忧。 ▲埃隆·马斯克 据一位与会者透露,当时OpenAI进展缓慢,可能输给DeepMind。马斯克担心DeepMind的技术正处于加速到无法企及的边缘。马斯克觉得,特斯拉是一家营利性公司,有能力筹到更多资金,因此能够更好地开发AGI。一些OpenAI员工则认为,马斯克这样做会助长一场将速度置于安全之上的AI军备竞赛。大家都想率先抵达AGI。纷争过后,马斯克于2018年离开OpenAI董事会。尽管闹出过一些分歧,阿尔特曼和布罗克曼还是将特斯拉创始人的评论牢记在心,尤其是在训练AI软件的成本不断上升的情况下。据此前报道,2018年OpenAI每年在谷歌云服务上的支出约为3400万美元,第二年支出直接翻番。一位直接了解相关工作的人士透露说,有一次,仅DOTA2项目团队每月在计算能力上的花费,就超过200万美元,占其当时每月计算开销预算的90%以上。但是要开发AGI,OpenAI需要更多的资金,多至数十亿美元。2、ChatGPT项目引争议,副总裁带头离职布罗克曼回忆说,他遭到了投资者的强烈怀疑,他们不愿将数百万美元投入研究性非营利组织,因为他们没有希望获得财务上的好处。“我们只是意识到这是不可能的,我们需要调整实体。”结果,OpenAI于2019年3月创建了一家营利性子公司,有可能为外部支持者带来回报,但回报上限为初始投资的100倍。阿尔特曼没有持有这家营利性部门的股权。布罗克曼说自己确实获得了股权,但没说具体持有多少,他的股份可能在一个方面限制了他对OpenAI的影响:他是OpenAI的董事会董事,公司的章程规定,在这家非营利机构的投资者和营利性子公司的投资者的利益可能出现分歧的情况下,只有没有财务股份的董事会成员才能投票。在OpenAI内部,一些员工对创建营利性部门感到不安。一些人认为OpenAI正在放弃其开发不受企业影响的AI系统的理想。最终大多数人同意了这一改变,他们认为公司领导者正试图取得平衡,让OpenAI仍然负责任地追求其创建AGI的目标。随着OpenAI不断完善GPT,它的一些员工已经对布罗克曼发布新产品的方法不再抱有幻想。例如,ChatGPT因散布错误信息和行为怪异而受到一些批评家的抨击。2020年底,由OpenAI研究副总裁达里奥·阿莫迪(Dario Amodei)领导的一群员工离职,成立了一个名为Anthropic的竞争对手。按布罗克曼的说法,与Amodei和其他Anthropic联合创始人的争论在于发布AI软件之前要等待多长时间的意识形态差异。布罗克曼更喜欢开放产品并通过客户反馈来改进它们。3、ChatGPT突然成功,布罗克曼成OpenAI功臣当ChatGPT于11月推出时,它的成功让布罗克曼措手不及。“对我们来说,我们会查看所有的缺陷——它对这个不起作用,对那个不起作用,对这个不起作用——但你有点错过了一个事实,因为它对所有事情都很有用,实际上很多人会在它身上发现令人惊讶的效用。”他说。科技行业正争相开发类似的聊天机器人。Alphabet的两个AI实验室对手DeepMind和谷歌大脑首次开始合作,试图赶上OpenAI。3月,Anthropic发布了ChatGPT的竞争对手Claude。同时,马斯克今年早些时候招募了DeepMind研究员Igor Babuschkin,以在马斯克拥有的另一家公司Twitter内推出一个新的“anti-woke”AI实验室。布罗克曼也在继续推动OpenAI的产品向前发展。3月,他对OpenAI演示了最新的AI模型GPT-4,展示了这个先进模型如何仅根据网站设计的粗略草图为网站生成代码。“如果没有他的参与,我认为整个项目的质量不会达到这种水平。”阿尔特曼说。 04.结语:穿越迷雾,OpenAI成AI创业范本随着ChatGPT一战成名,很多人开始关注背后OpenAI成功的奥秘。从The Information的讲述我们看到,这家创企实际上也面临和众多AI同行一样的问题,包括技术和产品团队磨合、理想与面包的矛盾等等,过程也很艰辛。OpenAI的成功有其自然的必然可解释的原因,能力超群而有定力的领导人是其中一个原因,组织、资本层面的因素也同时起作用,这也为国内AI创业提供了参考。来源:The Information (本文系网易新闻•网易号特色内容激励计划签约账号【智东西】原创内容,未经账号授权,禁止随意转载。) GTIC峰会预告...
昆仑万维:天工大模型含金量几何?硬科技的投资机会在哪“全球城市创业孵化指数”出炉,北京位列全球第四皇氏集团“卖子”抵债君乐宝“中特估”与AI调整后不妨积极一些?十大券商策略来了又有百元新股!双元科技明日申购 年内上市百元新股半数已破发100家企业、超2万亿元 超市吃上网络零售的香饽饽中关村发展集团党委书记、董事长赵长山:共管理母子基金37只,总规模317亿元北京AI创新赋能中心项目已投入实际运营!130亿AIGC概念股发布异动公告侃股:淘金中特估同样要踏好节奏透视一周牛熊股:“人形机器人”概念再掀热潮,最牛股丰立智能“6天5板”周涨近96%;多只地产股周内跌超20%,最熊股荣盛发展临停今年来51只百亿以上规模基金仅9只同期收益为正,明星基金经理业绩褪色何时增色?乘国企改革东风!“中西结合”+“中特估”为当前医药投资关键词,挖掘中药板块价值回归标的北京市门头沟区京西产业引导基金正式发布“机构降佣加速落地”话题谈疯了!何时降?降多少?卖方研究或正面临洗牌仁怀白酒生产企业减至1082家
天工

昆仑万维:天工大模型含金量几何?硬科技的投资机会在哪“全球城市创业孵化指数”出炉,北京位列全球第四皇氏集团“卖子”抵债君乐宝“中特估”与AI调整后不妨积极一些?十大券商策略来了又有百元新股!双元科技明日申购 年内上市百元新股半数已破发100家企业、超2万亿元 超市吃上网络零售的香饽饽中关村发展集团党委书记、董事长赵长山:共管理母子基金37只,总规模317亿元北京AI创新赋能中心项目已投入实际运营!130亿AIGC概念股发布异动公告侃股:淘金中特估同样要踏好节奏透视一周牛熊股:“人形机器人”概念再掀热潮,最牛股丰立智能“6天5板”周涨近96%;多只地产股周内跌超20%,最熊股荣盛发展临停今年来51只百亿以上规模基金仅9只同期收益为正,明星基金经理业绩褪色何时增色?乘国企改革东风!“中西结合”+“中特估”为当前医药投资关键词,挖掘中药板块价值回归标的北京市门头沟区京西产业引导基金正式发布“机构降佣加速落地”话题谈疯了!何时降?降多少?卖方研究或正面临洗牌仁怀白酒生产企业减至1082家

今年春节过后,ChatGPT 在国内走红,作为 AI 阵营的核心标的,昆仑万维股价应声而起。 年初以来,昆仑万维股价从 14.41 元持续攀升,于 5 月 5 日触及 70.66 元的年内最高点,涨幅一度达到 390%。尽管目前股价回落至 54.82 元,昆仑万维年内仍有超 280% 的上涨表现。 ” 炼大模型 ” 需要的是天量的算力支持和资金投入,这无疑考验着参与者的资金实力和技术实力。昆仑万维的研发投入和技术储备能否支撑天工大模型的研发与迭代,并进化出独特优势,仍有待时间的检验。 ” 偏科 ” 的大模型 4 月 10 日,昆仑万维宣布联合奇点智源,共同研发了号称 ” 中国第一个真正实现智能涌现 ” 的国产大语言模型—— ” 天工 “3.5。 在 AIGC 的混战江湖里,昆仑万维宣称的中国第一个真正实现智能涌现的国产语言大模型到底有多少含金量?是当下投资者最为关注的问题之一。 对于天工大模型,昆仑万维赋予了它很高的评价。 当和讯网问及与国内其他友商产品相比,天工大模型具备哪些优势和不足时,昆仑万维回复称,” 我们的大语言模型在同类产品中质量较高。天工 3.5 是中国第一个真正实现智能涌现的国产大语言模从。天工目前发布版本来看,最高已能支持 1...
国产AI巨头崛起!游戏界黑马昆仑万维,大模型天工媲美ChatGPT
天工

国产AI巨头崛起!游戏界黑马昆仑万维,大模型天工媲美ChatGPT

随着人工智能技术的飞速发展,越来越多的公司纷纷涉足大型语言模型的研发与应用。近期,昆仑万维正式发布大语言模型“天工”,宣布即日起启动邀请测试,并在官方直播中对大模型进行了现场演示。官方称,该模型已经非常接近OpenAI ChatGPT的智能水平。 这是国内继百度、阿里、商汤之后,第四家发布大语言模型的公司。不过,它对于很多人来说或许有些陌生——事实上,昆仑万维是第一批进军海外游戏市场的中国厂商,以页游研发和全球发行业务起家,旗下拥有浏览器Opera、社交娱乐平台StarX、全球移动游戏平台Ark Games等产品。 在过去的几年里,昆仑万维通过不断的技术创新与市场拓展,逐渐积累了丰富的人工智能技术资源,加上拥有全球业务布局的优势,使得其能够站在国内大型语言模型研发的最前沿。昆仑万维的“天工”大模型作为一款具有国际水平的人工智能产品,未来将在各个领域发挥巨大的价值,如自动化问答系统、聊天机器人、语音识别、自然语言处理等。 “天工”的发布,标志着昆仑万维在游戏产业基础上,成功地向人工智能领域拓展。在国内外竞争激烈的大语言模型市场中,昆仑万维凭借其独特的企业背景和技术优势,有望成为一股新的生力军。为了帮助大家更好地了解昆仑万维的“天工”大模型,接下来我们将畅想下几个实际应用场景来展示它的强大功能。 首先,在教育领域,“天工”可以通过理解学生的问题,给出合理的解答和建议,提升学生的学习效果。例如,学生可以向“天工”请教数学、物理、化学等学科的问题,从而节省了向老师请教的时间,提高学习效率。 其次,在企业客服领域,昆仑万维的“天工”大模型可以作为智能客服机器人,帮助企业提高客户满意度和降低人力成本。通过对话式的交互,智能客服机器人能够迅速解答客户的疑问,处理各种业务场景,提高客户服务质量,从而提升企业品牌形象。 再者,在新闻媒体领域,“天工”可以自动生成新闻摘要、撰写文章甚至进行机器翻译,大大提高新闻报道的效率。此外,在创意产业,如文学、广告、影视剧本等方面,“天工”可以通过生成创意文案、剧本梗概等,为行业从业者提供灵感和素材,推动产业创新。 此外,昆仑万维的“天工”大模型还可以在医疗领域、法律咨询、金融服务等多个行业发挥作用,为人们提供更加便捷、智能的服务体验。 然而,随着大型语言模型在各个领域的广泛应用,也出现了一些争议。例如,关于模型的伦理道德、数据隐私、算法偏见等问题逐渐受到关注。在这个问题上,昆仑万维及其他研发大语言模型的企业,需要不断地进行技术优化与调整,确保模型的安全性、公平性和可靠性。 如若昆仑万维的“天工”大模型能够与OpenAI的ChatGPT相近的智能水平上,那将拓宽了国内大语言模型市场的竞争格局。随着技术不断进步和应用领域的拓展,“天工”有望为人们的生活带来更多便利和惊喜。 最后,您认为“天工”将如何影响未来的社会和经济发展?在人工智能技术飞速发展的今天,我们又应该如何应对和利用这些技术带来的机遇与挑战?是否能够与ChatGPT一战呢?
昆仑万维:天工大模型含金量几何?回顾:这一次,64岁的毕福剑,不再被“宽容”
天工

昆仑万维:天工大模型含金量几何?回顾:这一次,64岁的毕福剑,不再被“宽容”

作者:徐帅今年春节过后,ChatGPT在国内走红,作为AI阵营的核心标的,昆仑万维股价应声而起。年初以来,昆仑万维股价从14.41元持续攀升,于5月5日触及70.66元的年内最高点,涨幅一度达到390%。尽管目前股价回落至54.05元,昆仑万维年内仍有超275%的上涨表现。支撑起股价上涨的最重要因素之一就是其在4月10日推出的“天工”3.5国产大语言模型。不过,欲戴王冠,必承其重。“炼大模型”需要的是天量的算力支持和资金投入,这无疑考验着参与者的资金实力和技术实力。昆仑万维的研发投入和技术储备能否支撑天工大模型的研发与迭代,并进化出独特优势,仍有待时间的检验。 “偏科”的大模型4月10日,昆仑万维宣布联合奇点智源,共同研发了号称“中国第一个真正实现智能涌现”的国产大语言模型——“天工”3.5。在AIGC的混战江湖里,昆仑万维宣称的中国第一个真正实现智能涌现的国产语言大模型到底有多少含金量?是当下投资者最为关注的问题之一。对于天工大模型,昆仑万维赋予了它很高的评价。当和讯网问及与国内其他友商产品相比,天工大模型具备哪些优势和不足时,昆仑万维回复称,“我们的大语言模型在同类产品中质量较高。天工3.5是中国第一个真正实现智能涌现的国产大语言模从。天工目前发布版本来看,最高已能支持1万字以上文本对话,实现20轮次以上用户交互,在多类问答场景中都能实现较高的输出水平,产品完成度与体验成熟度已不仅仅停留在‘尝鲜级’,而是款实际意义上的‘应用级’产品。”但从实际测试结果来看,天工大模型的表现与昆仑万维所说的“应用级”产品相比,或许还有一定的差距。4月17日,天工大模型开放了内部测试并向公众做了直播演示,直播展示了天工3.5的语义理解和数理能力,整体来看,这些展示并未带来过多惊喜,反而引来众多质疑。例如在当天的演示中,昆仑万维CEO方汉问出了蒸包子问题,“蒸一个包子需要10分钟,蒸十个呢?”第一轮天工从时间逻辑上给出了10分钟的答案;当再问100个的时候,却回答道因为蒸包子时间是固定的,所以还是10分钟。 而对比来看,百度的文心一言在问到该问题时考虑到了蒸包子的蒸锅大小,以及是否分批等问题。ChatGPT3.5则是除了蒸锅大小,甚至考虑到了功率、翻面、蒸笼里的水等问题。 图片来自网络另外,在一些测试者在公开平台上上传的测试情况来看,天工大模型在数理能力测试中表现较为吃力的情况比较普遍。例如,测试者要求制作一个工资表格,天工大模型给出了案例和计算规则,但最后的结论(实发工资一栏)全部都是不正确的。 图片来自网络不过,尽管在数理方面表现与其他更为成熟的大模型相比仍有差距,但天工也有自己的“特长”,那就是语义理解和文本写作能力。在故事续写测试中,天工的语言组织能力较为通顺,也较为符合逻辑。 图片来自网络针对天工大模型的测试结果,昆仑万维回复和讯网称当前表现是符合预期的。“天工采用了蒙特卡洛搜索树算法进行优化,这进一步提高了解码过程中的准确性和安全性,让天工在复杂任务和场景中能够快速且准确地响应指令,输出高质量回答。”同时,昆仑万维也坦言,“相对不满意的地方是,我们在数理等能力上还不是很完美,还需要迭代。” 布局AI已三年,但相关专利难寻一个值得注意的现象是,尽管昆仑万维不断强调自己属于较早一批在AI领域进行布局的企业,从2020年就开始布局AI音乐领域,但却很难查到能代表昆仑万维技术实力的专利信息。近几个月,多家相关企业陆续公布自己在AI及大模型领域申请的专利情况,昆仑万维在这方面则过于沉默。根据IPRdaily中文网发布的《中国人工智能大模型企业发明专利排行榜》,百度以602件大模型专利排名第一,阿里、字节、商汤科技等典型大模型企业也均有超过20件以上的专利数量。但在TOP50名单中,并未出现昆仑万维与奇点智源的身影。 图片来源:IPRdaily中文网数据来源:2017年1月1日至2023年3月17日在中国申请并公开的人工智能大模型专利实际上,“天工3.5”发布后,就有媒体爆料,与行业内其他企业不同,在昆仑万维科技股份有限公司下并未发现任何与大模型直接相关的专利,奇点智源下面也不存在任何专利。如果将搜索条件放宽到奇点智源大股东关联的奇点智能,还是找不到任何专利信息。和讯网针对这一技术层面的关键问题询问昆仑万维,但昆仑万维并未直接回复公司在大模型研发方面专利申请的具体情况,只是回复称:现阶段我们更专注于大语言模型本身,我们能希望潜下心认真打磨产品和技术,帮助模型进化到更高水平。大模型表现不够优秀,且缺失AIGC领域的相关专利,市场对于其“蹭热点”的质疑声越来越大。事实上,许多对A股市场科技板块了解较多的投资者很早就发现,在追逐新概念这件事上,昆仑万维的积极性和专业性都相当突出。2021年,Facebook宣布更名为“Meta”,其创始人扎克伯格表示要全力打造“元宇宙”平台。一时间,“元宇宙”成为全球金融市场的热词。就在Facebook更名的两天后,昆仑万维发布了三季度财报,在“其他重要信息”一栏中表示,Opera的游戏浏览器与游戏引擎在报告期内进一步加深结合,形成一站式的玩家和创作者社区,打造在Opera平台上创作、发行、消费游戏的闭环,加速了公司在元宇宙方向的布局。到了2022年,新能源的火热带动了储能市场井喷式发展。昆仑万维随即发布公告称,在原有投资业务板块基础上增设新能源领域投资业务板块。再到最近红得发紫的AIGC、ChatGPT,昆仑万维迅速靠拢,早在概念刚刚兴起不久的2月份,昆仑万维就火速对外宣布预计在年内发布中国版类ChatGPT代码开源。到了4月10日,公司又对外宣布,推出昆仑万维和奇点智源合作自研的国产大语言模型“天工”3.5。消息一经发出,立刻引起了资本市场与监管机构的广泛关注。仅一天后,深交所创业板公司管理部便向昆仑万维下发关注函,要求公司说明双千亿级大语言模型—“天工”3.5可能面临的风险包括但不限于商业化、运行、技术、行业等方面,以及相关表述是否准确、客观等。监管层特别提到,“我部再次提醒你公司信息披露务必真实、完整、 准确,充分提示相关风险,不得存在误导性陈述,不得利用市场热点题材进行“蹭热点”、市场操纵等违法违规行为”。字里行间,不难读出监管严厉的态度。但收到关注函的次日,昆仑万维就宣布与阿里云达成战略合作,再次释放利好,股票低开高走,收盘一举上涨12.06%。 财务状况能否支撑巨额研发?在技术能力之外,昆仑万维的财务状况能否支撑大模型的巨额研发投入,也是投资者普遍关注的问题。大模型的研发与迭代是毫无疑问的“烧钱”游戏。单看硬件方面就是一笔巨额投入,据美国市场研究机构TrendForce推算,处理ChatGPT的训练数据需要2万枚GPU芯片,而随着OpenAI进一步展开ChatGPT和其他GPT模型的商业应用,其GPU需求量将突破3万张(该报告计算以A100芯片为主)。在昆仑万维最新的业绩交流会上,昆仑万维CEO方汉透露,昆仑万维当前仅有200张卡的训练集群,合计采购约4400万美金的硬件设备。按照现在主流对大模型的理解,200张卡只是杯水车薪。在硬件之外,ChatGPT的算力成本也不容小觑,据国盛证券报告《ChatGPT需要多少算力》估算,GPT-3训练一次的成本约为140万美元,对于一些更大的LLM(大型语言模型),训练成本介于200万美元至1200万美元之间。如此“烧钱”的游戏,意味着只有手握云计算、数据资源和资金实力的几家大厂才能承担。对比起来,昆仑万维虽然重金投入研发,但由于公司体量较小,研发投入费用与行业巨头仍有较大差距。根据2022年年报,昆仑万维2022年研发投入金额仅有7.36亿元,研发投入占营业收入的比重为15.54%。截止2022年末,昆仑万维手里的货币资金为10亿元,与此同时,昆仑万维的现金及现金等价物净增额为负的5.92亿。这些研发投入及在手现金,在风起云涌一日千里的大模型赛道,恐怕难以支撑昆仑万维的野心。研发投入不足,是否会造成公司在激烈的行业竞争中处于劣势?对于这一问题,昆仑万维在给和讯网的问题回复中也并未直接回答,只是回复称,投入方面,昆仑万维有健康的现金流,作为昆仑万维三大业务板块之一,公司将继续加大相关投入,不断迭代升级模型算法,努力保持领先优势。同时探索新的商业模式,不断拓宽行业边界,并加强战略伙伴间协同合作,为公司新一轮高速增长注入动力。今年的业绩交流会上,昆仑万维CEO方汉称“我们从2020年开始投入大模型研发,2022年提出allin AIGC的口号,所以公司管理层AIGC的认知非常超前,我们在B端和C端和算法演变上有很信心,在长期中我相信我们会处于第一梯队。”但据中国移动研究院最新报告,业界普遍公认国内大模型第一梯队当属百度、阿里巴巴、腾讯、华为四家,在大模型研发投入、技术能力和人才团队实力较强,具备追赶GPT-4实力。而对于中国AIGC的未来,更有一线投资人直言,中国一定会有自己的ChatGPT,但中国版的ChatGPT只会在5家公司里产生:BAT+字节+华为,创业公司或者那些纯为了炒股价的A股上市公司很难有机会。因此,无论是从大模型的实际能力还是业内认知,昆仑万维想成为AIGC领域的第一梯队,都有很长的距离要走。
昆仑万维:天工大模型含金量几何?1988年,23岁巩俐和38岁张艺谋泳池边的照片,这一幕相当滑稽可笑
天工

昆仑万维:天工大模型含金量几何?1988年,23岁巩俐和38岁张艺谋泳池边的照片,这一幕相当滑稽可笑

作者:徐帅今年春节过后,ChatGPT在国内走红,作为AI阵营的核心标的,昆仑万维股价应声而起。年初以来,昆仑万维股价从14.41元持续攀升,于5月5日触及70.66元的年内最高点,涨幅一度达到390%。尽管目前股价回落至54.05元,昆仑万维年内仍有超275%的上涨表现。支撑起股价上涨的最重要因素之一就是其在4月10日推出的“天工”3.5国产大语言模型。不过,欲戴王冠,必承其重。“炼大模型”需要的是天量的算力支持和资金投入,这无疑考验着参与者的资金实力和技术实力。昆仑万维的研发投入和技术储备能否支撑天工大模型的研发与迭代,并进化出独特优势,仍有待时间的检验。 “偏科”的大模型4月10日,昆仑万维宣布联合奇点智源,共同研发了号称“中国第一个真正实现智能涌现”的国产大语言模型——“天工”3.5。在AIGC的混战江湖里,昆仑万维宣称的中国第一个真正实现智能涌现的国产语言大模型到底有多少含金量?是当下投资者最为关注的问题之一。对于天工大模型,昆仑万维赋予了它很高的评价。当和讯网问及与国内其他友商产品相比,天工大模型具备哪些优势和不足时,昆仑万维回复称,“我们的大语言模型在同类产品中质量较高。天工3.5是中国第一个真正实现智能涌现的国产大语言模从。天工目前发布版本来看,最高已能支持1万字以上文本对话,实现20轮次以上用户交互,在多类问答场景中都能实现较高的输出水平,产品完成度与体验成熟度已不仅仅停留在‘尝鲜级’,而是款实际意义上的‘应用级’产品。”但从实际测试结果来看,天工大模型的表现与昆仑万维所说的“应用级”产品相比,或许还有一定的差距。4月17日,天工大模型开放了内部测试并向公众做了直播演示,直播展示了天工3.5的语义理解和数理能力,整体来看,这些展示并未带来过多惊喜,反而引来众多质疑。例如在当天的演示中,昆仑万维CEO方汉问出了蒸包子问题,“蒸一个包子需要10分钟,蒸十个呢?”第一轮天工从时间逻辑上给出了10分钟的答案;当再问100个的时候,却回答道因为蒸包子时间是固定的,所以还是10分钟。 而对比来看,百度的文心一言在问到该问题时考虑到了蒸包子的蒸锅大小,以及是否分批等问题。ChatGPT3.5则是除了蒸锅大小,甚至考虑到了功率、翻面、蒸笼里的水等问题。 图片来自网络另外,在一些测试者在公开平台上上传的测试情况来看,天工大模型在数理能力测试中表现较为吃力的情况比较普遍。例如,测试者要求制作一个工资表格,天工大模型给出了案例和计算规则,但最后的结论(实发工资一栏)全部都是不正确的。 图片来自网络不过,尽管在数理方面表现与其他更为成熟的大模型相比仍有差距,但天工也有自己的“特长”,那就是语义理解和文本写作能力。在故事续写测试中,天工的语言组织能力较为通顺,也较为符合逻辑。 图片来自网络针对天工大模型的测试结果,昆仑万维回复和讯网称当前表现是符合预期的。“天工采用了蒙特卡洛搜索树算法进行优化,这进一步提高了解码过程中的准确性和安全性,让天工在复杂任务和场景中能够快速且准确地响应指令,输出高质量回答。”同时,昆仑万维也坦言,“相对不满意的地方是,我们在数理等能力上还不是很完美,还需要迭代。” 布局AI已三年,但相关专利难寻一个值得注意的现象是,尽管昆仑万维不断强调自己属于较早一批在AI领域进行布局的企业,从2020年就开始布局AI音乐领域,但却很难查到能代表昆仑万维技术实力的专利信息。近几个月,多家相关企业陆续公布自己在AI及大模型领域申请的专利情况,昆仑万维在这方面则过于沉默。根据IPRdaily中文网发布的《中国人工智能大模型企业发明专利排行榜》,百度以602件大模型专利排名第一,阿里、字节、商汤科技等典型大模型企业也均有超过20件以上的专利数量。但在TOP50名单中,并未出现昆仑万维与奇点智源的身影。 图片来源:IPRdaily中文网数据来源:2017年1月1日至2023年3月17日在中国申请并公开的人工智能大模型专利实际上,“天工3.5”发布后,就有媒体爆料,与行业内其他企业不同,在昆仑万维科技股份有限公司下并未发现任何与大模型直接相关的专利,奇点智源下面也不存在任何专利。如果将搜索条件放宽到奇点智源大股东关联的奇点智能,还是找不到任何专利信息。和讯网针对这一技术层面的关键问题询问昆仑万维,但昆仑万维并未直接回复公司在大模型研发方面专利申请的具体情况,只是回复称:现阶段我们更专注于大语言模型本身,我们能希望潜下心认真打磨产品和技术,帮助模型进化到更高水平。大模型表现不够优秀,且缺失AIGC领域的相关专利,市场对于其“蹭热点”的质疑声越来越大。事实上,许多对A股市场科技板块了解较多的投资者很早就发现,在追逐新概念这件事上,昆仑万维的积极性和专业性都相当突出。2021年,Facebook宣布更名为“Meta”,其创始人扎克伯格表示要全力打造“元宇宙”平台。一时间,“元宇宙”成为全球金融市场的热词。就在Facebook更名的两天后,昆仑万维发布了三季度财报,在“其他重要信息”一栏中表示,Opera的游戏浏览器与游戏引擎在报告期内进一步加深结合,形成一站式的玩家和创作者社区,打造在Opera平台上创作、发行、消费游戏的闭环,加速了公司在元宇宙方向的布局。到了2022年,新能源的火热带动了储能市场井喷式发展。昆仑万维随即发布公告称,在原有投资业务板块基础上增设新能源领域投资业务板块。再到最近红得发紫的AIGC、ChatGPT,昆仑万维迅速靠拢,早在概念刚刚兴起不久的2月份,昆仑万维就火速对外宣布预计在年内发布中国版类ChatGPT代码开源。到了4月10日,公司又对外宣布,推出昆仑万维和奇点智源合作自研的国产大语言模型“天工”3.5。消息一经发出,立刻引起了资本市场与监管机构的广泛关注。仅一天后,深交所创业板公司管理部便向昆仑万维下发关注函,要求公司说明双千亿级大语言模型—“天工”3.5可能面临的风险包括但不限于商业化、运行、技术、行业等方面,以及相关表述是否准确、客观等。监管层特别提到,“我部再次提醒你公司信息披露务必真实、完整、 准确,充分提示相关风险,不得存在误导性陈述,不得利用市场热点题材进行“蹭热点”、市场操纵等违法违规行为”。字里行间,不难读出监管严厉的态度。但收到关注函的次日,昆仑万维就宣布与阿里云达成战略合作,再次释放利好,股票低开高走,收盘一举上涨12.06%。 财务状况能否支撑巨额研发?在技术能力之外,昆仑万维的财务状况能否支撑大模型的巨额研发投入,也是投资者普遍关注的问题。大模型的研发与迭代是毫无疑问的“烧钱”游戏。单看硬件方面就是一笔巨额投入,据美国市场研究机构TrendForce推算,处理ChatGPT的训练数据需要2万枚GPU芯片,而随着OpenAI进一步展开ChatGPT和其他GPT模型的商业应用,其GPU需求量将突破3万张(该报告计算以A100芯片为主)。在昆仑万维最新的业绩交流会上,昆仑万维CEO方汉透露,昆仑万维当前仅有200张卡的训练集群,合计采购约4400万美金的硬件设备。按照现在主流对大模型的理解,200张卡只是杯水车薪。在硬件之外,ChatGPT的算力成本也不容小觑,据国盛证券报告《ChatGPT需要多少算力》估算,GPT-3训练一次的成本约为140万美元,对于一些更大的LLM(大型语言模型),训练成本介于200万美元至1200万美元之间。如此“烧钱”的游戏,意味着只有手握云计算、数据资源和资金实力的几家大厂才能承担。对比起来,昆仑万维虽然重金投入研发,但由于公司体量较小,研发投入费用与行业巨头仍有较大差距。根据2022年年报,昆仑万维2022年研发投入金额仅有7.36亿元,研发投入占营业收入的比重为15.54%。截止2022年末,昆仑万维手里的货币资金为10亿元,与此同时,昆仑万维的现金及现金等价物净增额为负的5.92亿。这些研发投入及在手现金,在风起云涌一日千里的大模型赛道,恐怕难以支撑昆仑万维的野心。研发投入不足,是否会造成公司在激烈的行业竞争中处于劣势?对于这一问题,昆仑万维在给和讯网的问题回复中也并未直接回答,只是回复称,投入方面,昆仑万维有健康的现金流,作为昆仑万维三大业务板块之一,公司将继续加大相关投入,不断迭代升级模型算法,努力保持领先优势。同时探索新的商业模式,不断拓宽行业边界,并加强战略伙伴间协同合作,为公司新一轮高速增长注入动力。今年的业绩交流会上,昆仑万维CEO方汉称“我们从2020年开始投入大模型研发,2022年提出allin AIGC的口号,所以公司管理层AIGC的认知非常超前,我们在B端和C端和算法演变上有很信心,在长期中我相信我们会处于第一梯队。”但据中国移动研究院最新报告,业界普遍公认国内大模型第一梯队当属百度、阿里巴巴、腾讯、华为四家,在大模型研发投入、技术能力和人才团队实力较强,具备追赶GPT-4实力。而对于中国AIGC的未来,更有一线投资人直言,中国一定会有自己的ChatGPT,但中国版的ChatGPT只会在5家公司里产生:BAT+字节+华为,创业公司或者那些纯为了炒股价的A股上市公司很难有机会。因此,无论是从大模型的实际能力还是业内认知,昆仑万维想成为AIGC领域的第一梯队,都有很长的距离要走。
昆仑万维:天工大模型含金量几何?
天工

昆仑万维:天工大模型含金量几何?

今年春节过后,ChatGPT在国内走红,作为AI阵营的核心标的,昆仑万维股价应声而起。 年初以来,昆仑万维股价从14.41元持续攀升,于5月5日触及70.66元的年内最高点,涨幅一度达到390%。尽管目前股价回落至54.05元,昆仑万维年内仍有超275%的上涨表现。支撑起股价上涨的最重要因素之一就是其在4月10日推出的“天工”3.5国产大语言模型。 不过,欲戴王冠,必承其重。“炼大模型”需要的是天量的算力支持和资金投入,这无疑考验着参与者的资金实力和技术实力。昆仑万维的研发投入和技术储备能否支撑天工大模型的研发与迭代,并进化出独特优势,仍有待时间的检验。 “偏科”的大模型 4月10日,昆仑万维宣布联合奇点智源,共同研发了号称“中国第一个真正实现智能涌现”的国产大语言模型——“天工”3.5。 在AIGC的混战江湖里,昆仑万维宣称的中国第一个真正实现智能涌现的国产语言大模型到底有多少含金量?是当下投资者最为关注的问题之一。 对于天工大模型,昆仑万维赋予了它很高的评价。 当和讯网问及与国内其他友商产品相比,天工大模型具备哪些优势和不足时,昆仑万维回复称,“我们的大语言模型在同类产品中质量较高。天工3.5是中国第一个真正实现智能涌现的国产大语言模从。天工目前发布版本来看,最高已能支持1万字以上文本对话,实现20轮次以上用户交互,在多类问答场景中都能实现较高的输出水平,产品完成度与体验成熟度已不仅仅停留在‘尝鲜级’,而是款实际意义上的‘应用级’产品。” 但从实际测试结果来看,天工大模型的表现与昆仑万维所说的“应用级”产品相比,或许还有一定的差距。 4月17日,天工大模型开放了内部测试并向公众做了直播演示,直播展示了天工3.5的语义理解和数理能力,整体来看,这些展示并未带来过多惊喜,反而引来众多质疑。 例如在当天的演示中,昆仑万维CEO方汉问出了蒸包子问题,“蒸一个包子需要10分钟,蒸十个呢?”第一轮天工从时间逻辑上给出了10分钟的答案;当再问100个的时候,却回答道因为蒸包子时间是固定的,所以还是10分钟。 而对比来看,百度的文心一言在问到该问题时考虑到了蒸包子的蒸锅大小,以及是否分批等问题。 ChatGPT3.5则是除了蒸锅大小,甚至考虑到了功率、翻面、蒸笼里的水等问题。 图片来自网络 另外,在一些测试者在公开平台上上传的测试情况来看,天工大模型在数理能力测试中表现较为吃力的情况比较普遍。 例如,测试者要求制作一个工资表格,天工大模型给出了案例和计算规则,但最后的结论(实发工资一栏)全部都是不正确的。 图片来自网络 不过,尽管在数理方面表现与其他更为成熟的大模型相比仍有差距,但天工也有自己的“特长”,那就是语义理解和文本写作能力。 在故事续写测试中,天工的语言组织能力较为通顺,也较为符合逻辑。 图片来自网络 针对天工大模型的测试结果,昆仑万维回复和讯网称当前表现是符合预期的。“天工采用了蒙特卡洛搜索树算法进行优化,这进一步提高了解码过程中的准确性和安全性,让天工在复杂任务和场景中能够快速且准确地响应指令,输出高质量回答。”同时,昆仑万维也坦言,“相对不满意的地方是,我们在数理等能力上还不是很完美,还需要迭代。” 布局AI已三年,但相关专利难寻 一个值得注意的现象是,尽管昆仑万维不断强调自己属于较早一批在AI领域进行布局的企业,从2020年就开始布局AI音乐领域,但却很难查到能代表昆仑万维技术实力的专利信息。近几个月,多家相关企业陆续公布自己在AI及大模型领域申请的专利情况,昆仑万维在这方面显得过于沉默。 根据IPRdaily中文网发布的《中国人工智能大模型企业发明专利排行榜》,百度以602件大模型专利排名第一,阿里、字节、商汤科技等典型大模型企业也均有超过20件以上的专利数量。但在TOP50名单中,并未出现昆仑万维与其合作公司奇点智源的身影。 图片来源:IPRdaily中文网 数据来源:2017年1月1日至2023年3月17日在中国申请并公开的人工智能大模型专利 实际上,“天工3.5”发布后,就有媒体爆料,与行业内其他企业不同,在昆仑万维科技股份有限公司下并未发现任何与大模型直接相关的专利,奇点智源下面也不存在任何专利。如果将搜索条件放宽到奇点智源大股东关联的奇点智能,还是找不到任何专利信息。 和讯网针对这一技术层面的关键问题询问昆仑万维,但昆仑万维并未直接回复公司在大模型研发方面专利申请的具体情况,只是回复称:现阶段我们更专注于大语言模型本身,我们能希望潜下心认真打磨产品和技术,帮助模型进化到更高水平。 大模型表现不够优秀,且缺失AIGC领域的相关专利,市场对于其“蹭热点”的质疑声越来越大。 事实上,许多对A股市场科技板块了解较多的投资者很早就发现,在追逐新概念这件事上,昆仑万维的积极性和专业性都相当突出。 2021年,Facebook宣布更名为“Meta”,其创始人扎克伯格表示要全力打造“元宇宙”平台。一时间,“元宇宙”成为全球金融市场的热词。 就在Facebook更名的两天后,昆仑万维发布了三季度财报,在“其他重要信息”一栏中表示,Opera的游戏浏览器与游戏引擎在报告期内进一步加深结合,形成一站式的玩家和创作者社区,打造在Opera平台上创作、发行、消费游戏的闭环,加速了公司在元宇宙方向的布局。 到了2022年,新能源的火热带动了储能市场井喷式发展。昆仑万维随即发布公告称,在原有投资业务板块基础上增设新能源领域投资业务板块。 再到最近红得发紫的AIGC、ChatGPT,昆仑万维迅速靠拢,早在概念刚刚兴起不久的2月份,昆仑万维就火速对外宣布预计在年内发布中国版类ChatGPT代码开源。到了4月10日,公司又对外宣布,推出昆仑万维和奇点智源合作自研的国产大语言模型“天工”3.5。 消息一经发出,立刻引起了资本市场与监管机构的广泛关注。仅一天后,深交所创业板公司管理部便向昆仑万维下发关注函,要求公司说明双千亿级大语言模型—“天工”3.5可能面临的风险包括但不限于商业化、运行、技术、行业等方面,以及相关表述是否准确、客观等。 监管层特别提到,“我部再次提醒你公司信息披露务必真实、完整、 准确,充分提示相关风险,不得存在误导性陈述,不得利用市场热点题材进行“蹭热点”、市场操纵等违法违规行为”。 字里行间,不难读出监管严厉的态度。但收到关注函的次日,昆仑万维就宣布与阿里云达成战略合作,再次释放利好,股票低开高走,收盘一举上涨12.06%。 财务状况能否支撑巨额研发? 在技术能力之外,昆仑万维的财务状况能否支撑大模型的巨额研发投入,也是投资者普遍关注的问题。 大模型的研发与迭代是毫无疑问的“烧钱”游戏。 单看硬件方面就是一笔巨额投入,据美国市场研究机构TrendForce推算,处理ChatGPT的训练数据需要2万枚GPU芯片,而随着OpenAI进一步展开ChatGPT和其他GPT模型的商业应用,其GPU需求量将突破3万张(该报告计算以A100芯片为主)。 在昆仑万维最新的业绩交流会上,昆仑万维CEO方汉透露,昆仑万维当前仅有200张卡的训练集群,合计采购约4400万美金的硬件设备。按照现在主流对大模型的理解,200张卡只是杯水车薪。 在硬件之外,ChatGPT的算力成本也不容小觑,据国盛证券报告《ChatGPT需要多少算力》估算,GPT-3训练一次的成本约为140万美元,对于一些更大的LLM(大型语言模型),训练成本介于200万美元至1200万美元之间。 如此“烧钱”的游戏,意味着只有手握云计算、数据资源和资金实力的几家大厂才能承担。 对比起来,昆仑万维虽然重金投入研发,但由于公司体量较小,研发投入费用与行业巨头仍有较大差距。根据2022年年报,昆仑万维2022年研发投入金额仅有7.36亿元,研发投入占营业收入的比重为15.54%。截止2022年末,昆仑万维手里的货币资金为10亿元,与此同时,昆仑万维的现金及现金等价物净增额为负的5.92亿。...
ChatGPT时代的著作权法走向何处?
ChatGPT

ChatGPT时代的著作权法走向何处?

当下,以ChatGPT类产品为代表的生成式人工智能技术的兴起与应用,极大地改变了著作权领域的底层创作逻辑。人工智能已经能够以超乎想象的水平和效率完成过往只能由自然人实施的创作行为——对于思想的独创性表达。而传统的著作权制度立足于“思想表达二分法”这一底层逻辑之上,即“只保护自然人思想的外在表达,而不保护思想本身”。但在渐行渐近的生成式人工智能时代,现有著作权制度如若无法对“最为宝贵的人的创造性思想”,以及“最为普遍的人工智能的独创性表达”加以有效涵摄,那么其适用价值将不可避免地被消解,其颠覆性变革也就可以预见。 一、生成式人工智能兴起与著作权理论的新思考 1. AIGC著作权问题的争议 我国理论界对于人工智能生成内容著作权问题的关注,大致源起于2018年北京市海淀区法院审理的“菲林诉百度案”和深圳市南山区法院审理的“腾讯诉网贷之家”。笔者以“人工智能+版权/著作权”为关键词在中国知网进行检索,限定文献来源为“CSSCI”,共检索到289篇文章,其中有260篇文章均为2018年后出版,亦验证了这一基本判断。虽然上述两案判决对于“人工智能生成内容”是否构成作品做出了不同的认定。但不同的判决结果归因于两个案件涉及的人工智能模型(或者说机器模型)在运行机制方面的本质差异;而在法律层面,两个判决的落脚点存在高度共识,即只有证明存在自然人的创作贡献,人工智能生成内容才会被认定为著作权法上的作品。 彼时,理论界的讨论重点聚焦于“人工智能生成内容是否受著作权法保护”这一基础问题。一部分学者持肯定态度,主要有如下理由:第一,该阶段的人工智能技术自主化程度较低,仅仅是辅助和服务人类创作的工具。第二,人工智能本质上体现的是模型设计者或训练者的创作意志和行为,只要其生成内容满足“独创性”要求即可构成作品。第三,可以借鉴早已存在且运作成熟的法人作品制度,将人工智能的所有者视为著作权人。另一部分学者则持反对态度,主要理由在于:第一,人工智能生成内容是应用算法、规则和模板的结果,不能体现创作者独特的个性。第二,人工智能的创作机理并非著作权意义上的“创作”,生成的内容也不能被认定为作品。第三,在判定客体是否具有独创性时,不仅要在客观上满足表达的形式要件,还要通过整体的主观感受判断客体是否贡献了“智力上的创新”。 2. 技术迭变赋予AIGC著作权探讨新的时代意义 2022年11月30日,美国人工智能研究公司Open AI发布了ChatGPT,在短短2个月的时间,其月度活跃用户已达1亿,成为全球互联网历史上用户增长最快的应用。自2023年3月16日百度发布“文心一言”之后,阿里、科大讯飞、商汤等企业也相继发布对标ChatGPT的生成式人工智能产品。目前,国内用户和企业尚无法注册ChatGPT账号或接入其应用程序编程接口,国产ChatGPT类产品则基本处于内测和研发阶段。但鉴于生成式人工智能技术对于内容创作和著作权制度的重大影响,相关理论探讨也便被赋予了新的时代意义。 值得注意的是,新一代生成式人工智能的发展之所以备受关注,就在于其一定程度上已经具备系统科学领域所称的“涌现能力”。所谓“涌现能力”,就是当人工智能模型参数达到一定量级之后,会突然拥有包括常识推理、问答、翻译等一系列类似人类的“智慧能力”,这朝着通用人工智能(artificial general intelligence)迈进了一大步。生成式人工智能涌现能力的出现,也解释了为什么ChatGPT类产品在内容表达上看起来已经和人类无异。就此,有学者指出,ChatGPT本质上是一个大型语言模型,是“智能搜索引擎+智能文本分析器+洗稿器”的结合,不属于法律意义上的“人”,生成的内容也不应受到著作权法的保护。也有学者表示,ChatGPT与此前人工智能的重要区别,在于存在基于人类反馈强化学习的训练,使得生成的内容融入了人类的主观偏好。因此,ChatGPT生成的作品就是人的智力成果。另有学者表示,ChatGPT生成的内容应当分情形讨论,如果人类输入的指令足够具体,则生成的内容就蕴含着人类足够具体的意思表达,应受著作权法保护。 综上来看,理论界目前对于新一代人工智能生成内容著作权问题的探讨,虽然在观点上存在明显差异,但依旧立足于既有著作权制度下“主体规则—仅限于自然人创作”和“客体规则—仅保护独创性的外在表达”的基本框架。然而,在人工智能技术发展的“奇点时刻”(singularity moment)加速来临之际,ChatGPT类产品已经超越了既往的人工智能模型应用,一定程度上可以说具有了“通用人工智能”属性或者说“类人性”。对此,我们需要审视和思考:撼动和变革既有著作权制度整套逻辑的“奇点时刻”是否已经加速到来? 二、生成式人工智能打破了著作权法的底层逻辑 从著作权法的底层逻辑来看,一方面,以ChatGPT类产品为代表的新一代生成式人工智能改变了内容创作的基本逻辑,虽然人类目前仍然可以垄断独创性的思想,但在思想的具体表达层面正逐渐被人工智能所赶超。另一方面,新一代生成式人工智能推翻了“思想表达二分”创设时的合理性前提,ChatGPT类产品通过对作品风格、灵感等进行学习,便可以输出海量的、区别于原作品的新表达形式,虽不构成著作权侵权但对在先创作者产生了现实的市场替代效应。 1. 创作层面:人类对“独创性表达的垄断”被打破 第一,各类生成式人工智能利用海量数据进行模型训练、生成最终内容的方法大体相同。首先,自监督学习。机器自己学习大数据,包括购买的数据库,公开的网站文章、电子书,电子版的报纸、杂志,以及开源社区的计算机代码等。其次,监督学习。人类把自己写的问题和答案交给机器学习,让机器学会人类说话的方式和风格。最后,人类反馈强化学习。人类会先训练一个奖励模型,它包括了对于多个答案优劣的评价,然后再用这个模型去训练和评价机器生成的内容,让机器的回答越来越接近人类的叙述方式。 以 ChatGPT 为例,其内容生成机制被形象地称为“文字接龙”,实际上是统计学“自回归”原理的具体展示:先通过模型预测下一个字,然后把预测出来的字带入模型,再去预测下一个字,不断迭代输出。而此前,传统的自然人创作是建立在自身所独有的语言理解能力之上,特定的语言与特定的文字对应以后,文字表达便通过内含的语义来传递人类的思想。当语义通过文字方式不断组合,便形成了不同的词汇、短语,进而持续扩展表达的丰富程度。久而久之,文字之间形成了特定的结构,使人们能够理解交流对象所要表达的意思,这就形成了人类的语法和语句。语句的进一步叠加出现了语段、语篇,直至成为著作权法认可的作品。由此可见,ChatGPT“自回归式”的单字内容生成机制,和人类传统意义上基于语言理解能力的创作逻辑存在本质差异。 第二,自然人创作正日益被人工智能“创作”所赶超和替代。目前,虽然ChatGPT似乎仍无法像人一样理解其输出内容的真正意义。但为何ChatGPT可以判断出下一个最可能的字是什么,并且在将这些字组成完整的内容后,看起来高度契合人类的表达逻辑和语义语法?回答这个问题,便需要我们反思,是否应当从更宏大的视角去审视著作权法上的创作行为。毕竟生成式人工智能凭借“涌现能力”重塑了创作逻辑,开辟了一条不同于自然人创作的新路径。 此外,ChatGPT等生成式人工智能产品的表达能力近乎是无限的。经过海量数据训练的大模型可以用远超人类的创作效率和艺术水平,不间断地输出高质量的内容。从目前ChatGPT类产品的商业模式来看,用户几乎可以“零成本”的方式让其随时随地协助生成内容。由此,生成式人工智能的发展应用极大地改变了人们对于著作权法上“创作”的认知。与“创作”一词直接对应的“独创性表达行为”,不再是一个被专业群体垄断的高门槛领域,普通大众在生成式人工智能的辅助下,只要拥有有价值的想法和观点,具体的表达完全可以交由机器来完成。 2. 制度逻辑层面:“思想表达二分法”的适用价值被消解 第一,“思想表达二分法”存在的正当性基础被撼动。“思想表达二分法”作为著作权制度的底层逻辑,强调著作权法只保护自然人思想的“外在表达”,而不保护“思想本身”。“思想表达二分法”的创设前提,是过去人们学习既有作品的风格、灵感进而创作出新作品的能力十分有限。即便人们可以学习他人独创性的思想,但将其付诸具体内容创作时仍存在很高的准入门槛,需要具备足够的专业技能。加之,个体学习和创作的效率与精力往往有限。因此,在过去即使不保护在先作品中的思想,也并不会导致不同主体之间利益的显著失衡。于是有观点直言,即使一个人每天看一本书,穷其一生也顶多只能阅读三万本书,并且极大可能一生也写不出一本书。而生成式人工智能的发展,则使得原本专属于人类的独创性表达,可以通过近乎零成本、无门槛的机器生产方式完成。换言之,ChatGPT类产品可以在短时间内快速“学完”人类社会海量思想、知识和风格的基础上,进行无限的、全新的内容生成。 第二,著作权领域“智力劳动合理回报机制”的失效。从内容生成机制来看,人工智能模型并不会侵犯在先作品中受著作权法保护的“外在表达”。以ChatGPT为例,其实际是在“自回归原理”下,不断学习海量在先作品中不同文字之间排列组合的概率和规律,然后内化为自身模型参数的过程。ChatGPT对于训练数据库中作品内容的学习利用,可以理解为细化到分散、海量的作品中每一个字的引用,而不会复现特定作品,甚至不会复现特定作品中的段落和语句。所以,ChatGPT实际上不存在对在先训练作品的实质性引用,从而就不会侵犯在先作品中受著作权法保护的“外在表达”。但是与在先作品风格和思想相似的人工智能生成内容,会对著作权人既有授权市场产生现实的挤出效应。加之,生成式人工智能内容生产的效率和规模远非自然人可比,由此便会进一步放大上述的市场替代效应。目前发生的典型案例,是全球各地的艺术家起诉Midjourney等人工智能绘画平台利用在先美术作品投喂机器、进行模型训练,并大规模生成和特定艺术家风格相一致的画作在市场上抛售。 著作权制度的目标在于“对人类智力劳动合理回报机制的设计”。然而生成式人工智能的模型研发、商业应用主体,通过“利用既有作品风格思想,进而输出全新表达”的内容生成机制,借由提供商业服务和技术接口等方式盈利,但没有把这些利益分配给在先作品的权利人。著作权制度本应体现的合理回报机制在此出现了缺位,从而在事实上导致了内容上下游之间的利益失衡。 三、生成式人工智能挑战了著作权法的基础规则 从著作权制度的基础规则来看,鉴于ChatGPT类产品生成内容的效率远高于人类,未来其或将逐渐成为全社会知识内容的生产主体,而著作权法仅对“源于自然人创作的内容”加以保护,由此其适用价值便受到挑战。同时,生成式人工智能对于他人作品训练利用的行为难以归入现有著作权专有权利的范畴,著作权领域传统的“授权许可模式”因此也面临落地难的现实困境。 1. 权利主体层面:“只保护自然人创作”的制度基础受到挑战 第一,AI或将成为全社会信息内容的生产主体。以ChatGPT类产品为代表的新一代生成式人工智能的兴起,打破了自著作权制度诞生以来长久的共识——内容生产特别是作品创作,是自然人专属智慧的体现。当下,生成式人工智能的迅猛发展,正在使“创作”与“人类的表达”快速解耦。内容创作从“大脑构思+手工表达”转变为“人脑思考+机器表达”。由此,人们设想的内容创作领域大规模工业化的场景也将加速来临。有研究发现,ChatGPT在2023年1月的内容输出能力为3.1亿单词每分钟。而据谷歌公司此前统计,自1440年古登堡印刷机发明以来,全社会出版了约1.298亿本书。每本书估算有5万个单词,总共约有6.5万亿单词。由此,按照ChatGPT目前的内容生产能力,几乎每14天便可以输出相当于人类全部印刷作品的内容量。虽然笔者没有找到这一研究之外类似的数据,但即便延长到14个月甚至更长的时间维度,这依旧是一个令人兴奋的发展趋势。由此,我们可以预想,未来生成式人工智能输出的内容将会成为全社会信息内容的主体。 第二,难以规制AIGC将导致著作权法适用价值的消弭。长久以来,各国著作权法均坚持“只保护自然人创作”的基本理念,即内容生成过程中只有存在自然人的创作性贡献,才会被认定为作品并受著作权法保护。但从目前ChatGPT类产品的内容生成机制来看,存在难以证明具备自然人创作贡献的事实困境。著作权法保护的是自然人的独创性表达,也即对创作元素最终和具体的选择安排。但是在人们向生成式人工智能输入“prompts”进而直接输出内容的过程中,对于创作元素最终和具体的选择安排,恰恰是由人工智能“模型黑箱”而非使用人工智能的用户来实际完成的。2023年3月16日,美国版权局发布了专门的指南,表示“ChatGPT类产品生成的内容,因为难以证明存在自然人的创作性贡献,所以不构成作品,不受到版权法保护”。长期以来,完全由自然界、动物产生的内容素材都不会被认定为著作权法上的作品,如猕猴自拍、风力侵蚀形成的石像等。在我国,现行《著作权法》对作品和作者的规定是,“作品是指文学、艺术和科学领域内具有独创性并能以一定形式表现的智力成果”“创作作品的自然人是作者”。自然人以外的动物以及作为机器模型的生成式人工智能均不能成为创作主体,生成内容也无法构成作品。 当下,虽然说在“人机协作模式”之下,创作者可以通过对人工智能自动生成的内容“改编”(增加包含人类独创性贡献的内容)或汇编(内容的选择或者编排上体现独创性)等方式间接获得保护。但是,伴随ChatGPT类产品内容生成能力的不断提升,未来社会绝大多数有价值且被广泛利用的信息内容可能都是由人工智能生成。囿于著作权法“只保护自然人创作”的底层逻辑,上述内容却难以享有著作权。与此同时,受著作权法保护的人类作品却存在内容体量小、使用占比低、市场价值弱等现实问题。 2. 客体权利层面:“先授权、再利用”的传统范式被颠覆 第一,“授权许可”难以实行。著作权作为一种法定权利,不同于物权等自然权利,是在法律上人为创设的一项权利,是为了激励内容创作和知识传播,从社会公有领域中为著作权人划出的一块保护区。为了平衡权利人和社会公众间的利益,著作权法仅赋予创作者授权和规制落入法定权利范畴的作品利用行为,比如复制、发行、信息网络传播等。但生成式人工智能模型对于他人作品思想、风格层面的“学习训练行为”实际难以落入既有著作权法专有权利的规制范畴。既无权利,何来授权?表面来看,生成式人工智能模型的“学习训练行为”类似于自然人阅读文字作品、欣赏美术作品后的思考、吸收及再创作行为,和既有的著作权专有权利无法对应。若著作权法对于生成式人工智能时代最为普遍和重要的作品利用行为——机器学习或者说模型训练难以规制,那么“授权许可模式”在实操层面也便失去了现实意义。深入思考可以发现,生成式人工智能模型的“学习训练行为”作用对象是在先作品中的“思想”而非著作权法所保护的“表达”。在“思想表达二分法”规则之下,模型“学习训练行为”在纳入著作权权利框架上存在障碍。 即便打破“思想表达二分法”的制度屏障,将模型“学习训练行为”纳入著作权专有权利范畴,亦仍将面临权利价值缺位的现实问题,即著作权人难以对ChatGPT类产品未经授权的“学习训练行为”加以有效规制。其原因在于,著作权人存在发现模型侵权、举证模型侵权以及侵权内容比对等方面的困境,对此后文将具体阐释。由此来看,或许需要从根本上反思著作权法既有赋权和授权规则,以适应生成式人工智能时代的到来。 第二,“合理使用”亦无空间。对于人工智能模型训练阶段未经授权的作品“学习训练行为”而言,从现有著作权法“合理使用制度”角度考察,责任豁免的探讨似乎也缺乏实际意义。合理使用的制度设计在于,对本身构成著作权侵权的行为,基于特定公共利益的考量,在符合一定要求后予以侵权责任豁免。但生成式人工智能模型的作品“学习训练行为”是对于作品思想风格的学习利用,难以落入著作权专有权规制的范畴。既然目前上述作品利用行为本身不受著作权法规制、不构成著作权侵权,合理使用的责任豁免便无从谈起。论及机器学习领域合理使用问题,则不得不提及“谷歌图书馆案”。早在2004年,谷歌公司便将数字化后的图书存放于服务器中,供用户以“检索有限文字片段的方式”发现所需图书。谷歌上述提供作品片段的行为虽落入“复制权”范畴,但美国法院最终认定上述利用行为不构成对原有图书市场的替代。对于ChatGPT类产品而言,前文已述,其内容生成机制实际是“学习在先作品中不同文字之间排列组合的概率,并细化到分散、海量作品中单字的引用”。因此,生成式人工智能输出的内容基本不涉及作品(甚至作品片段)的复制利用,相较“谷歌图书馆”而言,“侵权传播”概率更低,“市场替代”影响更小,“转换使用”程度更高。 四、生成式人工智能否定了著作权法的救济机制 从著作权制度的救济机制来看,生成式人工智能模型训练阶段的作品利用行为,本质上是一种机器内部的非外显性利用,著作权人在实践中往往会遭遇举证不能和侵权判定难的问题。而平台责任领域立基于“内容传播环节”的“避风港制度”,面对“内容生成环节”的ChatGPT类产品的模型研发和商业应用平台,其适用价值也难以为继。 1. 侵权标准层面:“接触+实质性相似”的判定规则失效...
ChatGPT爆火这半年:热钱、巨头与监管
ChatGPT

ChatGPT爆火这半年:热钱、巨头与监管

原标题:ChatGPT爆火这半年:热钱、巨头与监管 出品 | 虎嗅科技组 作者 | 陈伊凡 齐健 头图 | 电影《华尔街之狼》 经历了半年的AI洗礼,或许很难找到比“应激反应”更恰当的词,来形容今天科技行业中每个人的状态——紧张、刺激、压力。 “应激反应”, 是指生物体在遭遇外部环境压力或威胁时,为了维持身体的稳态而产生的一系列反应。它是生物为了适应环境、确保生存所产生的一种自然反应。这种反应可以是短暂的,也可以是长期的。 7月26日,OpenAI官方推特宣布,安卓版ChatGPT已在美国、印度、孟加拉国和巴西提供下载,并计划在近期推广至更多国家。ChatGPT正在拓展渠道,获得更多的用户和更强的使用粘性,生成式AI的浪潮在持续推高。 7月初,上海的2023世界人工智能大会(WAIC)上,一位大模型创业公司的技术人员正在展厅里穿梭,她计划为公司寻找一个性价比高的国产芯片解决方案,用来做大模型训练。 “我们有1000张A100,但完全不够。”她告诉虎嗅。 A100是英伟达的一款高端GPU,也是ChatGPT生长的硬件基础。一些公开数据显示,在训练GPT系列模型的过程中,OpenAI所使用的英伟达GPU数量约2.5万个。由此,要做大模型,要先评估能拿到多少张A100的显卡,几乎成了这个行业的惯例。 哪里有GPU?哪里有便宜算力?这只是2023WAIC大会上众多问题的缩影。 过去半年里所有被“应激”到的人,几乎都渴望能够在这场“盛会”中找到更多关于AI的答案。 2023WAIC现场 一家芯片展商的技术人员告诉虎嗅,在WAIC大会的几天里,他们的“大模型”展台前,来了好些产品经理,他们希望在这里为公司的大模型业务寻找产品定义。 5月28日在中关村论坛上,中国科学技术信息研究所发布的《中国人工智能大模型地图研究报告》显示,截至5月底,中国10亿级参数规模以上的大模型发布了79个。在此后的两个月里,又有阿里云的通义万相、华为云的盘古3.0、有道“子曰”等一系列AI大模型发布,据不完全统计目前国内的AI大模型已超过100个。 国内企业争先恐后发布AI大模型的动作,就是“应激反应”最好的体现。这种“反应”带来的焦虑,正在传导给行业里几乎所有相关人员,从互联网巨头的CEO到AI研究机构的研究员,从创投基金合伙人到AI公司的创始人,甚至是很多AI相关的法律从业者,以及数据、网络安全的监管层。 对行业之外的人而言,这可能只是短暂的狂欢,但在如今,又有多少人敢说自己置身AI之外。 AI正在开启一个新时代,一切都值得用大模型重塑一遍。越来越多的人开始思考技术扩散之后的结果。 资金涌入,飞轮已现 ChatGPT诞生的一个月内,出门问问创始人李志飞两赴硅谷,逢人必谈大模型,在与虎嗅交谈时,李志飞直言这是他最后一次“All in”。 2012年,李志飞创立出门问问,这家以语音交互、软硬件结合为核心的人工智能公司经历了中国两次人工智能浪潮的起伏。在上一波人工智能最火热的那一段时间,出门问问的估值一度被推至独角兽级别,但此后也经历了一段落寞期,直到ChatGPT的出现,才给沉寂多年的人工智能行业撕开了一道口子。 在一级市场,“热钱正在涌进来。” 这是过去半年中,谈及大模型时的行业共识。奇绩论坛创始人陆奇认为,AI大模型是一个“飞轮”,未来将是一个模型无处不在的时代,“这个飞轮已经启动”,而最大的推动力就是资本。 7月初,商业信息平台Crunchbase发布的数据显示,分类为AI的公司在2023年上半年筹集了250亿美元,占全球融资的18%。虽然这一数字与2022年上半年的290亿美元相比有所下降,但2023年上半年全球各行业的总融资额比2022年同比下降了51%,由此可见AI领域的融资额在全球融资总额中的占比,几乎提高了一倍。Crunchbase在报告中这样写到:“如果没有ChatGPT引发的人工智能热潮,2023年的融资额会更低。” 到目前为止,2023年AI行业最大的一笔融资,就是微软在1月对OpenAI投资的100亿美元。 虎嗅根据公开数据统计,在美国的大模型公司创业中,Inflection AI或将成为人工智能领域融资量仅次于Open AI的第二大初创公司,在其之后分别是,Anthropic(15亿美元),Cohere(4.45亿美元)、Adept(4.15亿美元)、Runway(1.955亿美元)、Character.ai(1.5亿美元)和Stability AI(约1亿美元)。 在中国,2023年上半年国内人工智能行业的公开投融资事件共有456起。而这项统计在2018年-2022年的5年间分别是731、526、353、631和648。 上半年国内人工智能行业公开投融资事件 另一个引发飞轮的事件则是ChatGPT放出API接口。当OpenAI在3月首次开放ChatGPT的API接口时,AI行业内外对此几乎形成共识:行业要变天了。随着更多应用接入大模型,AI之上正在长出更加繁茂的森林。 “做大模型和做应用本身就应该分开”,投资人的嗅觉总是敏锐的,在源码资本执行董事陈润泽看来,AI是一个与半导体分工一样的逻辑,AI大模型的繁荣之后,很快就会看到AI应用的一波繁荣。 今年年初,陈润泽与同事一起前往硅谷时发现,硅谷声名显赫的创业孵化器Y Combinator(OpenAI首席执行官Sam Altman曾在这家孵化器任总裁多年),有一半的项目都转型做生成式AI了。对于大模型的热情,丝毫不逊于如今大洋彼岸的中国。 不过,他也发现在美国无论是资本还是创业者,相比于大模型创业,更看好基于大模型所做的生态应用,毕竟在这个赛道,已经跑出了诸如OpenAI这样的公司,与此同时,美国有很强的ToB应用生态土壤,因此更多的美国公司正在尝试基于大模型的生态做企业应用。...