中国130个大模型,难超越10亿营收的ChatGPT|钛媒体深度
ChatGPT

中国130个大模型,难超越10亿营收的ChatGPT|钛媒体深度

打开凤凰新闻,查看更多高清图片 中国 AI 大模型全面“开闸”。 钛媒体App获悉,8月31日,百度(文心一言)、抖音(云雀大模型)、智谱AI(智谱清言)、中科院(紫东太初大模型)、百川智能(百川大模型)、商汤(商量SenseChat大模型)、MiniMax(ABAB大模型)、上海人工智能实验室(书生通用大模型)共8个企业/机构官方发布公告,宣布面向全社会上线大模型产品。 这是中国首批面向公众提供类似ChatGPT服务的 AI 大模型产品,大模型行业迎来关键时刻。 同时,阿里“通义千问”、360智脑以及科大讯飞“讯飞星火认知大模型”等尚未宣布全面开放,但已表示完成了备案工作,预计在未来一周左右陆续开放。 除ABAB、书生通用、紫东太初三个大模型之外,首批上线国内大模型中有5款为消费级(C端)产品,免费对外开放,有望对标成为“中国版ChatGPT”。 不过,拥有先发优势的ChatGPT,如今却开始加速商业化。据The Information 8月30日报道,创造ChatGPT大模型的OpenAI,预计在未来12个月内,通过销售人工智能软件及其计算能力,将获得超过10亿美元的收入。即便是“卖铲子”的英伟达,二季度净利润同比增长高达843%。对应的中国大模型,集体亏损、难以获得规模性收入。 钛媒体App从赛迪方面获得的一份数据显示,今年1-7月国内共发布了64个大模型。截至2023年7月,中国累计已经有130个大模型问世。 很显然,中国的130个大模型,基本难以超越已加速商业化的ChatGPT,后者营收预计达10亿美金。 8个大模型全面开放,阿里大模型1周内等待通知 今年以来,以ChatGPT为代表的 AI 大模型技术火遍全球,而在这样一个大的机遇下,百度、阿里、字节等多家国内公司陆续公布大模型产品。 今年7月13日,国家七部委联合公布《生成式人工智能服务管理暂行办法》,自2023年8月15日起施行。根据新规指导要求,AI大模型在内的生成式AI产品将面临算法备案、安全评估等两道监管手续,也称“双新评估”,只有在这两个手续都通过后,生成式AI产品才能合法上架。 随后,百度、商汤、阿里、腾讯等公司均开始进行备案过程,希望在第一批获准名单中。最终在8月31日,有8个企业/机构的 AI 大模型正式面向全社会上线。 截至钛媒体App发稿前,据七麦数据显示,8月31日,文心一言在苹果App Store应用商店下载量预估为31.3万次左右,智谱清言App则为3832次。 具体来说,据百度介绍,百度的大模型应用“文心一言”(Ernie Bot)向全社会全面开放。用户可以在应用商店下载“文心一言APP”或登陆“文心一言官网”(https://yiyan.baidu.com)体验。百度MEG群组负责人称,百度旗下各类用户侧产品正在利用大模型进行重构,百度搜索、百家号、百度文库、百度输入法等产品正在研发并陆续推出相关AI功能,未来还将推出NEWAPP等产品。 百度拥有搜索入口,通过在搜索结果顶部添加了一个“对话”按钮。单击它会弹出一个聊天窗口,允许任何人访问文心一眼,类似于微软将ChatGPT集成到其Bing搜索中的方式。 百度董事长兼首席执行官李彦宏表示,当文心一言向数以亿计互联网用户大规模开放服务后,能够获得大量真实世界中的人工反馈,这将进一步改进基础模型,并以更快速度迭代文心一言,创造更好的用户体验。 百度官方公布的数据显示,文心一言App 8月31日开放下载首日,日活跃用户超100万,过去24小时内,平台共计回复网友超3342万个问题。 据商汤介绍,即日起旗下AI聊天机器人“商量SenseChat 3.0”正式向所有用户开放,用户可通过SenseChat官网注册使用: https://chat.sensetime.com,可体验文本编辑、数理计算、编程等功能。据悉,商汤商量SenseChat 1.0于今年4月首次推出,是千亿参数的大语言模型的聊天机器人产品,拥有语义理解、多轮对话、知识掌握、逻辑推理等综合能力。 8月28日商汤披露的半年报显示,借助大装置的算力、“日日新”大模型体系的大语言模型及文生图模型研发,上半年,商汤生成式AI相关收入实现670.4%的增长,收入贡献占比超过2成。商汤预估,到2024年生成式AI业务相关收入占比预计会超30%,2025年预计将占总收入40%以上。 据百川智能介绍,旗下大模型产品“百川大模型”率先通过《生成式人工智能服务管理暂行办法》备案,今日起面向全社会开放服务,用户可以登录官网www.baichuan-ai.com进行体验。据悉,百川智能成立于今年4月10日,由前搜狗公司CEO王小川创立,成立四个月以来,百川智能相继发布了三款通用大语言模型:6月15日,百川智能发布国内首款开源可免费商用 70 亿参数量大语言模型Baichuan-7B,7月11日,发布参数量130亿的大语言模型Baichuan-13B-Base、对话模型Baichuan-13B-Chat,8月8日发布参数量530亿的大语言模型Baichuan-53B。 百川智能创始人、CEO 王小川早前向钛媒体App透露,百川智能将在今年第四季度发布千亿参数模型,预计明年一季度前后推出 “超级应用”。 据MiniMax介绍,今日起MiniMax“abab”大模型全面开放服务。用户可以登陆“MiniMax开放平台”率先体验。据称,MiniMax“abab”大模型能力适用于逻辑推理、文本续写、文案生成、内容摘要、代码生成、知识检索等大多数文本处理相关的场景,并且还提供声音大模型能力。目前,MiniMax开放平台已接入超百家付费客户,提供办公协作、互动娱乐、客服、搜索、教育等十余个行业场景。 MiniMax成立于2021年12月,由前商汤科技副总裁、通用智能技术负责人闫俊杰创立,是国内 AI 领域头部公司。据报道,今年6月,MiniMax接近完成规模超2.5亿美元的一轮融资,投资方包括腾讯、米哈游等,目前公司估值超12亿美元(约合人民币85亿元)。...
阿里达摩院免费开放100件AI专利;字节推出大模型MBTI测试结果;ChatGPT自定义功能扩展免费丨AIGC大事日报
ChatGPT

阿里达摩院免费开放100件AI专利;字节推出大模型MBTI测试结果;ChatGPT自定义功能扩展免费丨AIGC大事日报

1、小米大模型首次曝光 2、小米:涉及AI深度合成服务 App需提供资质 3、阿里达摩院宣布免费开放100件AI专利许可 4、微软新研究支持GPT-4对空调进行工业控制 5、ChatGPT自定义功能扩展至免费用户 6、英伟达发布CALMAI模型 可模拟50亿个人体动作 7、字节推出大模型MBTI测试结果 GPT-4是INTJ 8、中国移动:已有1500人专做模型算法 9、中国移动:正规划建设亚洲最大智算中心 10、百度网盘推出智能助理 “云一朵” 11、云天励飞:公司大模型正处于研发阶段 12、盛通股份:在积极探索教育行业垂直大模型 13、易点天下:内测AI电商视频广告工具可提效10倍 14、明略科技开源TensorBoard.cpp 15、数字小镇New50论坛上线 基于360智脑打造 16、阅文推出AI网文场景功能“筑梦岛” 17、网易云音乐正式上线“私人DJ”功能 18、阿根廷软件巨头拟投资10亿美元建立AI业务 19、AI服务器受限CoWoS封装“有单出不了货” 20、美国AI软件公司Hive AI寻求2亿美元融资 21、丹麦Vifa将推搭载ChatGPT的音箱 22、芯向荣发布AI大模型训推一体计算系统 23、湖北算力与大数据产业联盟成立 1、小米大模型首次曝光 小米大模型MiLM-6B近日现身C-Eval、CMMLU大模型评测榜单。截至当前,MiLM-6B在C-Eval总榜单排名第十、同参数量级排名第一,在CMMLU中文向大模型排名第一。得分方面,在C-Eval评估中,MiLM-6B 的平均分为60.2。 打开凤凰新闻,查看更多高清图片 2、小米:涉及AI深度合成服务 App需提供资质 据IT之家报道,小米公司8月10日发布关于《深度合成服务增加资质索要场景》的公告,公告表示“为了促进生成式人工智能健康发展和规范应用,网信办等七部门联合公布了《生成式人工智能服务管理暂行办法》,依此《办法》,小米应用商店近期将对深度合成服务增加资质索要场景,涉及此类AI服务的App需要符合一系列资质标准”。 3、阿里达摩院宣布免费开放100件AI专利许可 8月11日,在浙江省专利公开实施政策公布会上,阿里达摩院(湖畔实验室)宣布向社会免费开放100件AI专利许可,用于支持中小微企低成本使用AI。据悉,100件AI专利许可将被纳入全国首批专利公开实施清单,在浙江知识产权交易中心上架,覆盖了图像技术、视频技术、3D视觉等诸多AI技术领域,不乏“交通信号灯感知”“疑似侵权图片检测”、“时序数据预测”、“点云数据处理”“智能字幕生成”等富有广阔应用场景的专利。 发明专利《交通信号灯感知方法、装置、设备及存储介质》,基于交叉注意力机制,对各种目标特征向量进行融合处理,从而得到目标所在的交通信号灯感知结果,可用于智能交通场景;发明专利《一种疑似侵权产品图片的检测方法及装置》,基于阿里电商平台的治理经验,采用了局部特征匹配算法,可有效识别疑似侵权图片。 值得一提,此次免费开放的专利中有3件是专门针对癌症的精准治疗,解决其中关键的医疗图像配准问题,应用于“图像引导的放射治疗”、“纵向病灶量化”、“基于图谱的分割以及多模态融合的计算机辅助诊断”,其开放将帮助更多医院打造癌症治疗的全流程智能解决方案,推动癌症精准治疗的技术成果转化。 4、微软新研究支持GPT-4对空调进行工业控制 据机器之心报道,最近,微软亚洲研究院提出可以将LLM用于工业控制,而且仅需少量示例样本就能达成优于传统强化学习方法的效果。该研究尝试使用GPT-4来控制空气调节系统(HVAC),得到了相当积极的结果。研究团队设计了一种机制来从专家演示和历史交互挑选示例,还设计了一种可将目标、指示、演示和当前状态转换为prompt的prompt生成器。然后,再使用生成的prompt,通过LLM来给出控制。 5、ChatGPT自定义功能扩展至免费用户 OpenAI 8月10日发推文宣布,除了欧盟和英国外,其他地区ChatGPT用户现可免费使用自定义指令功能。该功能于今年7月21日面向Plus付费用户推出,支持用户自定义ChatGPT的个性化回复方式、偏好等,并在后续对话中记住这些设置。 6、英伟达发布CALMAI模型...
ChatGPT爆火!中国版即将面世?今天,这家公司官宣→
ChatGPT

ChatGPT爆火!中国版即将面世?今天,这家公司官宣→

人工智能聊天程序ChatGPT推出仅两个月,活跃用户就已突破1亿。针对近期不断刷屏的ChatGPT,国内互联网大厂会有何动作?今天,百度对外证实了其正在研发类似ChatGPT项目,官宣项目名为“文心一言”(ERNIE Bot),并称目前该产品在做上线前的冲刺准备工作,预计三月份完成内测,面向公众开放。 就在百度官宣“文心一言”前几个小时,谷歌也正式宣布了其聊天机器人Bard。上周,谷歌、Meta、苹果等硅谷科技巨头在其财报电话会上反复提及“人工智能”“生成式AI”“机器学习”等词。 近年来,大模型、AIGC在人工智能领域早已是公认方向,在ChatGPT诞生之前,谷歌、百度等企业也披露过类似的技术进展,只是一直未引起过全球范围广泛关注。 去年9月,百度CEO李彦宏曾表示,人工智能发展在“技术层面和商业应用层面,都有方向性改变”。市场分析人士推测,这或许暗示了百度在生成式AI领域早有动作。 市场传出百度或将研发类似ChatGPT产品后,百度股价一路走高。7日,百度官宣“文心一言”后,港股股价盘中拉升17%。美东时间周二,美股开盘,百度股价涨超10%。 转载请注明“央视财经”你会关注“高启强”亲述!导演揭秘!《狂飙》爆火背后,这些故事鲜为人知→=͟͟͞暴=͟͟͞͞雪=͟͟͞͞!=͟͟͞͞暴=͟͟͞͞雨=͟͟͞͞!或波及超29个省市区!范围最大、强度最强!这些地方需警惕→已致超5000人死亡!“空中援助走廊”已建立!中国救援队,出征→至少185次余震!20人趁乱越狱!奥运会冠军求援!最新消息汇总→是否有中国公民在地震中伤亡?刚刚,外交部回应→ 来源:央视财经(ID:cctvyscj) 监制:柯成韵本文编辑:戴苑君 持续关注!↓↓↓
昆仑万维:天工大模型含金量几何?硬科技的投资机会在哪“全球城市创业孵化指数”出炉,北京位列全球第四皇氏集团“卖子”抵债君乐宝“中特估”与AI调整后不妨积极一些?十大券商策略来了又有百元新股!双元科技明日申购 年内上市百元新股半数已破发100家企业、超2万亿元 超市吃上网络零售的香饽饽中关村发展集团党委书记、董事长赵长山:共管理母子基金37只,总规模317亿元北京AI创新赋能中心项目已投入实际运营!130亿AIGC概念股发布异动公告侃股:淘金中特估同样要踏好节奏透视一周牛熊股:“人形机器人”概念再掀热潮,最牛股丰立智能“6天5板”周涨近96%;多只地产股周内跌超20%,最熊股荣盛发展临停今年来51只百亿以上规模基金仅9只同期收益为正,明星基金经理业绩褪色何时增色?乘国企改革东风!“中西结合”+“中特估”为当前医药投资关键词,挖掘中药板块价值回归标的北京市门头沟区京西产业引导基金正式发布“机构降佣加速落地”话题谈疯了!何时降?降多少?卖方研究或正面临洗牌仁怀白酒生产企业减至1082家
天工

昆仑万维:天工大模型含金量几何?硬科技的投资机会在哪“全球城市创业孵化指数”出炉,北京位列全球第四皇氏集团“卖子”抵债君乐宝“中特估”与AI调整后不妨积极一些?十大券商策略来了又有百元新股!双元科技明日申购 年内上市百元新股半数已破发100家企业、超2万亿元 超市吃上网络零售的香饽饽中关村发展集团党委书记、董事长赵长山:共管理母子基金37只,总规模317亿元北京AI创新赋能中心项目已投入实际运营!130亿AIGC概念股发布异动公告侃股:淘金中特估同样要踏好节奏透视一周牛熊股:“人形机器人”概念再掀热潮,最牛股丰立智能“6天5板”周涨近96%;多只地产股周内跌超20%,最熊股荣盛发展临停今年来51只百亿以上规模基金仅9只同期收益为正,明星基金经理业绩褪色何时增色?乘国企改革东风!“中西结合”+“中特估”为当前医药投资关键词,挖掘中药板块价值回归标的北京市门头沟区京西产业引导基金正式发布“机构降佣加速落地”话题谈疯了!何时降?降多少?卖方研究或正面临洗牌仁怀白酒生产企业减至1082家

今年春节过后,ChatGPT 在国内走红,作为 AI 阵营的核心标的,昆仑万维股价应声而起。 年初以来,昆仑万维股价从 14.41 元持续攀升,于 5 月 5 日触及 70.66 元的年内最高点,涨幅一度达到 390%。尽管目前股价回落至 54.82 元,昆仑万维年内仍有超 280% 的上涨表现。 ” 炼大模型 ” 需要的是天量的算力支持和资金投入,这无疑考验着参与者的资金实力和技术实力。昆仑万维的研发投入和技术储备能否支撑天工大模型的研发与迭代,并进化出独特优势,仍有待时间的检验。 ” 偏科 ” 的大模型 4 月 10 日,昆仑万维宣布联合奇点智源,共同研发了号称 ” 中国第一个真正实现智能涌现 ” 的国产大语言模型—— ” 天工 “3.5。 在 AIGC 的混战江湖里,昆仑万维宣称的中国第一个真正实现智能涌现的国产语言大模型到底有多少含金量?是当下投资者最为关注的问题之一。 对于天工大模型,昆仑万维赋予了它很高的评价。 当和讯网问及与国内其他友商产品相比,天工大模型具备哪些优势和不足时,昆仑万维回复称,” 我们的大语言模型在同类产品中质量较高。天工 3.5 是中国第一个真正实现智能涌现的国产大语言模从。天工目前发布版本来看,最高已能支持 1...
游戏公司的大模型好用吗?实测天工3.5水平
天工

游戏公司的大模型好用吗?实测天工3.5水平

01 游戏行业竞相入局AI 从游戏人物角色设计、环境辅助生成到NPC对话、分支剧情设计等等应用,而游戏行业被普遍认为是AI赋能的确定性受益者,AI技术在游戏生产的上、中、下游环节均可提供助力。 对游戏厂商而言,AIGC其实不是一个陌生概念。厂商们在探索工业化开发管线的过程中,实则已经探索AIGC技术多年。例如,美国游戏厂商Rockstar,之前在旗下游戏《侠盗猎车手5》和《荒野大镖客2》的NPC交互、人物建模、环境渲染等环节,均使用了AIGC技术辅助开发。 在这样的大趋势下,游戏企业布局AI技术也就不足为奇了。如腾讯已有自主研发的“混元”AI大模型,并将AI技术定位为推进业务发展的“加速器”,有着较为清晰的布局方向和后续应用场景:除了通过AIGC技术辅助游戏开发创作外,还将在社交、广告、内容创作、数字人等场景应用AI技术。另一头部厂商网易此前则在2022年年报中提到,公司自2018年起启动GPT模型研究,已自研数十个超大规模预训练模型,目前公开的大模型仅有伏羲实验室研发的“玉言”大模型。 而除腾讯、网易两大游戏圈巨擘外,昆仑万维、巨人网络、汤姆猫等国内知名游戏企业同样积极布局AI生态,自身“降本增效”的同时,更能在AI游戏时代攫取更多话语权,这其中,游戏厂商选择自研大模型的毕竟是少数,而昆仑万维自宣布和奇点智源合作推出自研“天工”AI大模型后就备受市场关注,这一热度更是随着“天工3.5”大语言模型的出现而攀升至巅峰。 02 承载昆仑万维野心的天工3.5 “中国第一个真正实现智能涌现的国产大语言模型”——昆仑万维对“天工3.5”的评价极高,而在大语言模型混战的当下,昆仑万维更是在近期预告旗下大模型“天工”邀测的公告中直接叫板友商称,自己才是“中国第一个真正实现智能涌现的国产大语言模型”,友商则依赖“定向优化”、“人工打补丁”来“覆盖特定题库”。对于“天工3.5”,昆仑万维更是毫不掩饰地称天工大模型“已经非常接近OpenAI ChatGPT的智能水平”。之所以把这个版本命名为天工3.5,就是因为ChatGPT是基于GPT3.5大模型。 如此高调出厂,显然充分调起了广大网友的兴趣,有有幸通过内测申请后,笔者第一时间就对“天工3.5”定位进行了问询。根据首界面显示,“天工3.5”语言大模型自称“天工AI助手”并表示“作为一款大型语言模型,我拥有强大的自然语言处理和智能交互能力,能够智能答、聊天互动.创作文本等等。并且我有丰富的知识储备,涵盖科学、技术、文化、艺术、历史等领域。希望我能帮助到你。” “天工3.5”语言对话界面同其他大语言模型类似,除自我介绍和热门话题外,就是底部的聊天输入框了。当笔者以“同ChatGPT3.5、文心一言、阿里通义等大语言模型相比,天工3.5处于怎样的水平?”为问题,向天工AI助手提问时,天工AI助手的回答还是相当低调的。 天工AI助手虽然没有明确答复三款大语言模型高下,而是反复强调“天工3.5”的优秀,不过明确表明“天工3.5在处理长文本和复杂任务方面具有更强的能力”,这让笔者非常好奇“天工3.5”在这两部分的表现。 03 “长文本能力”检验:没有想象的强 汉语言文学本身博大精深,大部分语言模型都能在“帮我写一篇赞美‘秋天’的文章”“高考前15天应该如何环节孩子紧张、焦虑情绪”等开放式命题中取得不错的成绩,但一旦需要大语言模型对语义、语境进行分析乃至品读时,往往很难取得让人满意的结果。 在“长文本能力”检验环节,我们首先通过一道古诗词鉴别题目测试“天工3.5”对于长文本语义、语境的理解,本身古诗词句意在网络上也有大量的语料可供查询,按理说比较简单的题目,“天工3.5”的答案却让人大跌眼镜。 显然,“天工3.5”没有理解“下列哪一首诗句不属于送别诗?”的题目,虽然给出答案A属于送别诗,可同笔者最终想要的答案多少有些牛头不对马嘴的感觉。而古诗词含义测试未能通过,笔者还是决定再给“天工3.5”一次机会,尝试让它完成一道长文本的语序排列题目。 问题和前面的古诗词一样,“天工3.5”并不能很好的理解题目的意思,即便是小学4年级的语文语序题目,“天工3.5”也没办法给出参考答案和建议。当然,在面对“帮我写一篇有关重庆夏天的文章”一类开放式题目的时候,“天工3.5”还是能够给出一份让人满意的答案。 从“长文本能力”检验能力环节可以看出,“天工3.5”对于限定范围的语句、语序理解上,同人们一贯以来的认知还有一段相当大的差距。 04 “复杂任务能力”检测:未通过并不意外 在“复杂任务”处理方面,更多时候数学思维题目往往能体现各家AI语言大模型的能力,尤其是数学思维这块,即便是人脑也存在“数论决定下限,组合决定上限”的说法,目前笔者测试过的ChaGPT3.5、文心一言、通义大模型中,暂时没有任何一款语言大模型能够通过相对复杂的数论和组合题目,而“天工3.5”在这一块的测试上也不出意外的没有通过。 无论从分析方法还是答案看,“天工3.5”都没有正确的理解题意并且完成正确答案的验算。尝试着将数学思维题目难度降低,让“天工3.5”计算相对基础的环形跑道问题,因为涉及多次相遇和速度差、顺时针等语言问题,“在400米的环形跑道上,甲、乙两人同时从某地出发,按顺时针方向跑步甲每秒跑5米,乙每秒跑4米,两人每跑100米,都要停10秒钟那么甲第二次追上乙需要的时间是多少秒?”这道题目也可以算是复杂的任务,可从“天工3.5”的答案可以看出,其挑战复杂数学问题再次失败。 接下来我们不断尝试将题目化简,直至“一条环形跑道长 400 米,小青每分钟跑 260 米,小兰每分钟跑 210 米,两人同时出发同向而行,经过多少分钟追上?”,可非常遗憾的是即便将环形跑道问题化简到如此,“天工3.5”依旧无法演算出正确答案。 05 “开放性问题”检验:工整但无优势 “长文本能力”和“复杂任务能力”两个“天工3.5”自认为较擅长的领域测试中,其给出的结果显然达不到人们的预期目标,无论是对题目本身的理解还是面对复杂问题时给出的解决办法,“天工3.5”都多少让人有些失望。而在“开放性问题”检验,我们也尝试使用“高考最后15天如何快速提分?”“高考失利的话应该如何选择今后的路?”这样的问题去考察“天工3.5”的逻辑思维能力是否清晰。 显然,在面对开放式的问题时,“天工3.5”还是能够给出条例、逻辑清楚的答案,对于广告文案撰写、简单文本写作等应用,“天工3.5”还是能够较好地满足用户所需,不过话题又回到最开始,如果“天工3.5”只是能够实现人机对话并在开放语境下才能给出答案,恐怕很难体现出其生产力属性以及同其他语言大模型相比的差异性。 06 期待语言大模型的差异化 回顾过去一年多少回见,大模型的诞生宣告了整个人工智能进入全新的重工业时代。而从文心一言开始,国内大语言模型进入热闹非凡、阵营林立的百家争鸣时代。据不完全统计,在ChatGPT发布后的短短4个月时间里,已经有至少30个国内研发机构与企业在ChatGPT发布之后纷纷推出自己品牌的大模型与相关产品。一时间,整个产业圈热闹纷呈、争先恐后, “类ChatGPT”漫天飞舞,“国内首发”比比皆是。 浮华之下,真正的生产力属性与差异化又在哪里?单从人机对话来讲,早在智能音响混战时,人机对话就已经普及,尤其是各智能手机品牌嵌入的语音助手,完全可以在功能上同这些语言大模型相重叠。相比之下,国内大语言模型的根又在哪里? 单从商业模式上看,ChatGPT已经明确指向API、订阅制和战略合作(嵌入微软Bing、Office等软件)三种营收方式,且已在用户数据积累、产品布局和生态建设层面充分领先;Google虽有意追赶,但由于聊天机器人这样的产品形态对于其主营的搜索引擎业务的助益有限,因此在与搜索引擎结合方面较为审慎,更希望借助大模型能力开展“模型即服务”范式,开拓其当前市占率较低的云服务业务的市场空间。 在这样的大环境下,国内大语言模型们,或许是时候思考下自己未来的定位和发展方向了。
昆仑万维,天工背后
天工

昆仑万维,天工背后

图片来源@视觉中国 文|科技新知 一季度财报的发布,让昆仑万维再次逼近涨停。2023年还未过半,但A股的“妖股”年榜上定会有其一席之地。 拉开昆仑万维的周线图,从开年至今,仅有3周收了绿线,累计涨幅超过300%,且跌势未显。 夸张涨势的背后,离不开ChatGPT的推波助澜。 4月10日,昆仑万维宣布,联合奇点智源共同研发了号称“中国第一个真正实现智能涌现”的国产大语言模型——“天工”3.5,并Diss友商靠的是人工打补丁、定向优化方式,并没有真正实现人工智能,甚至还斥巨资买下了ChatGPT.cn作为域名。 产品命名无不透露昆仑万维的自信。官方介绍,汉语中天工有两层意思,其一是,在古代天工是天的任职,代天行职事。其二是,天然形成的高超技艺,与“人工”相对。 不过细看昆仑万维近些年的业务发展情况,以及天工的实际表现乃至技术储备,不难发现其基本面并不稳妥,布局大模型更经不住逻辑上的推敲。 从一个热点到另一个热点 昆仑万维可以算得上是一家被游戏耽误了的媒体公司,从元宇宙到新能源,再到现在的GPT,近几年只要是行业级别的大热点,都少不了它的身影。 2007年,从千橡世纪离职的周亚辉,成立昆仑万维后,开始专注于网页游戏的开发,一直到2015年在深交所挂牌上市。彼时,昆仑万维的游戏收入占比达97%,公司IPO募集的13亿元也基本用于游戏的研发和代理,是一家不折不扣的游戏公司。 不过在上市不久后,昆仑万维便开始不同领域的跨界收购,动作不断。 2016年1月,昆仑万维以9300万美金的价格购买同性交友平台Grindr 61.53%的股份;12月,公司以10.2亿元收购北京闲徕互娱网络科技有限公司51%股份,后者为地方休闲文化竞技平台。同年,昆仑万维还联合360公司以12.3亿美元的交易对价全资收购来自挪威的浏览器厂商Opera。 “资本买手”逐渐取代游戏开发者的角色,从趣店到映客再到快看漫画、达达、8H床垫等等,甚至张大奕的如涵电商也有其身影。 到了近两年,昆仑万物的动作似乎转变到了新领域的跨界探索。 2021年,Facebook宣布更名为“Meta”,自此全球挂起一阵元宇宙风。而就在其更名的两天后,昆仑万维发布了三季度财报,在“其他重要信息”一栏中表示,Opera的游戏浏览器与游戏引擎在报告期内进一步加深结合,形成一站式的玩家和创作者社区,打造在Opera平台上创作、发行、消费游戏的闭环,加速了公司在元宇宙方向的布局。 “蹭热点”的速度之快令人咂舌,自然也收到了深交所的关注函,要求其说明关于元宇宙的种种问题,而彼时昆仑万维一句“2019年就开始布局元宇宙,元宇宙项目已经产生了一定体量的收入流水”,再次博得了资本市场无限关注。 到了2022年,新能源的火热带动了储能市场井喷式发展。昆仑万维随即发布公告称,在原有投资业务板块基础上增设新能源领域投资业务板块。同时宣布通过子公司出资3亿元获得绿钒新能源60%的股权,并将其纳入并表,值得一提的是投资标的公司仅仅成立两个月。 如今ChatGPT火爆全球,昆仑万维如法炮制,一边积极回复深交所的大量询问,一边发布相关产品,并且表示“天工”大模型是其与奇点智源合作自研,而奇点智源布局大模型已有两年。 上市至今,如此密集的投资动作背后,细看昆仑万维的财务数据,也就不难理解为什么它会一直走在蹭热点的第一线。 并购战略的利弊两端 就目前来看,昆仑万维本质上已经没什么支撑性业务了。原有的主业游戏收入濒危,高溢价收购的几项业务包装成了新的主营,但也几乎没有高成长性。 2015年上市后到2021年的一段时间,昆仑万维几番并购扩张后,收入规模较上市之初翻了一倍。不过有意思的是,这种高速增长,往往只发生在并购完成的当年。 比如,2017年在Grindr、闲徕互娱等投资业务的加持下,昆仑万维营收同比增长了42%。但其后三年,增速则分别只有4%、3%、-26%(2020年Grindr转让出表)。 无独有偶,2021年StarMaker、Opera并表后,昆仑万维营收大幅增长77.01%,但到了2022年营收增速又降至-2.33%。2023年一季度同比虽略增长2.04%,但净利润却大幅下滑43.33%。 由此可见,昆仑万维并购的新业务,根本就没有持续成长性。其收入的增长,全赖并购扩表营造的增长假象。 而在这种舍本逐末的战略下,昆仑万维昔日主业游戏收入,也已从2016年的19.56亿,下滑至2022年的7.27亿元,占总收入15%,同比下降6.3%。 同时,过度依赖投资收益的弊端逐渐显现。 进入2022年后,昆仑万维的投资业务成为累赘。年报显示,2022年净利润同比下降25%至11.53亿元。其中,投资收益同比减少91.53%至1.41亿元。2023年第一季度实现投资相关收益0.91亿元,同比减少1.81亿元。 最需要注意的还是,持续扩大对外投资规模,致使昆仑万维积累了巨额的商誉,恐有减值风险。截止2022年,高达39.34亿的商誉对于昆仑万维而言,绝不是个小数字。 作为产生商誉最高的Opera,虽然目前尚未计提商誉减值。不过,这就像一把“达摩克利斯之剑”始终悬于昆仑万维的头顶,投资者不得不谨慎。 另外,商誉是由企业并购产生的。但事实上,昆仑万维的对外投资,大部分都没有形成控制,因此也就没有并表,而是作为一项金融资产体现在财报上。 截至2022年底,昆仑万维净资产145.43亿元。其中,其他非流动金融资产高达78.76亿,较期初的58.89亿元增加近20亿元。官方解释称,“主要原因是新增投资和公允价值上升所致。” 通常情况下,这种以获利为目的的投资,只有被投标的真的能顺利上市,投资方才能顺利退出获利。而现实往往是,对外投资多数都成了一笔烂账,鲜有“接盘侠”登场。 所以这昆仑万维一半的金融资产背后,究竟价值几何值得重新审视,每年实现的大规模公允价值收益,更需要客观看待。 当然,相比之前的元宇宙、新能源,这次的GPT似乎更能为其带来实质改变,只是昆仑万维能成为逆天改命的幸运儿吗? 野望还需硬实力 4月17日,天工大模型开放了内部测试并向公众做了直播演示。可是自从网友见证了ChatGPT的强大后,天工3.5的这些展示并未带来惊喜,甚至一些错误让人错愕。 例如在演示中昆仑万维CEO方汉问出了蒸包子问题,“蒸一个包子需要10分钟,蒸十个呢?”第一轮天工从时间逻辑上给出了10分钟的答案;当再问100个的时候,却回答道因为蒸包子时间是固定的,所以还是10分钟。 而对比来看,百度的文心一言在问到该问题时考虑到了蒸包子的蒸锅大小,以及是否分批等问题。 ChatGPT3.5除了蒸锅大小,甚至考虑到了功率、翻面、蒸笼里的水等问题。 另外,在后续网友的内测中,几乎也清一色地得出“强文弱理”的结论。天工3.5能很快写出一首押韵诗以及完成一条广告文案,但在回答一些鸡兔同笼的数学题上会偶然出错。 大模型的真实实力也可从专利数量以及专利质量上看出一二。大多数自研大模型的企业会有模式设计、数据处理、模型应用等相关技术专利。 但企查查显示,在昆仑万维科技股份有限公司为数不多的专利信息中,并未发现大模型相关专利,而与其联合研发的北京奇点智源科技有限公司也没有任何相关专利信息。 最后,从资金上也能看出昆仑万维的AI窘境。...
这可能是关于昆仑万维天工模型,最详尽的一次评测了
天工

这可能是关于昆仑万维天工模型,最详尽的一次评测了

导语:天工作为国产大语言模型,在中文语境和特定场景下,其表现优于ChatGPT3.5。然而,在逻辑推理、代码分析和长对话能力方面,与ChatGPT3.5和Chat GPT4相比仍有明显差距。 01 天工模型背景 昆仑万维天工大模型自 4 月 17 日宣布启动邀测,官方宣布:天工是由昆仑万维(SZ:300418)和奇点智源合作自研、中国第一个真正实现智能涌现的国产大语言模型。 “大”模型有一个重要的特性“涌现”。所谓涌现现象就是在越过了某个参数量和头尾数据量后,其能力曲线就会陡然提升,包括但不限于知识库的扩大和推理能力的提升。 昆仑万维表示天工用到了两个千亿模型 —— 千亿预训练基座模型和千亿 RLHF(Reinforcement Learning from Human Feedback)模型。 而其中的 RLHF 就是“涌现”能力的最重要由来。千亿级别的 RLHF 或许是未来模型进步的最重要模块。 LLM(大语言模型)的新范式:RLHF (Reinforcement Learning from Human Feedback) ,即以强化学习方式依据人类反馈优化语言模型。 RLHF 需要收集大量高质量的人类偏好数据,包括人工生成的文本和对模型输出的排名标签。除此之外,RLHF 还需要处理标注者的偏见和不一致以及模型输出的有害或不真实的风险。 总体来说,相较于传统算法,RLHF 需要更多的人工标注和数据清洗以向模型提供充足的带标注的文本数据(又或者是图片数据以训练多模态模型)。 本次天工还有一个重要宣传点为:超过20轮的对话能力和1万字以上的长篇文本记忆能力。这也是当前大部分国产模型最为欠缺的。 之前测试文心一言和 ChatGLM 的时候也表现出了明显的记忆丢失现象。而长记忆能力也是大语言模型的“涌现”现象的一个表征。本文也将着重于测试这项能力。 02 模型能力测试 本次测试我们主要将天工与 ChatGPT3.5做对比。在部分较难问题(ChatGPT3.5 和天工均无法完成),会引入当前公认最强大语言模型 ChatGPT4 作为参考模型。...
昆仑万维:天工大模型含金量几何?回顾:这一次,64岁的毕福剑,不再被“宽容”
天工

昆仑万维:天工大模型含金量几何?回顾:这一次,64岁的毕福剑,不再被“宽容”

作者:徐帅今年春节过后,ChatGPT在国内走红,作为AI阵营的核心标的,昆仑万维股价应声而起。年初以来,昆仑万维股价从14.41元持续攀升,于5月5日触及70.66元的年内最高点,涨幅一度达到390%。尽管目前股价回落至54.05元,昆仑万维年内仍有超275%的上涨表现。支撑起股价上涨的最重要因素之一就是其在4月10日推出的“天工”3.5国产大语言模型。不过,欲戴王冠,必承其重。“炼大模型”需要的是天量的算力支持和资金投入,这无疑考验着参与者的资金实力和技术实力。昆仑万维的研发投入和技术储备能否支撑天工大模型的研发与迭代,并进化出独特优势,仍有待时间的检验。 “偏科”的大模型4月10日,昆仑万维宣布联合奇点智源,共同研发了号称“中国第一个真正实现智能涌现”的国产大语言模型——“天工”3.5。在AIGC的混战江湖里,昆仑万维宣称的中国第一个真正实现智能涌现的国产语言大模型到底有多少含金量?是当下投资者最为关注的问题之一。对于天工大模型,昆仑万维赋予了它很高的评价。当和讯网问及与国内其他友商产品相比,天工大模型具备哪些优势和不足时,昆仑万维回复称,“我们的大语言模型在同类产品中质量较高。天工3.5是中国第一个真正实现智能涌现的国产大语言模从。天工目前发布版本来看,最高已能支持1万字以上文本对话,实现20轮次以上用户交互,在多类问答场景中都能实现较高的输出水平,产品完成度与体验成熟度已不仅仅停留在‘尝鲜级’,而是款实际意义上的‘应用级’产品。”但从实际测试结果来看,天工大模型的表现与昆仑万维所说的“应用级”产品相比,或许还有一定的差距。4月17日,天工大模型开放了内部测试并向公众做了直播演示,直播展示了天工3.5的语义理解和数理能力,整体来看,这些展示并未带来过多惊喜,反而引来众多质疑。例如在当天的演示中,昆仑万维CEO方汉问出了蒸包子问题,“蒸一个包子需要10分钟,蒸十个呢?”第一轮天工从时间逻辑上给出了10分钟的答案;当再问100个的时候,却回答道因为蒸包子时间是固定的,所以还是10分钟。 而对比来看,百度的文心一言在问到该问题时考虑到了蒸包子的蒸锅大小,以及是否分批等问题。ChatGPT3.5则是除了蒸锅大小,甚至考虑到了功率、翻面、蒸笼里的水等问题。 图片来自网络另外,在一些测试者在公开平台上上传的测试情况来看,天工大模型在数理能力测试中表现较为吃力的情况比较普遍。例如,测试者要求制作一个工资表格,天工大模型给出了案例和计算规则,但最后的结论(实发工资一栏)全部都是不正确的。 图片来自网络不过,尽管在数理方面表现与其他更为成熟的大模型相比仍有差距,但天工也有自己的“特长”,那就是语义理解和文本写作能力。在故事续写测试中,天工的语言组织能力较为通顺,也较为符合逻辑。 图片来自网络针对天工大模型的测试结果,昆仑万维回复和讯网称当前表现是符合预期的。“天工采用了蒙特卡洛搜索树算法进行优化,这进一步提高了解码过程中的准确性和安全性,让天工在复杂任务和场景中能够快速且准确地响应指令,输出高质量回答。”同时,昆仑万维也坦言,“相对不满意的地方是,我们在数理等能力上还不是很完美,还需要迭代。” 布局AI已三年,但相关专利难寻一个值得注意的现象是,尽管昆仑万维不断强调自己属于较早一批在AI领域进行布局的企业,从2020年就开始布局AI音乐领域,但却很难查到能代表昆仑万维技术实力的专利信息。近几个月,多家相关企业陆续公布自己在AI及大模型领域申请的专利情况,昆仑万维在这方面则过于沉默。根据IPRdaily中文网发布的《中国人工智能大模型企业发明专利排行榜》,百度以602件大模型专利排名第一,阿里、字节、商汤科技等典型大模型企业也均有超过20件以上的专利数量。但在TOP50名单中,并未出现昆仑万维与奇点智源的身影。 图片来源:IPRdaily中文网数据来源:2017年1月1日至2023年3月17日在中国申请并公开的人工智能大模型专利实际上,“天工3.5”发布后,就有媒体爆料,与行业内其他企业不同,在昆仑万维科技股份有限公司下并未发现任何与大模型直接相关的专利,奇点智源下面也不存在任何专利。如果将搜索条件放宽到奇点智源大股东关联的奇点智能,还是找不到任何专利信息。和讯网针对这一技术层面的关键问题询问昆仑万维,但昆仑万维并未直接回复公司在大模型研发方面专利申请的具体情况,只是回复称:现阶段我们更专注于大语言模型本身,我们能希望潜下心认真打磨产品和技术,帮助模型进化到更高水平。大模型表现不够优秀,且缺失AIGC领域的相关专利,市场对于其“蹭热点”的质疑声越来越大。事实上,许多对A股市场科技板块了解较多的投资者很早就发现,在追逐新概念这件事上,昆仑万维的积极性和专业性都相当突出。2021年,Facebook宣布更名为“Meta”,其创始人扎克伯格表示要全力打造“元宇宙”平台。一时间,“元宇宙”成为全球金融市场的热词。就在Facebook更名的两天后,昆仑万维发布了三季度财报,在“其他重要信息”一栏中表示,Opera的游戏浏览器与游戏引擎在报告期内进一步加深结合,形成一站式的玩家和创作者社区,打造在Opera平台上创作、发行、消费游戏的闭环,加速了公司在元宇宙方向的布局。到了2022年,新能源的火热带动了储能市场井喷式发展。昆仑万维随即发布公告称,在原有投资业务板块基础上增设新能源领域投资业务板块。再到最近红得发紫的AIGC、ChatGPT,昆仑万维迅速靠拢,早在概念刚刚兴起不久的2月份,昆仑万维就火速对外宣布预计在年内发布中国版类ChatGPT代码开源。到了4月10日,公司又对外宣布,推出昆仑万维和奇点智源合作自研的国产大语言模型“天工”3.5。消息一经发出,立刻引起了资本市场与监管机构的广泛关注。仅一天后,深交所创业板公司管理部便向昆仑万维下发关注函,要求公司说明双千亿级大语言模型—“天工”3.5可能面临的风险包括但不限于商业化、运行、技术、行业等方面,以及相关表述是否准确、客观等。监管层特别提到,“我部再次提醒你公司信息披露务必真实、完整、 准确,充分提示相关风险,不得存在误导性陈述,不得利用市场热点题材进行“蹭热点”、市场操纵等违法违规行为”。字里行间,不难读出监管严厉的态度。但收到关注函的次日,昆仑万维就宣布与阿里云达成战略合作,再次释放利好,股票低开高走,收盘一举上涨12.06%。 财务状况能否支撑巨额研发?在技术能力之外,昆仑万维的财务状况能否支撑大模型的巨额研发投入,也是投资者普遍关注的问题。大模型的研发与迭代是毫无疑问的“烧钱”游戏。单看硬件方面就是一笔巨额投入,据美国市场研究机构TrendForce推算,处理ChatGPT的训练数据需要2万枚GPU芯片,而随着OpenAI进一步展开ChatGPT和其他GPT模型的商业应用,其GPU需求量将突破3万张(该报告计算以A100芯片为主)。在昆仑万维最新的业绩交流会上,昆仑万维CEO方汉透露,昆仑万维当前仅有200张卡的训练集群,合计采购约4400万美金的硬件设备。按照现在主流对大模型的理解,200张卡只是杯水车薪。在硬件之外,ChatGPT的算力成本也不容小觑,据国盛证券报告《ChatGPT需要多少算力》估算,GPT-3训练一次的成本约为140万美元,对于一些更大的LLM(大型语言模型),训练成本介于200万美元至1200万美元之间。如此“烧钱”的游戏,意味着只有手握云计算、数据资源和资金实力的几家大厂才能承担。对比起来,昆仑万维虽然重金投入研发,但由于公司体量较小,研发投入费用与行业巨头仍有较大差距。根据2022年年报,昆仑万维2022年研发投入金额仅有7.36亿元,研发投入占营业收入的比重为15.54%。截止2022年末,昆仑万维手里的货币资金为10亿元,与此同时,昆仑万维的现金及现金等价物净增额为负的5.92亿。这些研发投入及在手现金,在风起云涌一日千里的大模型赛道,恐怕难以支撑昆仑万维的野心。研发投入不足,是否会造成公司在激烈的行业竞争中处于劣势?对于这一问题,昆仑万维在给和讯网的问题回复中也并未直接回答,只是回复称,投入方面,昆仑万维有健康的现金流,作为昆仑万维三大业务板块之一,公司将继续加大相关投入,不断迭代升级模型算法,努力保持领先优势。同时探索新的商业模式,不断拓宽行业边界,并加强战略伙伴间协同合作,为公司新一轮高速增长注入动力。今年的业绩交流会上,昆仑万维CEO方汉称“我们从2020年开始投入大模型研发,2022年提出allin AIGC的口号,所以公司管理层AIGC的认知非常超前,我们在B端和C端和算法演变上有很信心,在长期中我相信我们会处于第一梯队。”但据中国移动研究院最新报告,业界普遍公认国内大模型第一梯队当属百度、阿里巴巴、腾讯、华为四家,在大模型研发投入、技术能力和人才团队实力较强,具备追赶GPT-4实力。而对于中国AIGC的未来,更有一线投资人直言,中国一定会有自己的ChatGPT,但中国版的ChatGPT只会在5家公司里产生:BAT+字节+华为,创业公司或者那些纯为了炒股价的A股上市公司很难有机会。因此,无论是从大模型的实际能力还是业内认知,昆仑万维想成为AIGC领域的第一梯队,都有很长的距离要走。
昆仑万维:天工大模型含金量几何?1988年,23岁巩俐和38岁张艺谋泳池边的照片,这一幕相当滑稽可笑
天工

昆仑万维:天工大模型含金量几何?1988年,23岁巩俐和38岁张艺谋泳池边的照片,这一幕相当滑稽可笑

作者:徐帅今年春节过后,ChatGPT在国内走红,作为AI阵营的核心标的,昆仑万维股价应声而起。年初以来,昆仑万维股价从14.41元持续攀升,于5月5日触及70.66元的年内最高点,涨幅一度达到390%。尽管目前股价回落至54.05元,昆仑万维年内仍有超275%的上涨表现。支撑起股价上涨的最重要因素之一就是其在4月10日推出的“天工”3.5国产大语言模型。不过,欲戴王冠,必承其重。“炼大模型”需要的是天量的算力支持和资金投入,这无疑考验着参与者的资金实力和技术实力。昆仑万维的研发投入和技术储备能否支撑天工大模型的研发与迭代,并进化出独特优势,仍有待时间的检验。 “偏科”的大模型4月10日,昆仑万维宣布联合奇点智源,共同研发了号称“中国第一个真正实现智能涌现”的国产大语言模型——“天工”3.5。在AIGC的混战江湖里,昆仑万维宣称的中国第一个真正实现智能涌现的国产语言大模型到底有多少含金量?是当下投资者最为关注的问题之一。对于天工大模型,昆仑万维赋予了它很高的评价。当和讯网问及与国内其他友商产品相比,天工大模型具备哪些优势和不足时,昆仑万维回复称,“我们的大语言模型在同类产品中质量较高。天工3.5是中国第一个真正实现智能涌现的国产大语言模从。天工目前发布版本来看,最高已能支持1万字以上文本对话,实现20轮次以上用户交互,在多类问答场景中都能实现较高的输出水平,产品完成度与体验成熟度已不仅仅停留在‘尝鲜级’,而是款实际意义上的‘应用级’产品。”但从实际测试结果来看,天工大模型的表现与昆仑万维所说的“应用级”产品相比,或许还有一定的差距。4月17日,天工大模型开放了内部测试并向公众做了直播演示,直播展示了天工3.5的语义理解和数理能力,整体来看,这些展示并未带来过多惊喜,反而引来众多质疑。例如在当天的演示中,昆仑万维CEO方汉问出了蒸包子问题,“蒸一个包子需要10分钟,蒸十个呢?”第一轮天工从时间逻辑上给出了10分钟的答案;当再问100个的时候,却回答道因为蒸包子时间是固定的,所以还是10分钟。 而对比来看,百度的文心一言在问到该问题时考虑到了蒸包子的蒸锅大小,以及是否分批等问题。ChatGPT3.5则是除了蒸锅大小,甚至考虑到了功率、翻面、蒸笼里的水等问题。 图片来自网络另外,在一些测试者在公开平台上上传的测试情况来看,天工大模型在数理能力测试中表现较为吃力的情况比较普遍。例如,测试者要求制作一个工资表格,天工大模型给出了案例和计算规则,但最后的结论(实发工资一栏)全部都是不正确的。 图片来自网络不过,尽管在数理方面表现与其他更为成熟的大模型相比仍有差距,但天工也有自己的“特长”,那就是语义理解和文本写作能力。在故事续写测试中,天工的语言组织能力较为通顺,也较为符合逻辑。 图片来自网络针对天工大模型的测试结果,昆仑万维回复和讯网称当前表现是符合预期的。“天工采用了蒙特卡洛搜索树算法进行优化,这进一步提高了解码过程中的准确性和安全性,让天工在复杂任务和场景中能够快速且准确地响应指令,输出高质量回答。”同时,昆仑万维也坦言,“相对不满意的地方是,我们在数理等能力上还不是很完美,还需要迭代。” 布局AI已三年,但相关专利难寻一个值得注意的现象是,尽管昆仑万维不断强调自己属于较早一批在AI领域进行布局的企业,从2020年就开始布局AI音乐领域,但却很难查到能代表昆仑万维技术实力的专利信息。近几个月,多家相关企业陆续公布自己在AI及大模型领域申请的专利情况,昆仑万维在这方面则过于沉默。根据IPRdaily中文网发布的《中国人工智能大模型企业发明专利排行榜》,百度以602件大模型专利排名第一,阿里、字节、商汤科技等典型大模型企业也均有超过20件以上的专利数量。但在TOP50名单中,并未出现昆仑万维与奇点智源的身影。 图片来源:IPRdaily中文网数据来源:2017年1月1日至2023年3月17日在中国申请并公开的人工智能大模型专利实际上,“天工3.5”发布后,就有媒体爆料,与行业内其他企业不同,在昆仑万维科技股份有限公司下并未发现任何与大模型直接相关的专利,奇点智源下面也不存在任何专利。如果将搜索条件放宽到奇点智源大股东关联的奇点智能,还是找不到任何专利信息。和讯网针对这一技术层面的关键问题询问昆仑万维,但昆仑万维并未直接回复公司在大模型研发方面专利申请的具体情况,只是回复称:现阶段我们更专注于大语言模型本身,我们能希望潜下心认真打磨产品和技术,帮助模型进化到更高水平。大模型表现不够优秀,且缺失AIGC领域的相关专利,市场对于其“蹭热点”的质疑声越来越大。事实上,许多对A股市场科技板块了解较多的投资者很早就发现,在追逐新概念这件事上,昆仑万维的积极性和专业性都相当突出。2021年,Facebook宣布更名为“Meta”,其创始人扎克伯格表示要全力打造“元宇宙”平台。一时间,“元宇宙”成为全球金融市场的热词。就在Facebook更名的两天后,昆仑万维发布了三季度财报,在“其他重要信息”一栏中表示,Opera的游戏浏览器与游戏引擎在报告期内进一步加深结合,形成一站式的玩家和创作者社区,打造在Opera平台上创作、发行、消费游戏的闭环,加速了公司在元宇宙方向的布局。到了2022年,新能源的火热带动了储能市场井喷式发展。昆仑万维随即发布公告称,在原有投资业务板块基础上增设新能源领域投资业务板块。再到最近红得发紫的AIGC、ChatGPT,昆仑万维迅速靠拢,早在概念刚刚兴起不久的2月份,昆仑万维就火速对外宣布预计在年内发布中国版类ChatGPT代码开源。到了4月10日,公司又对外宣布,推出昆仑万维和奇点智源合作自研的国产大语言模型“天工”3.5。消息一经发出,立刻引起了资本市场与监管机构的广泛关注。仅一天后,深交所创业板公司管理部便向昆仑万维下发关注函,要求公司说明双千亿级大语言模型—“天工”3.5可能面临的风险包括但不限于商业化、运行、技术、行业等方面,以及相关表述是否准确、客观等。监管层特别提到,“我部再次提醒你公司信息披露务必真实、完整、 准确,充分提示相关风险,不得存在误导性陈述,不得利用市场热点题材进行“蹭热点”、市场操纵等违法违规行为”。字里行间,不难读出监管严厉的态度。但收到关注函的次日,昆仑万维就宣布与阿里云达成战略合作,再次释放利好,股票低开高走,收盘一举上涨12.06%。 财务状况能否支撑巨额研发?在技术能力之外,昆仑万维的财务状况能否支撑大模型的巨额研发投入,也是投资者普遍关注的问题。大模型的研发与迭代是毫无疑问的“烧钱”游戏。单看硬件方面就是一笔巨额投入,据美国市场研究机构TrendForce推算,处理ChatGPT的训练数据需要2万枚GPU芯片,而随着OpenAI进一步展开ChatGPT和其他GPT模型的商业应用,其GPU需求量将突破3万张(该报告计算以A100芯片为主)。在昆仑万维最新的业绩交流会上,昆仑万维CEO方汉透露,昆仑万维当前仅有200张卡的训练集群,合计采购约4400万美金的硬件设备。按照现在主流对大模型的理解,200张卡只是杯水车薪。在硬件之外,ChatGPT的算力成本也不容小觑,据国盛证券报告《ChatGPT需要多少算力》估算,GPT-3训练一次的成本约为140万美元,对于一些更大的LLM(大型语言模型),训练成本介于200万美元至1200万美元之间。如此“烧钱”的游戏,意味着只有手握云计算、数据资源和资金实力的几家大厂才能承担。对比起来,昆仑万维虽然重金投入研发,但由于公司体量较小,研发投入费用与行业巨头仍有较大差距。根据2022年年报,昆仑万维2022年研发投入金额仅有7.36亿元,研发投入占营业收入的比重为15.54%。截止2022年末,昆仑万维手里的货币资金为10亿元,与此同时,昆仑万维的现金及现金等价物净增额为负的5.92亿。这些研发投入及在手现金,在风起云涌一日千里的大模型赛道,恐怕难以支撑昆仑万维的野心。研发投入不足,是否会造成公司在激烈的行业竞争中处于劣势?对于这一问题,昆仑万维在给和讯网的问题回复中也并未直接回答,只是回复称,投入方面,昆仑万维有健康的现金流,作为昆仑万维三大业务板块之一,公司将继续加大相关投入,不断迭代升级模型算法,努力保持领先优势。同时探索新的商业模式,不断拓宽行业边界,并加强战略伙伴间协同合作,为公司新一轮高速增长注入动力。今年的业绩交流会上,昆仑万维CEO方汉称“我们从2020年开始投入大模型研发,2022年提出allin AIGC的口号,所以公司管理层AIGC的认知非常超前,我们在B端和C端和算法演变上有很信心,在长期中我相信我们会处于第一梯队。”但据中国移动研究院最新报告,业界普遍公认国内大模型第一梯队当属百度、阿里巴巴、腾讯、华为四家,在大模型研发投入、技术能力和人才团队实力较强,具备追赶GPT-4实力。而对于中国AIGC的未来,更有一线投资人直言,中国一定会有自己的ChatGPT,但中国版的ChatGPT只会在5家公司里产生:BAT+字节+华为,创业公司或者那些纯为了炒股价的A股上市公司很难有机会。因此,无论是从大模型的实际能力还是业内认知,昆仑万维想成为AIGC领域的第一梯队,都有很长的距离要走。
昆仑万维:天工大模型含金量几何?
天工

昆仑万维:天工大模型含金量几何?

今年春节过后,ChatGPT在国内走红,作为AI阵营的核心标的,昆仑万维股价应声而起。 年初以来,昆仑万维股价从14.41元持续攀升,于5月5日触及70.66元的年内最高点,涨幅一度达到390%。尽管目前股价回落至54.05元,昆仑万维年内仍有超275%的上涨表现。支撑起股价上涨的最重要因素之一就是其在4月10日推出的“天工”3.5国产大语言模型。 不过,欲戴王冠,必承其重。“炼大模型”需要的是天量的算力支持和资金投入,这无疑考验着参与者的资金实力和技术实力。昆仑万维的研发投入和技术储备能否支撑天工大模型的研发与迭代,并进化出独特优势,仍有待时间的检验。 “偏科”的大模型 4月10日,昆仑万维宣布联合奇点智源,共同研发了号称“中国第一个真正实现智能涌现”的国产大语言模型——“天工”3.5。 在AIGC的混战江湖里,昆仑万维宣称的中国第一个真正实现智能涌现的国产语言大模型到底有多少含金量?是当下投资者最为关注的问题之一。 对于天工大模型,昆仑万维赋予了它很高的评价。 当和讯网问及与国内其他友商产品相比,天工大模型具备哪些优势和不足时,昆仑万维回复称,“我们的大语言模型在同类产品中质量较高。天工3.5是中国第一个真正实现智能涌现的国产大语言模从。天工目前发布版本来看,最高已能支持1万字以上文本对话,实现20轮次以上用户交互,在多类问答场景中都能实现较高的输出水平,产品完成度与体验成熟度已不仅仅停留在‘尝鲜级’,而是款实际意义上的‘应用级’产品。” 但从实际测试结果来看,天工大模型的表现与昆仑万维所说的“应用级”产品相比,或许还有一定的差距。 4月17日,天工大模型开放了内部测试并向公众做了直播演示,直播展示了天工3.5的语义理解和数理能力,整体来看,这些展示并未带来过多惊喜,反而引来众多质疑。 例如在当天的演示中,昆仑万维CEO方汉问出了蒸包子问题,“蒸一个包子需要10分钟,蒸十个呢?”第一轮天工从时间逻辑上给出了10分钟的答案;当再问100个的时候,却回答道因为蒸包子时间是固定的,所以还是10分钟。 而对比来看,百度的文心一言在问到该问题时考虑到了蒸包子的蒸锅大小,以及是否分批等问题。 ChatGPT3.5则是除了蒸锅大小,甚至考虑到了功率、翻面、蒸笼里的水等问题。 图片来自网络 另外,在一些测试者在公开平台上上传的测试情况来看,天工大模型在数理能力测试中表现较为吃力的情况比较普遍。 例如,测试者要求制作一个工资表格,天工大模型给出了案例和计算规则,但最后的结论(实发工资一栏)全部都是不正确的。 图片来自网络 不过,尽管在数理方面表现与其他更为成熟的大模型相比仍有差距,但天工也有自己的“特长”,那就是语义理解和文本写作能力。 在故事续写测试中,天工的语言组织能力较为通顺,也较为符合逻辑。 图片来自网络 针对天工大模型的测试结果,昆仑万维回复和讯网称当前表现是符合预期的。“天工采用了蒙特卡洛搜索树算法进行优化,这进一步提高了解码过程中的准确性和安全性,让天工在复杂任务和场景中能够快速且准确地响应指令,输出高质量回答。”同时,昆仑万维也坦言,“相对不满意的地方是,我们在数理等能力上还不是很完美,还需要迭代。” 布局AI已三年,但相关专利难寻 一个值得注意的现象是,尽管昆仑万维不断强调自己属于较早一批在AI领域进行布局的企业,从2020年就开始布局AI音乐领域,但却很难查到能代表昆仑万维技术实力的专利信息。近几个月,多家相关企业陆续公布自己在AI及大模型领域申请的专利情况,昆仑万维在这方面显得过于沉默。 根据IPRdaily中文网发布的《中国人工智能大模型企业发明专利排行榜》,百度以602件大模型专利排名第一,阿里、字节、商汤科技等典型大模型企业也均有超过20件以上的专利数量。但在TOP50名单中,并未出现昆仑万维与其合作公司奇点智源的身影。 图片来源:IPRdaily中文网 数据来源:2017年1月1日至2023年3月17日在中国申请并公开的人工智能大模型专利 实际上,“天工3.5”发布后,就有媒体爆料,与行业内其他企业不同,在昆仑万维科技股份有限公司下并未发现任何与大模型直接相关的专利,奇点智源下面也不存在任何专利。如果将搜索条件放宽到奇点智源大股东关联的奇点智能,还是找不到任何专利信息。 和讯网针对这一技术层面的关键问题询问昆仑万维,但昆仑万维并未直接回复公司在大模型研发方面专利申请的具体情况,只是回复称:现阶段我们更专注于大语言模型本身,我们能希望潜下心认真打磨产品和技术,帮助模型进化到更高水平。 大模型表现不够优秀,且缺失AIGC领域的相关专利,市场对于其“蹭热点”的质疑声越来越大。 事实上,许多对A股市场科技板块了解较多的投资者很早就发现,在追逐新概念这件事上,昆仑万维的积极性和专业性都相当突出。 2021年,Facebook宣布更名为“Meta”,其创始人扎克伯格表示要全力打造“元宇宙”平台。一时间,“元宇宙”成为全球金融市场的热词。 就在Facebook更名的两天后,昆仑万维发布了三季度财报,在“其他重要信息”一栏中表示,Opera的游戏浏览器与游戏引擎在报告期内进一步加深结合,形成一站式的玩家和创作者社区,打造在Opera平台上创作、发行、消费游戏的闭环,加速了公司在元宇宙方向的布局。 到了2022年,新能源的火热带动了储能市场井喷式发展。昆仑万维随即发布公告称,在原有投资业务板块基础上增设新能源领域投资业务板块。 再到最近红得发紫的AIGC、ChatGPT,昆仑万维迅速靠拢,早在概念刚刚兴起不久的2月份,昆仑万维就火速对外宣布预计在年内发布中国版类ChatGPT代码开源。到了4月10日,公司又对外宣布,推出昆仑万维和奇点智源合作自研的国产大语言模型“天工”3.5。 消息一经发出,立刻引起了资本市场与监管机构的广泛关注。仅一天后,深交所创业板公司管理部便向昆仑万维下发关注函,要求公司说明双千亿级大语言模型—“天工”3.5可能面临的风险包括但不限于商业化、运行、技术、行业等方面,以及相关表述是否准确、客观等。 监管层特别提到,“我部再次提醒你公司信息披露务必真实、完整、 准确,充分提示相关风险,不得存在误导性陈述,不得利用市场热点题材进行“蹭热点”、市场操纵等违法违规行为”。 字里行间,不难读出监管严厉的态度。但收到关注函的次日,昆仑万维就宣布与阿里云达成战略合作,再次释放利好,股票低开高走,收盘一举上涨12.06%。 财务状况能否支撑巨额研发? 在技术能力之外,昆仑万维的财务状况能否支撑大模型的巨额研发投入,也是投资者普遍关注的问题。 大模型的研发与迭代是毫无疑问的“烧钱”游戏。 单看硬件方面就是一笔巨额投入,据美国市场研究机构TrendForce推算,处理ChatGPT的训练数据需要2万枚GPU芯片,而随着OpenAI进一步展开ChatGPT和其他GPT模型的商业应用,其GPU需求量将突破3万张(该报告计算以A100芯片为主)。 在昆仑万维最新的业绩交流会上,昆仑万维CEO方汉透露,昆仑万维当前仅有200张卡的训练集群,合计采购约4400万美金的硬件设备。按照现在主流对大模型的理解,200张卡只是杯水车薪。 在硬件之外,ChatGPT的算力成本也不容小觑,据国盛证券报告《ChatGPT需要多少算力》估算,GPT-3训练一次的成本约为140万美元,对于一些更大的LLM(大型语言模型),训练成本介于200万美元至1200万美元之间。 如此“烧钱”的游戏,意味着只有手握云计算、数据资源和资金实力的几家大厂才能承担。 对比起来,昆仑万维虽然重金投入研发,但由于公司体量较小,研发投入费用与行业巨头仍有较大差距。根据2022年年报,昆仑万维2022年研发投入金额仅有7.36亿元,研发投入占营业收入的比重为15.54%。截止2022年末,昆仑万维手里的货币资金为10亿元,与此同时,昆仑万维的现金及现金等价物净增额为负的5.92亿。...