小米汽车一期工厂主体完工;电影《奥本海默》票房破2亿;近三成用户拿ChatGPT来协助编程|Do早报
ChatGPT

小米汽车一期工厂主体完工;电影《奥本海默》票房破2亿;近三成用户拿ChatGPT来协助编程|Do早报

Hello,大家早上好,又是元气满满的一天,先来浏览新鲜的早报吧~ 新能源: 【小米汽车一期工厂主体完工】 《第一财经》报道,目前小米汽车北京亦庄工厂一期主体确已完工,且开工已经很久。据附近员工透露,近段时间工厂一直开工,但内部厂房“声音并不大”。 新消费: 【Mate 60 Pro引发线下抢购风潮】 3日华为商城、淘宝、京东等线上平台开启华为 Mate 60 Pro 的全款抢购,此外,前期在门店预订了手机的消费者也可前往门店取机。全国多地华为门店再现排队盛况。 新文娱: 【电影《奥本海默》票房破2亿】 据猫眼专业版数据,电影《奥本海默》上映5天 ,总票房破2亿。 ​​​ 大模型: 【近三成用户拿ChatGPT来协助编程】 人们主要用 ChatGPT 来解决什么任务?SparkToro 公司近日从 Datos 公司获得了超过 7000 个真实用户向 ChatGPT 提出的请求,并筛选出最相关的 4098 个。通过使用 ChatGPT 自身对这些请求进行主题分类,得到了以下结果:编程是最多的使用场景,占所有问答的 29.14%。这也是最清晰的使用场景,ChatGPT 被用来帮助编写特定的代码、格式化代码、找出代码错误等。 【三星生成式人工智能即将到来】 韩联社发现,三星已经在韩国知识产权局注册了“Samsung Gauss”商标,称其为三星即将推出的生成式人工智能平台的正式名称。三星电子在描述中表示,“三星电子可将 Samsung Gauss 用于人工智能软件、基于机器学习的语言和语音处理计算机软件、人工制作语音、文本、图像、声音和视频的计算机软件以及自然语言处理、生成、理解和分析计算机软件等指定产品。” 【Meta推出FACET,用于解决AI模型公平性问题】 据Meta官方消息,Meta近日推出一款名为FACET的AI工具,用于识别计算机视觉系统中的种族和性别偏见。据悉,FACET中包含了32000张图像,其中包括50000个人体图像。FACET可以对图片中的角色的性别和肤色进行感知,甚至可以识别出角色的身份。 【云庐科技发布全球首款CAE领域大模型-CAEGPT】 云庐科技2日在服贸会上正式发布创新研发的全球首款CAE领域大模型——CAEGPT。
一文读懂,什么是ChatGPT
ChatGPT

一文读懂,什么是ChatGPT

在知乎上许多网友也对ChatGPT进行了测评并表示高度的看好,虽然ChatGPT在逻辑和部分计算相关的问题的处理上没有其在其他领域表现的那么良好,但微软和OpenAI后续的研发会逐步抹平这个技术壁垒。下面我将从以下几个方面给大家讲解ChatGPT。 1、那我们来看看ChatGPT到底是什么? 是由人工智能研究实验室OpenAI在2022年11月30日发布的全新聊天机器人模型。ChatGPT是一个人机交互的语言模型,是目前NLP(自然语言处理)领域最前沿的研究成果之一,由于其高质量的对话内容响应能力,事实上相当于解锁了多样化的文本内容生成能力,目前成为AIGC里程碑式的模型或产品。它是GPT-3模型的变体,GPT-3经过训练,可以在对话中生成类似人类的文本响应。ChatGPT 旨在用作聊天机器人,我们可以对其进行微调,以完成各种任务,如回答问题、提供信息或参与对话。与许多使用预定义的响应或规则生成文本的聊天机器人不同,ChatGPT经过了训练,可以根据接收到的输入生成响应,从而生成更自然、更多样化的响应。 2、ChatGPT具体有哪些功能? ChatGPT目前可以进行许多人类语言方面的创作和处理,帮助生成各种类型的文本,包括报告、新闻文章、小说、广告文案等。例如,如果你是一名记者,你可以使用 ChatGPT 来帮助你快速生成新闻稿;如果你是一名广告创意人员,你可以使用 ChatGPT 来帮助你构建广告文案。此外,语言翻译、文本分析、聊天等功能也是ChatGPT的强项。对于程序员来说,ChatGPT还可以帮助程序员写代码,而且生成的代码都比较精炼。搜索信息也是ChatGPT的一部分功能,因为搜索过程相当于对互联网进行求问的过程,ChatGPT目前能回答大部分没有那么专业的问题,对于一些复杂知识或问题还没有足够的普及。但ChatGPT的推出,算得上人工智能自然语言处理方面的重大革命。 3、ChatGPT相关的新闻和热点 在1月18号,时任微软CEO的萨蒂亚•纳德拉,在达沃斯世界经济论坛《华尔街日报》座谈会上谈到,计划将ChatGPT等工具背后的技术整合到自家公司旗下的所有产品里。这些产品包括但不限于微软的Office全家桶,我们熟知的有Word、Excel、PowerPoint等,微软公司还会使用ChatGPT背后的人工智能技术去优化自家的Bing引擎搜索,以抢夺传统搜索引擎巨头谷歌的市场。微软这次将要对OpenAI实验室继续投资100亿美元,再结合与其他公司的融资,OpenAI的市场估值可能要高达290亿美元的天文数字。 比尔·盖茨最近评价ChatGPT称,这种人工智能技术出现的重大历史意义,不亚于互联网和个人电脑的诞生。 GMail创始人Paul Buchheit日前发布推特表示,谷歌可能只需要一两年就会被彻底颠覆。”人工智能将消除搜索引擎结果页,这是他们(谷歌)赚取大部分利润的地方。即使他们赶上AI技术发展进度,也无法在不破坏其业务中最有价值的部分的情况下全面部署”。另外,Buchheit认为,破坏谷歌垄断地位的可能不是ChatGPT本身,但技术的进步肯定会改变人们获取信息的方式,AI将能立即完成人类使用搜索引擎、花费数分钟才能完成的事情。 4、ChatGPT的产业链分析 ChatGPT上线象征着文本类AI进入新阶段,利好其基础设施及应用。算法、芯片、存储、数据和算力是AI大模型训练的基础。 1)云计算 国内云基础设施方面,Canalys统计2022年第三季度中国云基础设施服务支出达到78亿美元,同比增长8%。“中国四朵云”(阿里云、腾讯云、华为云、百度云)格局未变,合计占据80%市场份额。发展前景和投资前景良好。 2)AI芯片 海思半导体已成为国内营收规模最大的集成电路设计企业,以昇腾系列为主要GPU产品,在AI终端芯片具有优势。云端领域,百度可提供云上GPU服务器;海光信息、天数智心与登临科技均以GPU为主打,是国内特定细分领域的主要竞争对手。芯片领域主要厂商还包括寒武纪、富瀚微、国科微、北京君正、华为海思、星宸科技等;存储器主要厂商主要是长江存储。 3)数据方面 数据集作为数据资源的核心组成部分,是指经过专业化设计、采集、清洗、标注和管理,生产出来的专供人工智能算法模型训练的数据。主要厂商包括海天瑞声(AI训练数据专业提供商)、京东众智、慧听数据。 4)算法和应用方面 当前国内领先的对话交互类AI算法企业主要包括两类: 以语音识别为核心业务的企业,延生到NLP领域,如科大讯飞,从语音识别延生到语音合成、机器翻译、图文识别、图像理解、阅读理解、机器推理等算法,并在消费者、智慧教育、智慧城市、智慧司法、智能服务、智能汽车、智慧医疗、运营商等领域实现深度应用。以NLP为核心业务,专注语义识别的企业,如拓尔思。拓尔思是国内最早从事自然语言处理(NLP)研发的企业之一,在语义智能领域具备自主可控的底层技术,可以提供预训练模型和阅读理解等技术成果。
昆仑万维:天工大模型含金量几何?
天工

昆仑万维:天工大模型含金量几何?

今年春节过后,ChatGPT在国内走红,作为AI阵营的核心标的,昆仑万维股价应声而起。 年初以来,昆仑万维股价从14.41元持续攀升,于5月5日触及70.66元的年内最高点,涨幅一度达到390%。尽管目前股价回落至54.05元,昆仑万维年内仍有超275%的上涨表现。支撑起股价上涨的最重要因素之一就是其在4月10日推出的“天工”3.5国产大语言模型。 不过,欲戴王冠,必承其重。“炼大模型”需要的是天量的算力支持和资金投入,这无疑考验着参与者的资金实力和技术实力。昆仑万维的研发投入和技术储备能否支撑天工大模型的研发与迭代,并进化出独特优势,仍有待时间的检验。 “偏科”的大模型 4月10日,昆仑万维宣布联合奇点智源,共同研发了号称“中国第一个真正实现智能涌现”的国产大语言模型——“天工”3.5。 在AIGC的混战江湖里,昆仑万维宣称的中国第一个真正实现智能涌现的国产语言大模型到底有多少含金量?是当下投资者最为关注的问题之一。 对于天工大模型,昆仑万维赋予了它很高的评价。 当和讯网问及与国内其他友商产品相比,天工大模型具备哪些优势和不足时,昆仑万维回复称,“我们的大语言模型在同类产品中质量较高。天工3.5是中国第一个真正实现智能涌现的国产大语言模从。天工目前发布版本来看,最高已能支持1万字以上文本对话,实现20轮次以上用户交互,在多类问答场景中都能实现较高的输出水平,产品完成度与体验成熟度已不仅仅停留在‘尝鲜级’,而是款实际意义上的‘应用级’产品。” 但从实际测试结果来看,天工大模型的表现与昆仑万维所说的“应用级”产品相比,或许还有一定的差距。 4月17日,天工大模型开放了内部测试并向公众做了直播演示,直播展示了天工3.5的语义理解和数理能力,整体来看,这些展示并未带来过多惊喜,反而引来众多质疑。 例如在当天的演示中,昆仑万维CEO方汉问出了蒸包子问题,“蒸一个包子需要10分钟,蒸十个呢?”第一轮天工从时间逻辑上给出了10分钟的答案;当再问100个的时候,却回答道因为蒸包子时间是固定的,所以还是10分钟。 而对比来看,百度的文心一言在问到该问题时考虑到了蒸包子的蒸锅大小,以及是否分批等问题。 ChatGPT3.5则是除了蒸锅大小,甚至考虑到了功率、翻面、蒸笼里的水等问题。 图片来自网络 另外,在一些测试者在公开平台上上传的测试情况来看,天工大模型在数理能力测试中表现较为吃力的情况比较普遍。 例如,测试者要求制作一个工资表格,天工大模型给出了案例和计算规则,但最后的结论(实发工资一栏)全部都是不正确的。 图片来自网络 不过,尽管在数理方面表现与其他更为成熟的大模型相比仍有差距,但天工也有自己的“特长”,那就是语义理解和文本写作能力。 在故事续写测试中,天工的语言组织能力较为通顺,也较为符合逻辑。 图片来自网络 针对天工大模型的测试结果,昆仑万维回复和讯网称当前表现是符合预期的。“天工采用了蒙特卡洛搜索树算法进行优化,这进一步提高了解码过程中的准确性和安全性,让天工在复杂任务和场景中能够快速且准确地响应指令,输出高质量回答。”同时,昆仑万维也坦言,“相对不满意的地方是,我们在数理等能力上还不是很完美,还需要迭代。” 布局AI已三年,但相关专利难寻 一个值得注意的现象是,尽管昆仑万维不断强调自己属于较早一批在AI领域进行布局的企业,从2020年就开始布局AI音乐领域,但却很难查到能代表昆仑万维技术实力的专利信息。近几个月,多家相关企业陆续公布自己在AI及大模型领域申请的专利情况,昆仑万维在这方面显得过于沉默。 根据IPRdaily中文网发布的《中国人工智能大模型企业发明专利排行榜》,百度以602件大模型专利排名第一,阿里、字节、商汤科技等典型大模型企业也均有超过20件以上的专利数量。但在TOP50名单中,并未出现昆仑万维与其合作公司奇点智源的身影。 图片来源:IPRdaily中文网 数据来源:2017年1月1日至2023年3月17日在中国申请并公开的人工智能大模型专利 实际上,“天工3.5”发布后,就有媒体爆料,与行业内其他企业不同,在昆仑万维科技股份有限公司下并未发现任何与大模型直接相关的专利,奇点智源下面也不存在任何专利。如果将搜索条件放宽到奇点智源大股东关联的奇点智能,还是找不到任何专利信息。 和讯网针对这一技术层面的关键问题询问昆仑万维,但昆仑万维并未直接回复公司在大模型研发方面专利申请的具体情况,只是回复称:现阶段我们更专注于大语言模型本身,我们能希望潜下心认真打磨产品和技术,帮助模型进化到更高水平。 大模型表现不够优秀,且缺失AIGC领域的相关专利,市场对于其“蹭热点”的质疑声越来越大。 事实上,许多对A股市场科技板块了解较多的投资者很早就发现,在追逐新概念这件事上,昆仑万维的积极性和专业性都相当突出。 2021年,Facebook宣布更名为“Meta”,其创始人扎克伯格表示要全力打造“元宇宙”平台。一时间,“元宇宙”成为全球金融市场的热词。 就在Facebook更名的两天后,昆仑万维发布了三季度财报,在“其他重要信息”一栏中表示,Opera的游戏浏览器与游戏引擎在报告期内进一步加深结合,形成一站式的玩家和创作者社区,打造在Opera平台上创作、发行、消费游戏的闭环,加速了公司在元宇宙方向的布局。 到了2022年,新能源的火热带动了储能市场井喷式发展。昆仑万维随即发布公告称,在原有投资业务板块基础上增设新能源领域投资业务板块。 再到最近红得发紫的AIGC、ChatGPT,昆仑万维迅速靠拢,早在概念刚刚兴起不久的2月份,昆仑万维就火速对外宣布预计在年内发布中国版类ChatGPT代码开源。到了4月10日,公司又对外宣布,推出昆仑万维和奇点智源合作自研的国产大语言模型“天工”3.5。 消息一经发出,立刻引起了资本市场与监管机构的广泛关注。仅一天后,深交所创业板公司管理部便向昆仑万维下发关注函,要求公司说明双千亿级大语言模型—“天工”3.5可能面临的风险包括但不限于商业化、运行、技术、行业等方面,以及相关表述是否准确、客观等。 监管层特别提到,“我部再次提醒你公司信息披露务必真实、完整、 准确,充分提示相关风险,不得存在误导性陈述,不得利用市场热点题材进行“蹭热点”、市场操纵等违法违规行为”。 字里行间,不难读出监管严厉的态度。但收到关注函的次日,昆仑万维就宣布与阿里云达成战略合作,再次释放利好,股票低开高走,收盘一举上涨12.06%。 财务状况能否支撑巨额研发? 在技术能力之外,昆仑万维的财务状况能否支撑大模型的巨额研发投入,也是投资者普遍关注的问题。 大模型的研发与迭代是毫无疑问的“烧钱”游戏。 单看硬件方面就是一笔巨额投入,据美国市场研究机构TrendForce推算,处理ChatGPT的训练数据需要2万枚GPU芯片,而随着OpenAI进一步展开ChatGPT和其他GPT模型的商业应用,其GPU需求量将突破3万张(该报告计算以A100芯片为主)。 在昆仑万维最新的业绩交流会上,昆仑万维CEO方汉透露,昆仑万维当前仅有200张卡的训练集群,合计采购约4400万美金的硬件设备。按照现在主流对大模型的理解,200张卡只是杯水车薪。 在硬件之外,ChatGPT的算力成本也不容小觑,据国盛证券报告《ChatGPT需要多少算力》估算,GPT-3训练一次的成本约为140万美元,对于一些更大的LLM(大型语言模型),训练成本介于200万美元至1200万美元之间。 如此“烧钱”的游戏,意味着只有手握云计算、数据资源和资金实力的几家大厂才能承担。 对比起来,昆仑万维虽然重金投入研发,但由于公司体量较小,研发投入费用与行业巨头仍有较大差距。根据2022年年报,昆仑万维2022年研发投入金额仅有7.36亿元,研发投入占营业收入的比重为15.54%。截止2022年末,昆仑万维手里的货币资金为10亿元,与此同时,昆仑万维的现金及现金等价物净增额为负的5.92亿。...
ChatGPT爆火这半年:热钱、巨头与监管
ChatGPT

ChatGPT爆火这半年:热钱、巨头与监管

原标题:ChatGPT爆火这半年:热钱、巨头与监管 出品 | 虎嗅科技组 作者 | 陈伊凡 齐健 头图 | 电影《华尔街之狼》 经历了半年的AI洗礼,或许很难找到比“应激反应”更恰当的词,来形容今天科技行业中每个人的状态——紧张、刺激、压力。 “应激反应”, 是指生物体在遭遇外部环境压力或威胁时,为了维持身体的稳态而产生的一系列反应。它是生物为了适应环境、确保生存所产生的一种自然反应。这种反应可以是短暂的,也可以是长期的。 7月26日,OpenAI官方推特宣布,安卓版ChatGPT已在美国、印度、孟加拉国和巴西提供下载,并计划在近期推广至更多国家。ChatGPT正在拓展渠道,获得更多的用户和更强的使用粘性,生成式AI的浪潮在持续推高。 7月初,上海的2023世界人工智能大会(WAIC)上,一位大模型创业公司的技术人员正在展厅里穿梭,她计划为公司寻找一个性价比高的国产芯片解决方案,用来做大模型训练。 “我们有1000张A100,但完全不够。”她告诉虎嗅。 A100是英伟达的一款高端GPU,也是ChatGPT生长的硬件基础。一些公开数据显示,在训练GPT系列模型的过程中,OpenAI所使用的英伟达GPU数量约2.5万个。由此,要做大模型,要先评估能拿到多少张A100的显卡,几乎成了这个行业的惯例。 哪里有GPU?哪里有便宜算力?这只是2023WAIC大会上众多问题的缩影。 过去半年里所有被“应激”到的人,几乎都渴望能够在这场“盛会”中找到更多关于AI的答案。 2023WAIC现场 一家芯片展商的技术人员告诉虎嗅,在WAIC大会的几天里,他们的“大模型”展台前,来了好些产品经理,他们希望在这里为公司的大模型业务寻找产品定义。 5月28日在中关村论坛上,中国科学技术信息研究所发布的《中国人工智能大模型地图研究报告》显示,截至5月底,中国10亿级参数规模以上的大模型发布了79个。在此后的两个月里,又有阿里云的通义万相、华为云的盘古3.0、有道“子曰”等一系列AI大模型发布,据不完全统计目前国内的AI大模型已超过100个。 国内企业争先恐后发布AI大模型的动作,就是“应激反应”最好的体现。这种“反应”带来的焦虑,正在传导给行业里几乎所有相关人员,从互联网巨头的CEO到AI研究机构的研究员,从创投基金合伙人到AI公司的创始人,甚至是很多AI相关的法律从业者,以及数据、网络安全的监管层。 对行业之外的人而言,这可能只是短暂的狂欢,但在如今,又有多少人敢说自己置身AI之外。 AI正在开启一个新时代,一切都值得用大模型重塑一遍。越来越多的人开始思考技术扩散之后的结果。 资金涌入,飞轮已现 ChatGPT诞生的一个月内,出门问问创始人李志飞两赴硅谷,逢人必谈大模型,在与虎嗅交谈时,李志飞直言这是他最后一次“All in”。 2012年,李志飞创立出门问问,这家以语音交互、软硬件结合为核心的人工智能公司经历了中国两次人工智能浪潮的起伏。在上一波人工智能最火热的那一段时间,出门问问的估值一度被推至独角兽级别,但此后也经历了一段落寞期,直到ChatGPT的出现,才给沉寂多年的人工智能行业撕开了一道口子。 在一级市场,“热钱正在涌进来。” 这是过去半年中,谈及大模型时的行业共识。奇绩论坛创始人陆奇认为,AI大模型是一个“飞轮”,未来将是一个模型无处不在的时代,“这个飞轮已经启动”,而最大的推动力就是资本。 7月初,商业信息平台Crunchbase发布的数据显示,分类为AI的公司在2023年上半年筹集了250亿美元,占全球融资的18%。虽然这一数字与2022年上半年的290亿美元相比有所下降,但2023年上半年全球各行业的总融资额比2022年同比下降了51%,由此可见AI领域的融资额在全球融资总额中的占比,几乎提高了一倍。Crunchbase在报告中这样写到:“如果没有ChatGPT引发的人工智能热潮,2023年的融资额会更低。” 到目前为止,2023年AI行业最大的一笔融资,就是微软在1月对OpenAI投资的100亿美元。 虎嗅根据公开数据统计,在美国的大模型公司创业中,Inflection AI或将成为人工智能领域融资量仅次于Open AI的第二大初创公司,在其之后分别是,Anthropic(15亿美元),Cohere(4.45亿美元)、Adept(4.15亿美元)、Runway(1.955亿美元)、Character.ai(1.5亿美元)和Stability AI(约1亿美元)。 在中国,2023年上半年国内人工智能行业的公开投融资事件共有456起。而这项统计在2018年-2022年的5年间分别是731、526、353、631和648。 上半年国内人工智能行业公开投融资事件 另一个引发飞轮的事件则是ChatGPT放出API接口。当OpenAI在3月首次开放ChatGPT的API接口时,AI行业内外对此几乎形成共识:行业要变天了。随着更多应用接入大模型,AI之上正在长出更加繁茂的森林。 “做大模型和做应用本身就应该分开”,投资人的嗅觉总是敏锐的,在源码资本执行董事陈润泽看来,AI是一个与半导体分工一样的逻辑,AI大模型的繁荣之后,很快就会看到AI应用的一波繁荣。 今年年初,陈润泽与同事一起前往硅谷时发现,硅谷声名显赫的创业孵化器Y Combinator(OpenAI首席执行官Sam Altman曾在这家孵化器任总裁多年),有一半的项目都转型做生成式AI了。对于大模型的热情,丝毫不逊于如今大洋彼岸的中国。 不过,他也发现在美国无论是资本还是创业者,相比于大模型创业,更看好基于大模型所做的生态应用,毕竟在这个赛道,已经跑出了诸如OpenAI这样的公司,与此同时,美国有很强的ToB应用生态土壤,因此更多的美国公司正在尝试基于大模型的生态做企业应用。...
ChatGPT爆火这半年:热钱、巨头与监管
ChatGPT

ChatGPT爆火这半年:热钱、巨头与监管

原标题:ChatGPT爆火这半年:热钱、巨头与监管 出品 | 虎嗅科技组 作者 | 陈伊凡 齐健 头图 | 电影《华尔街之狼》 经历了半年的AI洗礼,或许很难找到比“应激反应”更恰当的词,来形容今天科技行业中每个人的状态——紧张、刺激、压力。 “应激反应”, 是指生物体在遭遇外部环境压力或威胁时,为了维持身体的稳态而产生的一系列反应。它是生物为了适应环境、确保生存所产生的一种自然反应。这种反应可以是短暂的,也可以是长期的。 7月26日,OpenAI官方推特宣布,安卓版ChatGPT已在美国、印度、孟加拉国和巴西提供下载,并计划在近期推广至更多国家。ChatGPT正在拓展渠道,获得更多的用户和更强的使用粘性,生成式AI的浪潮在持续推高。 7月初,上海的2023世界人工智能大会(WAIC)上,一位大模型创业公司的技术人员正在展厅里穿梭,她计划为公司寻找一个性价比高的国产芯片解决方案,用来做大模型训练。 “我们有1000张A100,但完全不够。”她告诉虎嗅。 A100是英伟达的一款高端GPU,也是ChatGPT生长的硬件基础。一些公开数据显示,在训练GPT系列模型的过程中,OpenAI所使用的英伟达GPU数量约2.5万个。由此,要做大模型,要先评估能拿到多少张A100的显卡,几乎成了这个行业的惯例。 哪里有GPU?哪里有便宜算力?这只是2023WAIC大会上众多问题的缩影。 过去半年里所有被“应激”到的人,几乎都渴望能够在这场“盛会”中找到更多关于AI的答案。 2023WAIC现场 一家芯片展商的技术人员告诉虎嗅,在WAIC大会的几天里,他们的“大模型”展台前,来了好些产品经理,他们希望在这里为公司的大模型业务寻找产品定义。 5月28日在中关村论坛上,中国科学技术信息研究所发布的《中国人工智能大模型地图研究报告》显示,截至5月底,中国10亿级参数规模以上的大模型发布了79个。在此后的两个月里,又有阿里云的通义万相、华为云的盘古3.0、有道“子曰”等一系列AI大模型发布,据不完全统计目前国内的AI大模型已超过100个。 国内企业争先恐后发布AI大模型的动作,就是“应激反应”最好的体现。这种“反应”带来的焦虑,正在传导给行业里几乎所有相关人员,从互联网巨头的CEO到AI研究机构的研究员,从创投基金合伙人到AI公司的创始人,甚至是很多AI相关的法律从业者,以及数据、网络安全的监管层。 对行业之外的人而言,这可能只是短暂的狂欢,但在如今,又有多少人敢说自己置身AI之外。 AI正在开启一个新时代,一切都值得用大模型重塑一遍。越来越多的人开始思考技术扩散之后的结果。 资金涌入,飞轮已现 ChatGPT诞生的一个月内,出门问问创始人李志飞两赴硅谷,逢人必谈大模型,在与虎嗅交谈时,李志飞直言这是他最后一次“All in”。 2012年,李志飞创立出门问问,这家以语音交互、软硬件结合为核心的人工智能公司经历了中国两次人工智能浪潮的起伏。在上一波人工智能最火热的那一段时间,出门问问的估值一度被推至独角兽级别,但此后也经历了一段落寞期,直到ChatGPT的出现,才给沉寂多年的人工智能行业撕开了一道口子。 在一级市场,“热钱正在涌进来。” 这是过去半年中,谈及大模型时的行业共识。奇绩论坛创始人陆奇认为,AI大模型是一个“飞轮”,未来将是一个模型无处不在的时代,“这个飞轮已经启动”,而最大的推动力就是资本。 7月初,商业信息平台Crunchbase发布的数据显示,分类为AI的公司在2023年上半年筹集了250亿美元,占全球融资的18%。虽然这一数字与2022年上半年的290亿美元相比有所下降,但2023年上半年全球各行业的总融资额比2022年同比下降了51%,由此可见AI领域的融资额在全球融资总额中的占比,几乎提高了一倍。Crunchbase在报告中这样写到:“如果没有ChatGPT引发的人工智能热潮,2023年的融资额会更低。” 到目前为止,2023年AI行业最大的一笔融资,就是微软在1月对OpenAI投资的100亿美元。 虎嗅根据公开数据统计,在美国的大模型公司创业中,Inflection AI或将成为人工智能领域融资量仅次于Open AI的第二大初创公司,在其之后分别是,Anthropic(15亿美元),Cohere(4.45亿美元)、Adept(4.15亿美元)、Runway(1.955亿美元)、Character.ai(1.5亿美元)和Stability AI(约1亿美元)。 在中国,2023年上半年国内人工智能行业的公开投融资事件共有456起。而这项统计在2018年-2022年的5年间分别是731、526、353、631和648。 上半年国内人工智能行业公开投融资事件 另一个引发飞轮的事件则是ChatGPT放出API接口。当OpenAI在3月首次开放ChatGPT的API接口时,AI行业内外对此几乎形成共识:行业要变天了。随着更多应用接入大模型,AI之上正在长出更加繁茂的森林。 “做大模型和做应用本身就应该分开”,投资人的嗅觉总是敏锐的,在源码资本执行董事陈润泽看来,AI是一个与半导体分工一样的逻辑,AI大模型的繁荣之后,很快就会看到AI应用的一波繁荣。 今年年初,陈润泽与同事一起前往硅谷时发现,硅谷声名显赫的创业孵化器Y Combinator(OpenAI首席执行官Sam Altman曾在这家孵化器任总裁多年),有一半的项目都转型做生成式AI了。对于大模型的热情,丝毫不逊于如今大洋彼岸的中国。 不过,他也发现在美国无论是资本还是创业者,相比于大模型创业,更看好基于大模型所做的生态应用,毕竟在这个赛道,已经跑出了诸如OpenAI这样的公司,与此同时,美国有很强的ToB应用生态土壤,因此更多的美国公司正在尝试基于大模型的生态做企业应用。...
大厂赶超ChatGPT
ChatGPT

大厂赶超ChatGPT

原标题:大厂赶超ChatGPT ChatGPT上线的两百天里,国内大模型发展开启“狂飙”模式。 据称,中国10亿参数规模以上的大模型已发布79个。 大模型进化场,讲究一个百模混战:百度文心大模型已进化至3.5形态;阿里通义千问构建家族模式;京东言犀大模型则是为自己“量身定做”的产业大模型;美团牵手清华系,领投AI公司智谱华章;360智脑将接入“360全家桶”…… 大厂大模型进化论,残酷又现实,要么赶超,要么被淘汰。 抢跑且不停刻苦训练的百度文心大模型3.5,近日宣称最新版本文心一言能力已经超出ChatGPT 3.5。 物竞天择,适者生存,大厂大模型纷纷赶超ChatGPT。 作者|洛枳 辛夷 出品|新摘 一、大厂大模型 超过ChatGPT3.5 身穿黑色内搭外穿白色西服外套,搭配干净利落的短发,出现在AI大模型技术能力评估报告大会上。 前一天晚上还在修改议题,刚刚出差回来的百度集团副总裁吴甜在会上说到:“新版本文心一言能力已经超出ChatGPT 3.5,这也是在我们国内开展相关技术工作是重要的里程碑。” 这是继科大讯飞刘庆峰提到星火大模型即将赶超ChatGPT后,又一家大厂正式确认大模型超过ChatGPT。 今年3月,百度新一代知识增强大语言模型“文心一言”公开邀测,该模型基于文心大模型3.0版本打造。时隔3个多月,已经升级为3.5版本的文心大模型,在效果、功能、性能全面提升。 文心一言3.5赶超ChatGPT3.5,很大可能是在功能方面新增了插件机制,文心大模型3.5通过插件方式扩增了大模型的能力边界。 大模型强调大模型技术实力和底座能力。今年5月份,百度上线的新底座大模型正是文心大模型3.5,该模型是文心一言系统的基础模型,给了文心大模型扎实的底座基础,也让文心一言3.5成功赶超ChatGPT。 值得一提的是,在基础模型训练中,3.5版本还采用了飞桨最先进的自适应混合并行训练技术及混合精度计算策略,这大大加快了模型的迭代速度。 众所周知,百度一直在深耕全栈式人工智能技术研发,共四层:芯片层、框架层、模型层和应用层。 芯片层有昆仑芯;框架层有深度学习平台飞桨,有力支撑了大模型的高效训练和推理;模型层有文心大模型;在应用层,目前有15万家企业申请接入文心一言测试。 其中,飞桨平台已经有750万开发者,对比中国软件从业人员800万—1000万,尽管软件从业人员和深度学习开发人员不完全一致,但在人才数量上的优势也为文心3.5赶超ChatGPT提供了大容量智库,类似超脑的存在。 中国企业在获得中文语料和对中国文化的理解方面,相较于外国企业本来就有着天然的优势,中国制造业门类最全,具有面向实体产业训练产业AIGC的有利条件。 众多因素合力助推,文心大模型3.0为基座的文心一言发布一百多天后,在飞桨与文心的协同优化下,文心大模型3.5成长飞速,最新模型效果提升50%,训练速度提升2倍,推理速度提升30倍,成功赶超ChatGPT。 在基础技术之上,百度额外开展了三大增强技术:知识增强、检索增强和对话增强。 将大模型类比成人类,人如果用知识结构,知识体系的方式进行学习的话,学习效率更高。再学会使用工具进行搜索,实现端对端的极简化检索,又可以提升时效性。 大模型自己学习完之后,还得学会反馈式强化训练,对话增强很像是不断让大模型在做题,在对话中告诉大模型哪里对,哪里不对,通过提示的方式,让大模型能够增强记忆机制,有效的让他按照我们希望的方式来回答问题,教会这个孩子怎么样回答的更好。 除了技术实力,大模型需要落地。 在行业应用方面,百度文心大模型源于产业实践,服务于产业实践,已经摸索出大模型产业落地的关键路径,还发布了涵盖众多行业和领域的大模型,加速对行业智能化转型。 目前,国家电网、浦发、泰康、吉利、哈尔滨市、深圳燃气、TCL等企业单位,百度文心大模型均有合作。 此外,百度十年来研发投入超1000亿,2021年核心研发投入占比超23%,人工智能专业申请量和授权量连续5年排名国内第一,深度学习专利申请量全球第一。百度能在AI大模型领域有突破,与百度在要素资源上的大力投入也息息相关。 可以看出,大厂大模式,拼研发的时刻到了。 二、大厂大模型哪家强? 今年上半年正式公开宣布做大模型的企业就有近百家,各家大模型正陷入酣战。其中,有阿里、百度、腾讯、京东、字节跳动等互联网大厂玩家,也有科大讯飞、商汤科技等AI公司,还有其他“杂牌军”也混入其中。 半年时间,大模型赛道完成了从概念到落地的进程,这放在任何赛道都很炸裂。 但是,到目前为止,都没有明确的指标或者准则去验证谁家的大模型更优质,一个接着一个发布会,“王婆卖瓜自卖自夸”式的自我评价,令人眼花缭乱之余,并没有太多客观性。 那么,百模大战,究竟谁更胜一筹? 在IDC最新发布的《AI大模型技术能力评估报告,2023》中,首次提出AI大模型技术能力评估框架。 评估大模型共有三大维度:产品技术、服务生态、行业应用。 具体细分指标可达12个:算法模型、服务能力、通用能力、创新能力、平台能力、安全可解释、生态合作、行业覆盖、金融、工业、医疗、能源。 其中,算法模型和行业覆盖,是衡量大模型能力最重要的2个指标,特别是,二者可以形成持续迭代提升的飞轮。 产品技术能力中,“算法模型”维度是大模型能力最为核心的要素,也是决定大模型应用效果的根本所在。 原因在于,只有通过算法模型技术的突破,实现具有通用效果优势的大模型底座,才能支撑更广泛的行业覆盖,使各行各业充分享受技术突破带来的红利,破解AI落地门槛高的困境。 行业应用能力中,应用覆盖的广度是当下大模型厂商最为关注的指标,是大模型效果通用领先性、行业结合能力的综合体现。...
复旦发布中国版 ChatGPT :MOSS
MOSS

复旦发布中国版 ChatGPT :MOSS

ChatGPT 是最先进的 AI,也是最热门的应用 —— 自去年 11 月底发布以来,它的月活跃用户两个月超过一亿,轻松拿到了全球互联网史上用户增长速度的第一。它也是一种门槛很高的技术。由于 ChatGPT 的训练过程所需算力资源大、标注成本高,目前国内暂未出现对大众开放的同类产品。百度、阿里、京东等互联网大厂都放出消息,表示正在打造「国产 ChatGPT」,并将在近期发布。在各大厂产品到位之前,学界先有了消息。2 月 20 日晚,复旦大学自然语言处理实验室发布了具备 ChatGPT 能力的语言模型 ——MOSS,并面向大众公开邀请内测。MOSS 体验链接:https://moss.fastnlp.top/MOSS 项目主页:https://txsun1997.github.io/blogs/moss.html MOSS 的名称来自电影《流浪地球》,和电影一样火的是,MOSS 发布的消息很快冲上了知乎等平台热搜榜的第一位。 不过与科幻不同的是,现实世界的 AI 还没有量子计算机加持,距离开放还没有过 24 个小时,由于瞬时访问压力过大,MOSS 服务器昨晚已被挤爆,可见大家对于生成语言模型的期待程度有多高。据复旦大学研究人员介绍,目前在内测,与用户交互迭代优化,不适合公测。 我们知道,自然语言处理是 AI 领域的最大挑战之一,虽然突破已经出现,但这个月上线的新必应搜索,以及谷歌发布的竞品 BARD 在测试中不时会出现问题,复旦大学的 MOSS 水平如何呢?对话 MOSS,水平如何?MOSS 的基础功能与 ChatGPT 类似,可以按照用户输入的指令完成各类自然语言处理任务,包括文本生成、文本摘要、翻译、代码生成、闲聊等等。在预览期间,MOSS 的使用是免费的。 MOSS 和 ChatGPT 一样,构建的过程包括自然语言基础模型训练,以及理解人类意图的对话能力训练两个阶段。 据项目主页介绍,MOSS 和 ChatGPT...
Bard、Cladue、GPT掀起海外大模型“混战”,OpenAI开始反内卷?Meta击败 Midjourney|「硬AI」周报
MOSS

Bard、Cladue、GPT掀起海外大模型“混战”,OpenAI开始反内卷?Meta击败 Midjourney|「硬AI」周报

AI界在本周发生了哪些大事呢? 观点前瞻 大模型都在追赶ChatGPT,而OpenAI却准备成为反内卷达人; 本周,OpenAI前脚刚刚更新了插件“Code interpreter”,两大最强竞争对手Anthropic和谷歌就相继宣布更新Claude和Bard; 两家竞对现在的升级趋势就是让用户“免费用上GPT4 plus”,甚至是超越它; 而反观Ai大模型鼻祖,这边也是不慌不忙:不仅不卷大模型,甚至是准备停下来等等其它大模型的步伐。 “根据外媒报道,OpenAI正准备开始创建多个运行成本较低的小型GPT-4模型,每个较小的专家模型都在不同的任务和主题领域进行训练。” 简而言之,就是OpenAI家正打算走降本的轻量化路线,下一目标很可能是推广多种垂类大模型。 在【硬AI】看来,OpenAI这种【混合专家模型】的思路确实会在当下牺牲了一部分回答质量,但也许是更接近产业应用的一条有效路径。 本周日报你还能获得以下咨询: 1、Bard、Claude2、ChatGPT纷纷升级,谁都不闲着 2、AI作图界继续开卷: Meta击败Midjourney;Stability AI联合腾讯推出Stable Doodle;视频分割大模型【SAM-PT】现身; 3、国内模型大事件: 网信办给国内大模型“上保险”;阿里开源国内首个大模型”对齐数据集”;京东发布言犀大模型;智源超越DeepMind;王小川大模型再升级 4、海外热点消息 牛津、剑桥纷纷解除对ChatGPT禁令;Meta要发AI模型商用版;马斯克“打脸”现场,从抵制AI到成立”xAI”; Bard、Claude2、ChatGPT都不闲着 1、Bard更新:支持中文、图像理解、语音提问 此前只支持英文提问的Bard终于更新了中文等40多种语言的输入,还新增欧盟和巴西地区访问, 不仅如此,Bard还更新了以下几个功能: 上传和理解图片(tips:仅支持英文版)可以通过语音进行提问;保存历史记录和分享对话链接(与GPT一样)定制回复的长度、风格导出代码功能 2、Claude2:一键帮你总结PDF Claude升级的第二代直接用上GPT plus会员,支持上传PDF,还能帮你查找、总结多文档内容之间的关系(支持txt、pdf多种格式,最高不超过10MB) 3、ChatGPT上线最牛插件-代码解释器 GPT4最新插件-代码解释器,起初这个插件被称作—让每个人都成为数据分析师(主要是在数据处理、绘图方面很厉害); 不过最近又在网友的测试下,解锁了一些新功能:比如做成小视频、制作简易小游戏、表情包等等; 感觉这个插件的功能还有待网友们继续探索和解密。 AI作图界又发生了哪些大事 1、Meta突破多模态天花板,打败Stable Diffusion、Midjourney Meta推出一款单一多模态大模型——CM3leon,问市即巅峰? 现在都说CM3leon比Stable Diffusion、Midjourney、DALL-E 2还牛,这是为啥? 【有多硬】 CM3leon采用自回归模型独领风骚,比前期领航梯队Stable Diffusion等多模态采用的扩散模型的计算量少了五倍; 能处理更复杂的提示词,并且完成作图任务; 根据任意格式的文本指令对现有图像进行编辑,比如更改天空颜色,或者在特定位置添加对象。 客观的说:CM3leon能达到的能力还真的可以位居多模态市场巅峰,不仅是清晰度更高、还能突破此前多模态的绘画瓶颈:比如手部细节刻画、用语言提示词进行物体、空间细节布局等;...
通用VS垂直,讯飞星火与网易子曰不同的“大模型解法”
星火

通用VS垂直,讯飞星火与网易子曰不同的“大模型解法”

配图来自Canva可画 随着大模型商业化应用的提速,全世界各国都开始孵化和孕育各自的行业大模型。在此背景下,国内各个细分行业的垂直大模型,日益受到产业界的关注和重视。 相比通用大模型,垂直大模型具有门槛较低、数据质量较好且靠近落地场景的优势,因而伴随着大模型产业化的深入,其发展空间进一步打开,正在成为下一阶段行业竞争的焦点。事实上,一些受大模型影响特别明显的垂直行业如教育行业,已经率先掀起了大模型竞赛。 大模型成教育领域新变量 今年以来,教育领域包括网易有道、好未来、科大讯飞等行业巨头,先后公布了自己在AI大模型领域的布局和进展,由此大模型之风迅速席卷教育行业。而在教育领域纷纷刮起大模型之风的背后,则与多方面的因素有关。 首先,教育领域和AI大模型有很高的契合度,因而具备更好的落地条件。当前AI大模型大都具备自然语音处理、语音识别、图像识别等诸多能力,其为智能教育在视、听、音等多模态下,实现教育场景全覆盖提供了可能,成为“AI+教育”的核心引擎。此外,随着多模态生成技术的成熟,多模态生成模型的深度融合,将进一步使AI教学、AI虚拟互动趋于立体化,打破扁平的文本式结构,通过图像、视频、数字人生成等技术为教辅产品提供丰富的教学素材和内容呈现形式,打造全新的智能教育生态。 其次,用户对于教育智能产品的接受度日渐提升,AI大模型能够为用户带去更加智能的教育体验。目前AI教育已经发展一段时间了,用户对于智能化的教育产品,也有了相应的认知与了解,而AI大模型的应用,则能为智能教育的发展增添新动能。比如,智能硬件接入AI大模型之后,硬件的交互体验得到了加强,产品智能化也有了“质”的飞跃。 最后,AI大模型可以同时在B端和C端发力,在撬动庞大教育市场的同时,可以做到最小成本实现“因材施教”的教学目标,非常契合当下教育市场的阶段需求。一般而言,教育的投入来源有二:一方面是C端的教育培训消费,另一方面是B端的教育信息化投入,而这两方面都可以构筑起规模相当庞大的市场。如在C端,AI有望成为学生的“智能老师”,为孩子提供作文批改和英语对话等个性化场景学习服务,实现因材施教;在B端,则可以聚焦相对标准化的考场阅卷、在线教学等场景,大幅度提升考试阅卷的效率和准确率。基于此,大模型正在成为教育领域全新变量。 不同路线、不同思路 从整个行业来看,由于参与玩家的背景不同,其所走的路线也存在显著差异。目前来看,发力教育领域的大模型厂商主要分为两类:一是以百度文心一言、科大讯飞星火大模型为代表的通用大模型厂商,其面向的是包括教育在内的泛行业企业;二是以网易有道、学而思等为代表的垂直大模型厂商,其主要专注教育细分领域。结合各个厂商的情况来看,不同路线的背后,实际上对应着厂商的不同思路。 对于大厂而言,由于它们总体综合实力较强,具备构建大模型的一些底层技术能力,因而其更倾向于走通用大模型路线,后期借助大模型与场景结合,快速搭建起服务生态。目前业内包括百度、腾讯、阿里、科大讯飞等厂商,都纷纷依托自身的技术优势、团队优势和资金支持,在通用大模型领域实现了抢跑。比如阿里发布了通义千问大模型、华为发布了盘古大模型、百度发布了文心一言、科大讯飞发布了星火大模型等,在抢夺市场机会的同时,其直面产业的“倾向”也越来越明显。 比如,百度就宣称与超过300家企业成为生态伙伴;4月阿里云也宣布与七家企业推动大模型在油气、电力、交通等行业落地;华为早前也发布了盘古金融、电力、药物分子三个垂直领域大模型;而刚刚公布MaaS解决方案的腾讯,已和数十个行业的22家企业达成大模型共建合作;科大讯飞更是宣布,星火大模型首批接入36个行业3000余家企业……可见,当下推动大模型场景落地、打通服务生态,依然是通用大模型厂商的核心任务。 对于垂直行业厂商而言,其在行业深耕已久,对用户的需求理解和场景落地具备更强的洞察能力,又综合了专家经验、组织能力、工程能力的knowhow优势,具备高质量触达用户场景的竞争力。与通用大模型厂商不同,一些重要的行业玩家如新华三、京东、网易有道、携程等,则聚焦大模型与产业的融合机会,紧盯垂直赛道。比如,京东发布了言犀大模型、京医千询大模型,携程发布了携程问道大模型,网易有道发布了基于教育的子曰大模型。相比通用大模型厂商而言,垂直大模型厂商在相关行业深耕已久,因而在寻找产业机会方面往往走得更加深入。 以网易有道为例,网易有道早在2016年就开始构建AI协同基础能力,同步组建语音、视觉、声音等团队,积累了四大底层技术:有道神经网络翻译(NMT)、计算机视觉、智能语音AI技术、高性能计算等,同时网易有道深耕在线教育多年,已经在名师、线上网课、用户体量等方面构建起了比较优势,这让网易有道相比行业外的厂商更了解教育,相比教育行业内的友商更懂AI。基于这种优势,网易有道更容易抓住大模型在教育领域的落地机会,并借助它打造差异化的智能硬件,以及差异化的服务和用户体验,夯实其行业竞争力。 从这个角度来看,通用大模型厂商与垂直大模型厂商只是分工不同,并没有绝对优劣之分。 有道打响教育大模型应用第一枪 作为国内首个自研教育大模型,网易“子曰”大模型的发布,正式打响了教育领域垂直大模型应用第一枪,其现实意义不言而喻。 一方面,相比底层技术,靠近前端应用的垂直大模型的技术价值、商业价值更具想象空间。正如前文所述,随着大模型逐步深入产业,其应用价值愈加凸显。以7月26日网易有道推出的子曰大模型为例,其基于大模型成功推出了6个已经落地,或者即将落地的应用,分别是虚拟人口语教练、中文作文指导、英语语法精讲、AIBOX、文档问答和LLM翻译。 以表现最为出彩的虚拟人口语教练为例,它已经在应用层面无限接近真人口语老师的水平了。比如,它在跟你互动过程中,会根据你的回答做出类似人类的评价,例如它问你“Can you tell me what you know about Chinese history?”你回答:“more than 5000 years,I learned”,它会跟一句:“yes,that is great,do you know about the Han Dynasty ……”形成联系上下文的有来有往的对话文本,全程虚拟人表情生动、发音地道,突破了以往“教条”的剧本式交流局限。 另外,它还具备很强的即时反馈机制和纠错能力。比如,笔者在跟它对话过程中,它能够根据笔者的发音和文字,生成练习报告给笔者以即时反馈,帮助笔者快速锁定语言卡点,覆盖8个话题场景和68个话题的内容储备,让其口语表达更精准,交流体验更接近真人水平。 而在虚拟人口语教练良好用户体验的背后,离不开其强大的底层“黑科技”实力。比如,虚拟人口语教练在语音识别能力方面进行了巨大的革新,它支持多语种的流式低延迟语音识别技术,让虚拟人Echo在中式英语、英语、中英混合等场景下游刃有余;声学降噪、回声消除、自动语音检测、自动断句等技术,则让它像一个真正的倾听者和交流者。在AI虚拟人的驱动方面,有道基于自主研发的情感识别算法和实时渲染驱动引擎,对播放的语音数据进行深度分析,使其面部表情更接近真人。 在其他应用方面,它的表现也毫不逊色。比如,在AI作文指导方面,它不仅能够批改,还能够像老师一样作指导;另外,它在语法精讲、LLM翻译、AIbox、文档问答等方面,都已经在落地或者正在落地,正在成为一个“全能的AI语言文字助手”。预计未来随着更多AI应用的落地,它将会在更多方面对用户生产力提升产生重大影响。 另一方面,网易有道子曰教育大模型的发布,也标志着网易有道多年深耕AI,在通用AI能力上走向了成熟,具备了产生应用的强大实力。前文提到,好的垂直大模型需要深厚的AI通用能力作为底座才能够走的更远,作为教育行业首个垂直大模型厂商,网易子曰大模型的推出,实际上正是建构在网易有道多年的AI通用技术能力之上。 作为国内NLP能力领先的公司,有道多年来一直致力于基于Transformer模型的创新和应用,还积累了OCR、ASR、TTS、CAPT等几大核心技术,正是这些技术的有效整合,打开了新的想象空间,让有道成为国内率先将AIGC技术落地教育场景内的企业。...
原创
            通用VS垂直,讯飞星火与网易子曰不同的“大模型解法”
星火

原创 通用VS垂直,讯飞星火与网易子曰不同的“大模型解法”

原标题:通用VS垂直,讯飞星火与网易子曰不同的“大模型解法” 配图来自Canva可画 随着大模型商业化应用的提速,全世界各国都开始孵化和孕育各自的行业大模型。在此背景下,国内各个细分行业的垂直大模型,日益受到产业界的关注和重视。 相比通用大模型,垂直大模型具有门槛较低、数据质量较好且靠近落地场景的优势,因而伴随着大模型产业化的深入,其发展空间进一步打开,正在成为下一阶段行业竞争的焦点。事实上,一些受大模型影响特别明显的垂直行业如教育行业,已经率先掀起了大模型竞赛。 大模型成教育领域新变量 今年以来,教育领域包括网易有道、好未来、科大讯飞等行业巨头,先后公布了自己在AI大模型领域的布局和进展,由此大模型之风迅速席卷教育行业。而在教育领域纷纷刮起大模型之风的背后,则与多方面的因素有关。 首先,教育领域和AI大模型有很高的契合度,因而具备更好的落地条件。当前AI大模型大都具备自然语音处理、语音识别、图像识别等诸多能力,其为智能教育在视、听、音等多模态下,实现教育场景全覆盖提供了可能,成为“AI+教育”的核心引擎。此外,随着多模态生成技术的成熟,多模态生成模型的深度融合,将进一步使AI教学、AI虚拟互动趋于立体化,打破扁平的文本式结构,通过图像、视频、数字人生成等技术为教辅产品提供丰富的教学素材和内容呈现形式,打造全新的智能教育生态。 其次,用户对于教育智能产品的接受度日渐提升,AI大模型能够为用户带去更加智能的教育体验。目前AI教育已经发展一段时间了,用户对于智能化的教育产品,也有了相应的认知与了解,而AI大模型的应用,则能为智能教育的发展增添新动能。比如,智能硬件接入AI大模型之后,硬件的交互体验得到了加强,产品智能化也有了“质”的飞跃。 最后,AI大模型可以同时在B端和C端发力,在撬动庞大教育市场的同时,可以做到最小成本实现“因材施教”的教学目标,非常契合当下教育市场的阶段需求。一般而言,教育的投入来源有二:一方面是C端的教育培训消费,另一方面是B端的教育信息化投入,而这两方面都可以构筑起规模相当庞大的市场。如在C端,AI有望成为学生的“智能老师”,为孩子提供作文批改和英语对话等个性化场景学习服务,实现因材施教;在B端,则可以聚焦相对标准化的考场阅卷、在线教学等场景,大幅度提升考试阅卷的效率和准确率。基于此,大模型正在成为教育领域全新变量。 不同路线、不同思路 从整个行业来看,由于参与玩家的背景不同,其所走的路线也存在显著差异。目前来看,发力教育领域的大模型厂商主要分为两类:一是以百度文心一言、科大讯飞星火大模型为代表的通用大模型厂商,其面向的是包括教育在内的泛行业企业;二是以网易有道、学而思等为代表的垂直大模型厂商,其主要专注教育细分领域。结合各个厂商的情况来看,不同路线的背后,实际上对应着厂商的不同思路。 对于大厂而言,由于它们总体综合实力较强,具备构建大模型的一些底层技术能力,因而其更倾向于走通用大模型路线,后期借助大模型与场景结合,快速搭建起服务生态。目前业内包括百度、腾讯、阿里、科大讯飞等厂商,都纷纷依托自身的技术优势、团队优势和资金支持,在通用大模型领域实现了抢跑。比如阿里发布了通义千问大模型、华为发布了盘古大模型、百度发布了文心一言、科大讯飞发布了星火大模型等,在抢夺市场机会的同时,其直面产业的“倾向”也越来越明显。 比如,百度就宣称与超过300家企业成为生态伙伴;4月阿里云也宣布与七家企业推动大模型在油气、电力、交通等行业落地;华为早前也发布了盘古金融、电力、药物分子三个垂直领域大模型;而刚刚公布MaaS解决方案的腾讯,已和数十个行业的22家企业达成大模型共建合作;科大讯飞更是宣布,星火大模型首批接入36个行业3000余家企业……可见,当下推动大模型场景落地、打通服务生态,依然是通用大模型厂商的核心任务。 对于垂直行业厂商而言,其在行业深耕已久,对用户的需求理解和场景落地具备更强的洞察能力,又综合了专家经验、组织能力、工程能力的knowhow优势,具备高质量触达用户场景的竞争力。与通用大模型厂商不同,一些重要的行业玩家如新华三、京东、网易有道、携程等,则聚焦大模型与产业的融合机会,紧盯垂直赛道。比如,京东发布了言犀大模型、京医千询大模型,携程发布了携程问道大模型,网易有道发布了基于教育的子曰大模型。相比通用大模型厂商而言,垂直大模型厂商在相关行业深耕已久,因而在寻找产业机会方面往往走得更加深入。 以网易有道为例,网易有道早在2016年就开始构建AI协同基础能力,同步组建语音、视觉、声音等团队,积累了四大底层技术:有道神经网络翻译(NMT)、计算机视觉、智能语音AI技术、高性能计算等,同时网易有道深耕在线教育多年,已经在名师、线上网课、用户体量等方面构建起了比较优势,这让网易有道相比行业外的厂商更了解教育,相比教育行业内的友商更懂AI。基于这种优势,网易有道更容易抓住大模型在教育领域的落地机会,并借助它打造差异化的智能硬件,以及差异化的服务和用户体验,夯实其行业竞争力。 从这个角度来看,通用大模型厂商与垂直大模型厂商只是分工不同,并没有绝对优劣之分。 有道打响教育大模型应用第一枪 作为国内首个自研教育大模型,网易“子曰”大模型的发布,正式打响了教育领域垂直大模型应用第一枪,其现实意义不言而喻。 一方面,相比底层技术,靠近前端应用的垂直大模型的技术价值、商业价值更具想象空间。正如前文所述,随着大模型逐步深入产业,其应用价值愈加凸显。以7月26日网易有道推出的子曰大模型为例,其基于大模型成功推出了6个已经落地,或者即将落地的应用,分别是虚拟人口语教练、中文作文指导、英语语法精讲、AIBOX、文档问答和LLM翻译。 以表现最为出彩的虚拟人口语教练为例,它已经在应用层面无限接近真人口语老师的水平了。比如,它在跟你互动过程中,会根据你的回答做出类似人类的评价,例如它问你“Can you tell me what you know about Chinese history?”你回答:“more than 5000 years,I learned”,它会跟一句:“yes,that is great,do you know about the Han Dynasty ……”形成联系上下文的有来有往的对话文本,全程虚拟人表情生动、发音地道,突破了以往“教条”的剧本式交流局限。 另外,它还具备很强的即时反馈机制和纠错能力。比如,笔者在跟它对话过程中,它能够根据笔者的发音和文字,生成练习报告给笔者以即时反馈,帮助笔者快速锁定语言卡点,覆盖8个话题场景和68个话题的内容储备,让其口语表达更精准,交流体验更接近真人水平。 而在虚拟人口语教练良好用户体验的背后,离不开其强大的底层“黑科技”实力。比如,虚拟人口语教练在语音识别能力方面进行了巨大的革新,它支持多语种的流式低延迟语音识别技术,让虚拟人Echo在中式英语、英语、中英混合等场景下游刃有余;声学降噪、回声消除、自动语音检测、自动断句等技术,则让它像一个真正的倾听者和交流者。在AI虚拟人的驱动方面,有道基于自主研发的情感识别算法和实时渲染驱动引擎,对播放的语音数据进行深度分析,使其面部表情更接近真人。 在其他应用方面,它的表现也毫不逊色。比如,在AI作文指导方面,它不仅能够批改,还能够像老师一样作指导;另外,它在语法精讲、LLM翻译、AIbox、文档问答等方面,都已经在落地或者正在落地,正在成为一个“全能的AI语言文字助手”。预计未来随着更多AI应用的落地,它将会在更多方面对用户生产力提升产生重大影响。 另一方面,网易有道子曰教育大模型的发布,也标志着网易有道多年深耕AI,在通用AI能力上走向了成熟,具备了产生应用的强大实力。前文提到,好的垂直大模型需要深厚的AI通用能力作为底座才能够走的更远,作为教育行业首个垂直大模型厂商,网易子曰大模型的推出,实际上正是建构在网易有道多年的AI通用技术能力之上。...