文章主题:文章关键词:ChatGPT, 应用, 人工智能, 创业公司
❑导读
ChatGPT“狂飙”,国内科技公司迅速上车。
全文共计6617字,预计阅读时间9分钟
来源| 数据观综合(转载请注明来源)
编辑| 蒲蒲
五天超过百万用户,两个月获得上亿用户,ChatGPT成为了史上扩散速度最快的应用。
根据调研机构CBInsights的数据,当前,大约有250家初创公司致力于ChatGPT的概念领域,其中有51%的公司已经完成了A轮或天使轮的融资。在2022年,ChatGPT和AIGC领域的总金额吸收超过了26亿美元,同时,也催生了6家独角兽企业。在这些企业中,估值最高的是OpenAI,达到了290亿美元。
与此同时,ChatGPT还掀起了新一轮人工智能浪潮,全球科技巨头纷纷布局人工智能赛道。
ChatGPT的爆火,打开了AI和投资世界的新风口,且热度持续不减。
根据全球早期的资金调研机构CB Insights的最新报告,我们发现2022年共有110笔创业投资交易与ChatGPT的概念相关,总的投资金额超过了26亿美元。这一数据充分展示了ChatGPT在全球范围内的热度之高以及投资者对其巨大潜力的认可。
在对ChatGPT概念领域的团队成员进行深入调研之后,我们发现目前约有250家初创公司正在这一领域开展业务。令人关注的是,在这些公司中,仍有33%的企业尚未吸引到任何形式的外部股权投资。而剩下的51%企业在A轮募资阶段,或者已经处于A轮募资的前期阶段。这无疑是一个值得关注的趋势,因为它反映了这个领域内企业的发展潜力和市场前景。
另外,根据CB Insights的数据显示,AIGC领域目前已有六家独角兽公司。在这其中,OpenAI凭借其推出的ChatGPT而获得了200亿美元的估值,紧随其后的是Hugging Face,其估值达到了20亿美元。此外,Lightricks的估值为18亿美元,而content build-up kit driven by AI的Jasper则值为15亿美元。对于Glean和Stability AI,它们的估值均为10亿美元,表现垫底。
ChatGPT所属的较新创团队在2022年的募资表现亦是不容忽视。尽管其规模相对较小,但团队成员依然具备一定实力。例如,Anthropic在B轮融资中成功筹得5.8亿美元,这使得该人工智能模型开发人员与研究机构更具有信心和底蕴。与此同时,专注于人机介面的Inflection AI在A轮中成功筹集了2.25亿美元资金,显示出了其在市场中的强大吸引力。此外,Cohere作为NLP工具包开发团队的成员,也在B轮中成功从市场中获得了1.25亿美元的投资。这些成功的融资案例充分证明了ChatGPT及其团队在人工智能领域的实力与潜力。
在ChatGPT风口抢占大战上,微软和谷歌率先开战。
在2月7日的科技界动态中,谷歌公司发布了一款备受瞩目的产品——“Bard”,它是一款人工智能聊天机器人服务。紧接着,微软公司在2月8日的华盛顿雷德蒙德发布会上,也宣布推出了一款全新的搜索引擎Bing和Edge浏览器,这款搜索引擎是由ChatGPT和GPT-3.5共同提供的。仅仅过去了两天,微软公司就正式推出了ChatGPT版必应搜索和Edge浏览器。
国外两大巨头激烈争斗的同时,国内相关企业也迅速跟进,争相布局相关产品。
百度:「文心一言」3月见
在国内众多科技公司中,百度是最早针对 ChatGPT 做出明确表态的公司之一。
2月7日,百度正式官宣将在3月上线百度版 ChatGPT——「文心一言」(英文名为 ERNIE Bot)。据知情人士透露,百度搜索早就接入了文心相关技术,「文心一言」的推出或将对百度搜索的升级起到重大作用。
知情人士透露,此次文心一言落地,首站将直接接入百度搜索。一些相关功能已陆续在百度搜索内上线或内测,包括多答案回复、智能生成等。
前段时间,百度 CEO 李彦宏将 2023 年一季度 OKR 关键任务定为“引领搜索体验的代际变革”。同时,李彦宏提到,ChatGPT 相关技术已达到临界点,百度在其中有较大的机会。
百度方面表示,ChatGPT相关技术,百度都有。百度在人工智能四层架构中有全栈布局,包括底层芯片、深度学习框架、大模型以及最上层的搜索等应用。而文心一言位于模型层。
2月14日,上海报业集团旗下澎湃新闻、重庆日报报业集团旗下上游新闻、每日经济新闻等多家媒体平台宣布接入百度“文心一言”,成为生态合作伙伴。除媒体外,爱奇艺、携程、集度汽车、宇信科技、汉得信息、金蝶软件、宝宝巴士、智联招聘等企业也宣布加入百度文心一言生态圈。
作为国内最早开始进行大模型研发的科技企业之一,百度在2019年3月率先发布中国首个正式开放的预训练模型 ERNIE1.0,并持续投入于大模型的研发升级。2021年12月,ERNIE 3.0 升级为全球首个知识增强千亿大模型,成为目前为止全球最大的中文单体模型。
腾讯:专项研究有序推进
2月9日,针对在ChatGPT的布局,腾讯方面回应称:“目前,腾讯在相关方向上已有布局,专项研究也在有序推进。腾讯持续投入 AI 等前沿技术的研发,基于此前在 AI 大模型、机器学习算法以及 NLP 等领域的技术储备,将进一步开展前沿研究及应用探索。”
2022年4月,腾讯对外正式宣布,腾讯“混元”AI大模型在MSR-VTT,MSVD,LSMDC,DiDeMo和ActivityNet 五大跨模态视频检索数据集榜单中先后取得第一名的成绩,实现了该领域的大满贯。特别是在MSR-VTT榜单上,“混元”AI大模型将文字-视频检索精度提高到55%,领先第二名1.7%,位居行业第一。
各模型方法在5个公开数据集上指标对比
这是腾讯首次对外披露“混元”AI大模型的研发进展,该模型包含但不限于:计算机视觉、自然语言处理、多模态内容理解、文案生成、文生视频等多个方向的超大规模AI智能模型。“混元”AI大模型基于腾讯太极机器学习平台进行研发,借助GPU算力,实现快速的算法迭代和模型训练。
HunYuan_tvr模型架构示意图
目前,“混元“AI大模型已被广泛应用到广告创作、广告检索、广告推荐等腾讯业务场景中。一方面,该模型能够帮助广告创作者和腾讯平台方预测视频内容与消费者群体之间的兴趣关联,提升创作效率;另一方面,能够有效提升广告推荐的精准度,让内容搜索和匹配更加精确,有效优化用户体验。
阿里巴巴:目前处于内测阶段
2月8日,据阿里巴巴一名资深技术专家爆料,阿里达摩院正在研发类 ChatGPT 的对话机器人,目前已开放给公司内员工测试。
从曝光的截图来看,达摩院研发的对话机器人同ChatGPT一样,对用户提出的问题对答如流。
针对此事,阿里巴巴回应称:“确实在研发中,目前处于内测阶段。”后续如有更多信息,会第一时间和大家同步。
从曝光截图来看,阿里巴巴可能将 Ai 大模型技术与钉钉生产力工具深度结合。钉钉方面也向媒体表示,阿里版本的 ChatGPT 的对话机器人将和钉钉深度结合。
从此前发布来看,早在2021年阿里即开始在AI大模型领域加码投入。当年11月,达摩院的多模态大模型M6,参数规模从万亿跃迁至10万亿,规模超越海外公司发布的万亿级模型,成为全球最大的AI预训练模型。相比之前业界标杆大模型,M6实现同等参数规模,能耗仅为其1%,极大减少了超大模型训练所需算力。
2022年下半年,阿里巴巴达摩院发布“通义”大模型系列,核心模型通过“魔搭”社区向全球开发者开源开放,该动作降低了AI的应用门槛。通义打造了AI统一底座,构建了大小模型协同的层次化人工智能体系,为AI从感知智能迈向知识驱动的认知智能提供先进基础设施。
为了实现大模型的融会贯通,阿里达摩院在国内率先构建 AI 统一底座,在业界首次实现模态表示、任务表示、模型结构的统一。通过这种统一学习范式,通义统一底座中的单一 M6-OFA 模型,在不引入任何新增结构的情况下,可同时处理图像描述、视觉定位、文生图、视觉蕴含、文档摘要等 10 余项单模态和跨模态任务,并达到国际领先水平。这一突破最大程度打通了 AI 的感官,受到学界和工业界广泛关注。近期 M6-OFA 完成升级后可处理超过 30 种跨模态任务。
京东:将推出「产业版」ChatGPT
2月10日,京东云通过官方公众号发布了将推出“产业版”ChatGPT——ChatJD 的消息,同时公布了 ChatJD 的落地应用路线图“125”计划。具体为:
1 个平台:ChatJD 智能人机对话平台,即自然语言处理中理解和生成任务的对话平台,预计参数量达千亿级;
2 个领域:零售、金融,得益于京东云在零售与金融领域 10 余年真实场景的深耕与沉淀,已拥有 4 层知识体系、40 多个独立子系统、3000 多个意图以及 3000 万个高质量问答知识点,覆盖超过 1000 万种自营商品的电商知识图谱,更加垂直与聚焦;
5 个应用:内容生成、人机对话、用户意图理解、信息抽取、情感分类,涵盖零售和金融行业复用程度最高的应用场景,在客户咨询与服务、营销文案生成、商品摘要生成、电商直播、数字人、研报生成、金融分析等领域将发挥广泛的落地价值。
ChatJD 将通过在垂直产业的深耕,快速达成落地应用的标准,并不断推动不同产业之间的泛化,形成更多通用产业版 ChatGPT,构建数据和模型的飞轮,以细分、真实、专业场景日臻完善平台能力,最终反哺和完善通用 ChatGPT 的产业应用能力。
京东集团副总裁何晓冬称,相较于传统聊天机器人,京东的场景更加垂直,必须解决用户的问题,更加聚焦于任务型多轮对话,考量的是对话的精准度、客户的满意度,满足成本、体验、价格、产品、服务等要素的要求。
在通用型 Chat AI 方向,京东云已经拥有包括京东智能客服系统、京小智平台商家服务系统、智能金融服务大脑、智能政务热线,言犀智能外呼、言犀数字人等系列产品和解决方案。
在语言生成方面,京东 NLP 团队提出的基于领域知识增强的预训练语言模型 K-PLUG 可以在一定程度上解决生成文本的「可控性」问题。目前,该模型已经覆盖了京东的 3000 多个三级品类,累计生成文案 30 亿字,应用于京东发现好货频道、搭配购、AI 直播带货等。
华为:在大模型领域早有布局
对于华为在类似ChatGPT方向上的布局,华为计算产品线相关负责人表示,公司2020年在大模型开始有布局,2021年发布了鹏城盘古大模型,是业界首个千亿级生成和理解中文NLP大模型。
在大模型产业化方面,华为已发起了智能遥感开源生态联合体、多模态人工智能产业联合体,智能流体力学产业联合体等。华为将以联合体的模式把科研院所、产业厂商等结合起来,更好地让大模型产业形成正向的闭环回路。
据华为计算产品线相关负责人表示,公司2020 年在大模型领域开始有布局。去年6月,在华为伙伴暨开发者大会2022上,华为发布人工智能大模型全流程使能体系,具体包括以下几点:
规划大模型沙盘,其实就是单点技术的聚合。让产业界多基于昇腾AI技术体系推出更多大模型,鼓励高校和科研机构开展大模型的研究与创新。
推出相关大模型开发套件,通过算法开发、并行计算、存储优化、断点续训,实现大模型的高效开发。
与伙伴一起共同成立AI流体力学、AI生物医药、以及智慧育种等产业联盟,助力相关领域的大模型创新和产业化发展。
字节跳动:当前不做过多回应
2月9日,有传闻称,字节跳动的人工智能实验室有开展类似ChatGPT和AIGC的相关研发,未来或为旗下PICO提供技术支持。
但随后,PICO相关负责人否认了传闻,说消息不实,PICO目前没有采用类似ChatGPT技术的产品规划。
ChatGPT成风后,字节跳动是为数不多与ChatGPT划清界限的企业。
在AIGC方向,字节跳动的研究成果包括非自回归模型 DA-Transformer、端到端语音到文本翻译模型 ConST、多颗粒度的视觉语言模型X-VLM、图片和文本统一生成模型DaVinci等。其中DA-Transformer在机器翻译上首次达到了Transformer同样的精度,而处理的速度提高了7~14倍。DA-Transformer不仅可以用于机器翻译,而且可以用于任意的序列到序列任务。
网易有道:将推出教育场景下的ChatGPT
据报道,网易有道 AI 技术团队已投入到 ChatGPT 同源技术 AIGC(AI Generated Content)在教育场景的落地研发中。
网易有道向媒体证实了这一消息,并表示近年来一直在 AIGC 上有持续性投入。去年底尝试 AIGC 在教育场景中的落地应用,包括但不限于 AI 口语老师、中文作文打分和评价等。据相关负责人透露,近年来,有道团队在神经网络翻译、计算机视觉、智能语音 AI 技术、高性能计算等关键技术方面均取得重要突破。
网易有道表示:“产品的最终形态团队还在讨论中,需要匹配用户需求来决定,智能硬件、在线课程都可能是考虑落地的场景。”
据悉,网易有道已经布局AI产业多年,在神经网络翻译、计算机视觉、智能语音AI技术、高性能计算等方面具备核心技术,且一向注重技术在教育和翻译等场景中的商业化落地。
面向服务和信息检索维度,网易有道可提供问答机器人等功能,通过与系统用户进行交互,提供个性化的信息服务。据悉,目前该项技术支持人物、教育、动漫、小说、文学作品等垂类的基于结构化数据的精准问答,可直接满足用户的知识检索需求,已累积数亿次调用。
科大讯飞:5月进行产品级发布
从科大讯飞方面获悉,科大讯飞Al学习机将成为公司类ChatGPT技术率先落地的产品,并于今年5月发布。
科大讯飞回应称,ChatGPT主要涉及到自然语言处理相关技术,属于认知智能领域的应用之一,公司在该方向技术和应用具备长期深厚的积累。
据介绍,科大讯飞主导承建了认知智能全国重点实验室,是科技部首批20家标杆全国重点实验室之一,多年来始终保持关键核心技术处于世界前沿水平,去年获得CommonsenseQA 2.0、OpenBookQA等12项认知智能领域权威评测的第一。同时,已面向认知智能领域陆续开源了6大类、超过40个通用领域的系列中文预训练语言模型,成为业界最广泛流行的中文预训练模型系列之一,在Github平台的中文预训练模型的星标数达13346位列第一,是第二名的2倍。
科大讯飞强调,公司已经在当前核心技术、产业场景、行业数据等深厚积累的基础上,于2022年12月份进一步启动生成式预训练大模型任务攻关,科大讯飞AI学习机将成为该项技术率先落地的产品,将于2023年5月6日进行产品级发布。该技术突破将在AI学习机的中英文作文辅导、中英文口语学习等方面带来显著提升。
360:正在构建ChatGPT安全应用
继前两年布局新能源汽车、入局元宇宙后,360 近日也对外公布,计划推出类 ChatGPT 的 demo 版产品。周鸿祎表示:“如果企业搭不上 ChatGPT 这班车,很可能会被淘汰。”
在 2 月 7 日的答投资者提问会议上,360 表示有 200 多亿的资金能够支持 360 进行类 ChatGPT 技术的研究和投入,虽不及谷歌、百度,但也强于许多 A 股上市的搜索引擎企业。
在技术积累上, 360 在 2019、2020 年左右便看到了技术变革的可能,成立了人工智能研究院,投入了相当的人力、算力去做人工 AI 场景,研发侧重点建立在自身的业务优势上,即安全 AI。
随着 ChatGPT 的应用推广以及各大科技巨头陆续入局类 ChatGPT 赛道,产业界和学界也越来越重视 ChatGPT 类模型可能带来的安全风险。
360 方面表示,当前对类 ChatGPT 的研发已经进行了数字安全 AI 识别。基于其训练的 AI 模型,刻画了专门针对于数字安全训练的大模型,并给它投喂了 360 安全卫士形成的安全类大数据。
不过360方面表示,类ChatGP测试版的推出时间以及实际效果均存在重大不确定性。
公司的类ChatGPT技术的各项指标只能达到略强于GPT-2的水平,与当前的ChatGPT相比尚有代差的落后,公司是否能够缩小与国外领先技术之间的差距尚存在不确定性。
小米:在ChatGPT领域有丰富落地场景
从接近小米人士处获悉,小米在ChatGPT领域有丰富落地场景,包括小爱对话、机器人等,其中小爱拥有庞大数据支撑,会让小米在大模型方面进展更迅速。此前小米在AI大模型上已有多路并行尝试,未来将加大相关领域人力和资源投入。
此前,雷军在推特上发文称,用ChatGPT 询问小米13全球版发布时间,是问不出结果的。因为 ChatGPT 的数据库没有到 2023 年。
快手:已启动相关专项
作为一款国民级短视频 App 背后的公司,快手的业务和 AIGC 息息相关。因此,快手也对 ChatGPT 做出了回应。目前,快手正在开展大规模语言模型(LLM Large Language Model)正在开展大规模语言模型,并启动了相应专项,覆盖 LLM 模型训练、文案自动创作与生成、对话系统开发等领域。
内部有关人士介绍称,快手在 LLM 领域的研究,更聚焦于用户体验的提升,以及和业务场景的融合。例如,对话系统在快手中的主要应用场景包括虚拟人、电商智能客服、智能助理等人机交互或人人交互场景。相关研究的推进,将赋予 LLM 与人类自然交互的能力,对于 to B 类业务场景的扩展将有重要帮助。
“中国版ChatGPT”将花落谁家?
需要注意的是,由于目前全球还没有能有与ChatGPT抗衡的大模型产品,而且中国、美国在 AI 大数据、算法、大模型发展路径不同,除了微软、谷歌、Buzzfeed、Anthropic、百度等企业公布类似产品,或与OpenAI 合作之外,国内暂时没有“中国版ChatGPT”。
尽管国内大厂都在纷纷官宣各自国产版ChatGPT的规划及进度,一些创业公司也在争取曝光机会,仍有冷静的旁观者认为OpenAI在国内复制成功的几率很小。
首先在技术能力上,有从业者指出,百度未来推出产品的效果还未知。迄今为止,国内尚未有任何一家公司或者科研机构能够做出与ChatGPT同等效果或者接近这个模型效果的成果。
在投入上,对于企业来说也成本不菲。“OpenAI是2015年成立的,7年多时间没有收入,而且投入非常大,这样的创业公司放在国内能不能存活很难想象。”一位AIGC领域创业者说。
即便获得当下的成绩,OpenAI创始人Sam Altman仍认为这离真正的AGI(Artificial general intelligence,通用人工智能)尚远,“我不认为我们已经快要实现AGI了。我最近一直在思考我们如何知道AGI会何时实现的问题。在过去五年多里,我对AGI的认知是它不会一蹴而就,将是一个渐进的过程,或者说是缓慢起飞。”
▐风口洞察
数字人民币该怎么赚钱?
盘点 | 31省市数字经济“成绩单”
中国数字化转型政策汇编·省市篇
数字化标杆:中国31家“灯塔工厂”案例集
2022年头号风口:中国“东数西算”市场洞察
中国数字化转型政策汇编(2021-2022)
新一轮数据“掘金潮”:大数据交易进入2.0时代
政策利好!迎万亿规模市场!数字政府概念站上风口
▐ 行业报告
大数据白皮书(2022年)
2023年中国数字孪生城市行业研究报告
2023年中国数字孪生城市行业研究报告
达摩院2023十大科技趋势
数据要素白皮书(2022年)
▐国际要闻
微软宣布裁员10000人
ChatGPT开始搞钱了
中国:“非常高水平”
字节跳动摊上事儿了
美国芯片巨头宣布:裁员4800人!
▐政策新规
工信部等十七部门联合印发《“机器人+”应用行动实施方案》
福建省数字政府改革和建设总体方案(全文+解读)
十六部门联合印发《关于促进数据安全产业发展的指导意见》
《上海市公共数据开放实施细则》公布
《浙江省元宇宙产业发展行动计划(2023—2025年)》发布
▐数据观出品
25省市/地方公布元宇宙路线图
31省市数字化转型规划(2023)
31省市数字政府规划(2023)
18省市公布『数据条例』
31省市数字政府“十四五”规划重点
31省市数据要素“十四五”规划重点
31省市数字经济“十四五”规划路线图
25省市/地方公布元宇宙路线图
31省市“专精特新”政策汇总
AI时代,拥有个人微信机器人AI助手!AI时代不落人后!
免费ChatGPT问答,办公、写作、生活好得力助手!
搜索微信号aigc666aigc999或上边扫码,即可拥有个人AI助手!