中国130个大模型,难超越10亿营收的ChatGPT|钛媒体深度
ChatGPT

中国130个大模型,难超越10亿营收的ChatGPT|钛媒体深度

打开凤凰新闻,查看更多高清图片 中国 AI 大模型全面“开闸”。 钛媒体App获悉,8月31日,百度(文心一言)、抖音(云雀大模型)、智谱AI(智谱清言)、中科院(紫东太初大模型)、百川智能(百川大模型)、商汤(商量SenseChat大模型)、MiniMax(ABAB大模型)、上海人工智能实验室(书生通用大模型)共8个企业/机构官方发布公告,宣布面向全社会上线大模型产品。 这是中国首批面向公众提供类似ChatGPT服务的 AI 大模型产品,大模型行业迎来关键时刻。 同时,阿里“通义千问”、360智脑以及科大讯飞“讯飞星火认知大模型”等尚未宣布全面开放,但已表示完成了备案工作,预计在未来一周左右陆续开放。 除ABAB、书生通用、紫东太初三个大模型之外,首批上线国内大模型中有5款为消费级(C端)产品,免费对外开放,有望对标成为“中国版ChatGPT”。 不过,拥有先发优势的ChatGPT,如今却开始加速商业化。据The Information 8月30日报道,创造ChatGPT大模型的OpenAI,预计在未来12个月内,通过销售人工智能软件及其计算能力,将获得超过10亿美元的收入。即便是“卖铲子”的英伟达,二季度净利润同比增长高达843%。对应的中国大模型,集体亏损、难以获得规模性收入。 钛媒体App从赛迪方面获得的一份数据显示,今年1-7月国内共发布了64个大模型。截至2023年7月,中国累计已经有130个大模型问世。 很显然,中国的130个大模型,基本难以超越已加速商业化的ChatGPT,后者营收预计达10亿美金。 8个大模型全面开放,阿里大模型1周内等待通知 今年以来,以ChatGPT为代表的 AI 大模型技术火遍全球,而在这样一个大的机遇下,百度、阿里、字节等多家国内公司陆续公布大模型产品。 今年7月13日,国家七部委联合公布《生成式人工智能服务管理暂行办法》,自2023年8月15日起施行。根据新规指导要求,AI大模型在内的生成式AI产品将面临算法备案、安全评估等两道监管手续,也称“双新评估”,只有在这两个手续都通过后,生成式AI产品才能合法上架。 随后,百度、商汤、阿里、腾讯等公司均开始进行备案过程,希望在第一批获准名单中。最终在8月31日,有8个企业/机构的 AI 大模型正式面向全社会上线。 截至钛媒体App发稿前,据七麦数据显示,8月31日,文心一言在苹果App Store应用商店下载量预估为31.3万次左右,智谱清言App则为3832次。 具体来说,据百度介绍,百度的大模型应用“文心一言”(Ernie Bot)向全社会全面开放。用户可以在应用商店下载“文心一言APP”或登陆“文心一言官网”(https://yiyan.baidu.com)体验。百度MEG群组负责人称,百度旗下各类用户侧产品正在利用大模型进行重构,百度搜索、百家号、百度文库、百度输入法等产品正在研发并陆续推出相关AI功能,未来还将推出NEWAPP等产品。 百度拥有搜索入口,通过在搜索结果顶部添加了一个“对话”按钮。单击它会弹出一个聊天窗口,允许任何人访问文心一眼,类似于微软将ChatGPT集成到其Bing搜索中的方式。 百度董事长兼首席执行官李彦宏表示,当文心一言向数以亿计互联网用户大规模开放服务后,能够获得大量真实世界中的人工反馈,这将进一步改进基础模型,并以更快速度迭代文心一言,创造更好的用户体验。 百度官方公布的数据显示,文心一言App 8月31日开放下载首日,日活跃用户超100万,过去24小时内,平台共计回复网友超3342万个问题。 据商汤介绍,即日起旗下AI聊天机器人“商量SenseChat 3.0”正式向所有用户开放,用户可通过SenseChat官网注册使用: https://chat.sensetime.com,可体验文本编辑、数理计算、编程等功能。据悉,商汤商量SenseChat 1.0于今年4月首次推出,是千亿参数的大语言模型的聊天机器人产品,拥有语义理解、多轮对话、知识掌握、逻辑推理等综合能力。 8月28日商汤披露的半年报显示,借助大装置的算力、“日日新”大模型体系的大语言模型及文生图模型研发,上半年,商汤生成式AI相关收入实现670.4%的增长,收入贡献占比超过2成。商汤预估,到2024年生成式AI业务相关收入占比预计会超30%,2025年预计将占总收入40%以上。 据百川智能介绍,旗下大模型产品“百川大模型”率先通过《生成式人工智能服务管理暂行办法》备案,今日起面向全社会开放服务,用户可以登录官网www.baichuan-ai.com进行体验。据悉,百川智能成立于今年4月10日,由前搜狗公司CEO王小川创立,成立四个月以来,百川智能相继发布了三款通用大语言模型:6月15日,百川智能发布国内首款开源可免费商用 70 亿参数量大语言模型Baichuan-7B,7月11日,发布参数量130亿的大语言模型Baichuan-13B-Base、对话模型Baichuan-13B-Chat,8月8日发布参数量530亿的大语言模型Baichuan-53B。 百川智能创始人、CEO 王小川早前向钛媒体App透露,百川智能将在今年第四季度发布千亿参数模型,预计明年一季度前后推出 “超级应用”。 据MiniMax介绍,今日起MiniMax“abab”大模型全面开放服务。用户可以登陆“MiniMax开放平台”率先体验。据称,MiniMax“abab”大模型能力适用于逻辑推理、文本续写、文案生成、内容摘要、代码生成、知识检索等大多数文本处理相关的场景,并且还提供声音大模型能力。目前,MiniMax开放平台已接入超百家付费客户,提供办公协作、互动娱乐、客服、搜索、教育等十余个行业场景。 MiniMax成立于2021年12月,由前商汤科技副总裁、通用智能技术负责人闫俊杰创立,是国内 AI 领域头部公司。据报道,今年6月,MiniMax接近完成规模超2.5亿美元的一轮融资,投资方包括腾讯、米哈游等,目前公司估值超12亿美元(约合人民币85亿元)。...
每周AI大事件 | 苹果下多款AI应用、黑客版ChatGPT风靡暗网、通义千问70亿参数模型开源
ChatGPT

每周AI大事件 | 苹果下多款AI应用、黑客版ChatGPT风靡暗网、通义千问70亿参数模型开源

Part1动态 [国内要闻] 1.腾讯混元大模型开始应用内测 多个业务线已接入 腾讯自研的“腾讯混元大模型”已经进入应用内测阶段。多位腾讯员工表示,他们最近收到了内部邮件邀请,可以通过网页或小程序体验混元大模型。腾讯内部多个业务也已经接入混元大模型进行测试。 2.美图自研视觉大模型MiracleVision已迭代至1.5版本 吴欣鸿透露,目前美图自研视觉大模型已迭代到1.5版本,并应用于美图旗下多款产品。目前,美图在AI层面有多个成功实践案例。“AI绘画”系列涵盖文生图、文字融合、图生图、涂鸦生图、线稿上色、头像制作、宠物头像等功能。 3.北大团队提出Dragon Diffusion,可一键拖拽编辑图像 DragonDiffusion 是一款基于扩散模型的图像编辑工具,旨在实现对图像进行精细化编辑。通过设计分类器引导的方法,DragonDiffusion 能够将编辑信号转化为梯度,通过特征对齐损失修改扩散模型的中间表示。 4.余承东“剧透”鸿蒙4.0:或搭载AI大模型 余承东在社交平台展示了一项新技术:他利用华为手机内置的小艺语音助手,写了一段发布会宣传文案。从该视频可以看出,小艺可以根据用户需求,自动生成文案等内容。而在小艺的回答下方有一行提示——“数据来源:由AI模型自动生成,可能存在疏漏,仅供参考”。华为鸿蒙4.0或将融入AI大模型的能力,使得小艺语音助手具备生成式AI的功能。 5.阿里云开源通义千问70亿参数模型 阿里云宣布开源通义千问70亿参数模型,包括通用模型Qwen-7B和对话模型Qwen-7B-Chat,两款模型均已上线魔搭社区,开源、免费、可商用。 6.多个AIGC应用在苹果应用商店下架 多个AI相关App在苹果应用商店下架。据七麦监控数据显示,本次共有658款应用被下架,其中包含 Chat、AI、GPT 等关键词的应用较多。根据苹果官方通知,中国区的苹果应用商店不允许提供 ChatGPT 相关的服务。同时,相关开发者需提供专门的许可证,且需要向监管部门申请。 7.百度文心千帆大模型平台接入LLaMA2等33个模型 百度智能云千帆大模型平台已经完成了新一轮的升级,全面接入了包括LLaMA2全系列、ChatGLM2、RWKV、MPT、Dolly、OpenLLaMA、Falcon等33个大模型,成为了国内拥有大模型最多的平台。 8.百度Apollo官宣文心大模型首批智舱应用伙伴 百度Apollo宣布长城汽车、亿咖通科技成为首批文心大模型智舱应用探索伙伴。百度Apollo已分别与长城汽车、亿咖通科技基于大模型能力围绕车载交互场景开展探索和实践,完成多项创新功能在量产车型平台上的验证,部分功能有望在长城、领克、smart等量产车型上率先落地。 9.百度将大型语言模型ERNIE应用于汽车,实现文字转图像功能 互联网大厂百度已经实现了将其大型语言模型 ERNIE 应用于汽车领域的承诺,并与汽车制造商长城汽车和数字驾驶舱创造者 ECARX 展开合作。 10.淘宝AI装修功能“真能造”将全面上线 淘宝于7月下旬内测的AI装修功能“真能造”将于8月14日的家装家居生态峰会上正式对外发布,届时功能将更加完善,并且在样板间UGC分享和用户交互功能等方面进一步迭代升级。 11.阿里云通义听悟上线三大新功能 阿里云通义听悟近期上线了三大新功能,其中包括视频自动提取PPT、浏览器插件、钉钉和微信小程序。这些功能旨在帮助用户在PC和移动端随时随地听懂、理解、阅读各类音视频内容,从而提高职场人士和学生的工作学习效率。 12.讯飞星火APP重新上架 将发布星火认知大模型2.0版本 :科大讯飞在投资者平台回应称,讯飞星火认知大模型V2.0升级发布会将于8月15日举办,届时会发布多模态生成、代码生成能力及行业产品等多项能力及应用。 13. 8月AI新规将施行:使用AI生成内容不得侵害他人肖像权 《生成式人工智能服务管理暂行办法》将在8月15日起施行,《办法》明确,提供和使用生成式人工智能服务应当尊重他人合法权益,不得危害他人身心健康,不得侵害他人肖像权、名誉权、荣誉权、隐私权和个人信息权益。 14.AI游戏教育与产业联盟专委会正式成立 AI游戏教育与产业联盟专委会正式成立。浦东将在产业政策、运营规范、国际交流等方面,为AI和游戏产业的发展提供大力支持。 [国际要闻] 1....
ChatGPT爆火这半年:热钱、巨头与监管
ChatGPT

ChatGPT爆火这半年:热钱、巨头与监管

原标题:ChatGPT爆火这半年:热钱、巨头与监管 出品 | 虎嗅科技组 作者 | 陈伊凡 齐健 头图 | 电影《华尔街之狼》 经历了半年的AI洗礼,或许很难找到比“应激反应”更恰当的词,来形容今天科技行业中每个人的状态——紧张、刺激、压力。 “应激反应”, 是指生物体在遭遇外部环境压力或威胁时,为了维持身体的稳态而产生的一系列反应。它是生物为了适应环境、确保生存所产生的一种自然反应。这种反应可以是短暂的,也可以是长期的。 7月26日,OpenAI官方推特宣布,安卓版ChatGPT已在美国、印度、孟加拉国和巴西提供下载,并计划在近期推广至更多国家。ChatGPT正在拓展渠道,获得更多的用户和更强的使用粘性,生成式AI的浪潮在持续推高。 7月初,上海的2023世界人工智能大会(WAIC)上,一位大模型创业公司的技术人员正在展厅里穿梭,她计划为公司寻找一个性价比高的国产芯片解决方案,用来做大模型训练。 “我们有1000张A100,但完全不够。”她告诉虎嗅。 A100是英伟达的一款高端GPU,也是ChatGPT生长的硬件基础。一些公开数据显示,在训练GPT系列模型的过程中,OpenAI所使用的英伟达GPU数量约2.5万个。由此,要做大模型,要先评估能拿到多少张A100的显卡,几乎成了这个行业的惯例。 哪里有GPU?哪里有便宜算力?这只是2023WAIC大会上众多问题的缩影。 过去半年里所有被“应激”到的人,几乎都渴望能够在这场“盛会”中找到更多关于AI的答案。 2023WAIC现场 一家芯片展商的技术人员告诉虎嗅,在WAIC大会的几天里,他们的“大模型”展台前,来了好些产品经理,他们希望在这里为公司的大模型业务寻找产品定义。 5月28日在中关村论坛上,中国科学技术信息研究所发布的《中国人工智能大模型地图研究报告》显示,截至5月底,中国10亿级参数规模以上的大模型发布了79个。在此后的两个月里,又有阿里云的通义万相、华为云的盘古3.0、有道“子曰”等一系列AI大模型发布,据不完全统计目前国内的AI大模型已超过100个。 国内企业争先恐后发布AI大模型的动作,就是“应激反应”最好的体现。这种“反应”带来的焦虑,正在传导给行业里几乎所有相关人员,从互联网巨头的CEO到AI研究机构的研究员,从创投基金合伙人到AI公司的创始人,甚至是很多AI相关的法律从业者,以及数据、网络安全的监管层。 对行业之外的人而言,这可能只是短暂的狂欢,但在如今,又有多少人敢说自己置身AI之外。 AI正在开启一个新时代,一切都值得用大模型重塑一遍。越来越多的人开始思考技术扩散之后的结果。 资金涌入,飞轮已现 ChatGPT诞生的一个月内,出门问问创始人李志飞两赴硅谷,逢人必谈大模型,在与虎嗅交谈时,李志飞直言这是他最后一次“All in”。 2012年,李志飞创立出门问问,这家以语音交互、软硬件结合为核心的人工智能公司经历了中国两次人工智能浪潮的起伏。在上一波人工智能最火热的那一段时间,出门问问的估值一度被推至独角兽级别,但此后也经历了一段落寞期,直到ChatGPT的出现,才给沉寂多年的人工智能行业撕开了一道口子。 在一级市场,“热钱正在涌进来。” 这是过去半年中,谈及大模型时的行业共识。奇绩论坛创始人陆奇认为,AI大模型是一个“飞轮”,未来将是一个模型无处不在的时代,“这个飞轮已经启动”,而最大的推动力就是资本。 7月初,商业信息平台Crunchbase发布的数据显示,分类为AI的公司在2023年上半年筹集了250亿美元,占全球融资的18%。虽然这一数字与2022年上半年的290亿美元相比有所下降,但2023年上半年全球各行业的总融资额比2022年同比下降了51%,由此可见AI领域的融资额在全球融资总额中的占比,几乎提高了一倍。Crunchbase在报告中这样写到:“如果没有ChatGPT引发的人工智能热潮,2023年的融资额会更低。” 到目前为止,2023年AI行业最大的一笔融资,就是微软在1月对OpenAI投资的100亿美元。 虎嗅根据公开数据统计,在美国的大模型公司创业中,Inflection AI或将成为人工智能领域融资量仅次于Open AI的第二大初创公司,在其之后分别是,Anthropic(15亿美元),Cohere(4.45亿美元)、Adept(4.15亿美元)、Runway(1.955亿美元)、Character.ai(1.5亿美元)和Stability AI(约1亿美元)。 在中国,2023年上半年国内人工智能行业的公开投融资事件共有456起。而这项统计在2018年-2022年的5年间分别是731、526、353、631和648。 上半年国内人工智能行业公开投融资事件 另一个引发飞轮的事件则是ChatGPT放出API接口。当OpenAI在3月首次开放ChatGPT的API接口时,AI行业内外对此几乎形成共识:行业要变天了。随着更多应用接入大模型,AI之上正在长出更加繁茂的森林。 “做大模型和做应用本身就应该分开”,投资人的嗅觉总是敏锐的,在源码资本执行董事陈润泽看来,AI是一个与半导体分工一样的逻辑,AI大模型的繁荣之后,很快就会看到AI应用的一波繁荣。 今年年初,陈润泽与同事一起前往硅谷时发现,硅谷声名显赫的创业孵化器Y Combinator(OpenAI首席执行官Sam Altman曾在这家孵化器任总裁多年),有一半的项目都转型做生成式AI了。对于大模型的热情,丝毫不逊于如今大洋彼岸的中国。 不过,他也发现在美国无论是资本还是创业者,相比于大模型创业,更看好基于大模型所做的生态应用,毕竟在这个赛道,已经跑出了诸如OpenAI这样的公司,与此同时,美国有很强的ToB应用生态土壤,因此更多的美国公司正在尝试基于大模型的生态做企业应用。...
每周AI大事件 | 苹果下多款AI应用、黑客版ChatGPT风靡暗网、通义千问70亿参数模型开源
ChatGPT

每周AI大事件 | 苹果下多款AI应用、黑客版ChatGPT风靡暗网、通义千问70亿参数模型开源

Part1动态 [国内要闻] 1.腾讯混元大模型开始应用内测 多个业务线已接入 腾讯自研的“腾讯混元大模型”已经进入应用内测阶段。多位腾讯员工表示,他们最近收到了内部邮件邀请,可以通过网页或小程序体验混元大模型。腾讯内部多个业务也已经接入混元大模型进行测试。 2.美图自研视觉大模型MiracleVision已迭代至1.5版本 吴欣鸿透露,目前美图自研视觉大模型已迭代到1.5版本,并应用于美图旗下多款产品。目前,美图在AI层面有多个成功实践案例。“AI绘画”系列涵盖文生图、文字融合、图生图、涂鸦生图、线稿上色、头像制作、宠物头像等功能。 3.北大团队提出Dragon Diffusion,可一键拖拽编辑图像 DragonDiffusion 是一款基于扩散模型的图像编辑工具,旨在实现对图像进行精细化编辑。通过设计分类器引导的方法,DragonDiffusion 能够将编辑信号转化为梯度,通过特征对齐损失修改扩散模型的中间表示。 4.余承东“剧透”鸿蒙4.0:或搭载AI大模型 余承东在社交平台展示了一项新技术:他利用华为手机内置的小艺语音助手,写了一段发布会宣传文案。从该视频可以看出,小艺可以根据用户需求,自动生成文案等内容。而在小艺的回答下方有一行提示——“数据来源:由AI模型自动生成,可能存在疏漏,仅供参考”。华为鸿蒙4.0或将融入AI大模型的能力,使得小艺语音助手具备生成式AI的功能。 5.阿里云开源通义千问70亿参数模型 阿里云宣布开源通义千问70亿参数模型,包括通用模型Qwen-7B和对话模型Qwen-7B-Chat,两款模型均已上线魔搭社区,开源、免费、可商用。 6.多个AIGC应用在苹果应用商店下架 多个AI相关App在苹果应用商店下架。据七麦监控数据显示,本次共有658款应用被下架,其中包含 Chat、AI、GPT 等关键词的应用较多。根据苹果官方通知,中国区的苹果应用商店不允许提供 ChatGPT 相关的服务。同时,相关开发者需提供专门的许可证,且需要向监管部门申请。 7.百度文心千帆大模型平台接入LLaMA2等33个模型 百度智能云千帆大模型平台已经完成了新一轮的升级,全面接入了包括LLaMA2全系列、ChatGLM2、RWKV、MPT、Dolly、OpenLLaMA、Falcon等33个大模型,成为了国内拥有大模型最多的平台。 8.百度Apollo官宣文心大模型首批智舱应用伙伴 百度Apollo宣布长城汽车、亿咖通科技成为首批文心大模型智舱应用探索伙伴。百度Apollo已分别与长城汽车、亿咖通科技基于大模型能力围绕车载交互场景开展探索和实践,完成多项创新功能在量产车型平台上的验证,部分功能有望在长城、领克、smart等量产车型上率先落地。 9.百度将大型语言模型ERNIE应用于汽车,实现文字转图像功能 互联网大厂百度已经实现了将其大型语言模型 ERNIE 应用于汽车领域的承诺,并与汽车制造商长城汽车和数字驾驶舱创造者 ECARX 展开合作。 10.淘宝AI装修功能“真能造”将全面上线 淘宝于7月下旬内测的AI装修功能“真能造”将于8月14日的家装家居生态峰会上正式对外发布,届时功能将更加完善,并且在样板间UGC分享和用户交互功能等方面进一步迭代升级。 11.阿里云通义听悟上线三大新功能 阿里云通义听悟近期上线了三大新功能,其中包括视频自动提取PPT、浏览器插件、钉钉和微信小程序。这些功能旨在帮助用户在PC和移动端随时随地听懂、理解、阅读各类音视频内容,从而提高职场人士和学生的工作学习效率。 12.讯飞星火APP重新上架 将发布星火认知大模型2.0版本 :科大讯飞在投资者平台回应称,讯飞星火认知大模型V2.0升级发布会将于8月15日举办,届时会发布多模态生成、代码生成能力及行业产品等多项能力及应用。 13. 8月AI新规将施行:使用AI生成内容不得侵害他人肖像权 《生成式人工智能服务管理暂行办法》将在8月15日起施行,《办法》明确,提供和使用生成式人工智能服务应当尊重他人合法权益,不得危害他人身心健康,不得侵害他人肖像权、名誉权、荣誉权、隐私权和个人信息权益。 14.AI游戏教育与产业联盟专委会正式成立 AI游戏教育与产业联盟专委会正式成立。浦东将在产业政策、运营规范、国际交流等方面,为AI和游戏产业的发展提供大力支持。 [国际要闻] 1....
ChatGPT爆火这半年:热钱、巨头与监管
ChatGPT

ChatGPT爆火这半年:热钱、巨头与监管

原标题:ChatGPT爆火这半年:热钱、巨头与监管 出品 | 虎嗅科技组 作者 | 陈伊凡 齐健 头图 | 电影《华尔街之狼》 经历了半年的AI洗礼,或许很难找到比“应激反应”更恰当的词,来形容今天科技行业中每个人的状态——紧张、刺激、压力。 “应激反应”, 是指生物体在遭遇外部环境压力或威胁时,为了维持身体的稳态而产生的一系列反应。它是生物为了适应环境、确保生存所产生的一种自然反应。这种反应可以是短暂的,也可以是长期的。 7月26日,OpenAI官方推特宣布,安卓版ChatGPT已在美国、印度、孟加拉国和巴西提供下载,并计划在近期推广至更多国家。ChatGPT正在拓展渠道,获得更多的用户和更强的使用粘性,生成式AI的浪潮在持续推高。 7月初,上海的2023世界人工智能大会(WAIC)上,一位大模型创业公司的技术人员正在展厅里穿梭,她计划为公司寻找一个性价比高的国产芯片解决方案,用来做大模型训练。 “我们有1000张A100,但完全不够。”她告诉虎嗅。 A100是英伟达的一款高端GPU,也是ChatGPT生长的硬件基础。一些公开数据显示,在训练GPT系列模型的过程中,OpenAI所使用的英伟达GPU数量约2.5万个。由此,要做大模型,要先评估能拿到多少张A100的显卡,几乎成了这个行业的惯例。 哪里有GPU?哪里有便宜算力?这只是2023WAIC大会上众多问题的缩影。 过去半年里所有被“应激”到的人,几乎都渴望能够在这场“盛会”中找到更多关于AI的答案。 2023WAIC现场 一家芯片展商的技术人员告诉虎嗅,在WAIC大会的几天里,他们的“大模型”展台前,来了好些产品经理,他们希望在这里为公司的大模型业务寻找产品定义。 5月28日在中关村论坛上,中国科学技术信息研究所发布的《中国人工智能大模型地图研究报告》显示,截至5月底,中国10亿级参数规模以上的大模型发布了79个。在此后的两个月里,又有阿里云的通义万相、华为云的盘古3.0、有道“子曰”等一系列AI大模型发布,据不完全统计目前国内的AI大模型已超过100个。 国内企业争先恐后发布AI大模型的动作,就是“应激反应”最好的体现。这种“反应”带来的焦虑,正在传导给行业里几乎所有相关人员,从互联网巨头的CEO到AI研究机构的研究员,从创投基金合伙人到AI公司的创始人,甚至是很多AI相关的法律从业者,以及数据、网络安全的监管层。 对行业之外的人而言,这可能只是短暂的狂欢,但在如今,又有多少人敢说自己置身AI之外。 AI正在开启一个新时代,一切都值得用大模型重塑一遍。越来越多的人开始思考技术扩散之后的结果。 资金涌入,飞轮已现 ChatGPT诞生的一个月内,出门问问创始人李志飞两赴硅谷,逢人必谈大模型,在与虎嗅交谈时,李志飞直言这是他最后一次“All in”。 2012年,李志飞创立出门问问,这家以语音交互、软硬件结合为核心的人工智能公司经历了中国两次人工智能浪潮的起伏。在上一波人工智能最火热的那一段时间,出门问问的估值一度被推至独角兽级别,但此后也经历了一段落寞期,直到ChatGPT的出现,才给沉寂多年的人工智能行业撕开了一道口子。 在一级市场,“热钱正在涌进来。” 这是过去半年中,谈及大模型时的行业共识。奇绩论坛创始人陆奇认为,AI大模型是一个“飞轮”,未来将是一个模型无处不在的时代,“这个飞轮已经启动”,而最大的推动力就是资本。 7月初,商业信息平台Crunchbase发布的数据显示,分类为AI的公司在2023年上半年筹集了250亿美元,占全球融资的18%。虽然这一数字与2022年上半年的290亿美元相比有所下降,但2023年上半年全球各行业的总融资额比2022年同比下降了51%,由此可见AI领域的融资额在全球融资总额中的占比,几乎提高了一倍。Crunchbase在报告中这样写到:“如果没有ChatGPT引发的人工智能热潮,2023年的融资额会更低。” 到目前为止,2023年AI行业最大的一笔融资,就是微软在1月对OpenAI投资的100亿美元。 虎嗅根据公开数据统计,在美国的大模型公司创业中,Inflection AI或将成为人工智能领域融资量仅次于Open AI的第二大初创公司,在其之后分别是,Anthropic(15亿美元),Cohere(4.45亿美元)、Adept(4.15亿美元)、Runway(1.955亿美元)、Character.ai(1.5亿美元)和Stability AI(约1亿美元)。 在中国,2023年上半年国内人工智能行业的公开投融资事件共有456起。而这项统计在2018年-2022年的5年间分别是731、526、353、631和648。 上半年国内人工智能行业公开投融资事件 另一个引发飞轮的事件则是ChatGPT放出API接口。当OpenAI在3月首次开放ChatGPT的API接口时,AI行业内外对此几乎形成共识:行业要变天了。随着更多应用接入大模型,AI之上正在长出更加繁茂的森林。 “做大模型和做应用本身就应该分开”,投资人的嗅觉总是敏锐的,在源码资本执行董事陈润泽看来,AI是一个与半导体分工一样的逻辑,AI大模型的繁荣之后,很快就会看到AI应用的一波繁荣。 今年年初,陈润泽与同事一起前往硅谷时发现,硅谷声名显赫的创业孵化器Y Combinator(OpenAI首席执行官Sam Altman曾在这家孵化器任总裁多年),有一半的项目都转型做生成式AI了。对于大模型的热情,丝毫不逊于如今大洋彼岸的中国。 不过,他也发现在美国无论是资本还是创业者,相比于大模型创业,更看好基于大模型所做的生态应用,毕竟在这个赛道,已经跑出了诸如OpenAI这样的公司,与此同时,美国有很强的ToB应用生态土壤,因此更多的美国公司正在尝试基于大模型的生态做企业应用。...
大厂赶超ChatGPT
ChatGPT

大厂赶超ChatGPT

原标题:大厂赶超ChatGPT ChatGPT上线的两百天里,国内大模型发展开启“狂飙”模式。 据称,中国10亿参数规模以上的大模型已发布79个。 大模型进化场,讲究一个百模混战:百度文心大模型已进化至3.5形态;阿里通义千问构建家族模式;京东言犀大模型则是为自己“量身定做”的产业大模型;美团牵手清华系,领投AI公司智谱华章;360智脑将接入“360全家桶”…… 大厂大模型进化论,残酷又现实,要么赶超,要么被淘汰。 抢跑且不停刻苦训练的百度文心大模型3.5,近日宣称最新版本文心一言能力已经超出ChatGPT 3.5。 物竞天择,适者生存,大厂大模型纷纷赶超ChatGPT。 作者|洛枳 辛夷 出品|新摘 一、大厂大模型 超过ChatGPT3.5 身穿黑色内搭外穿白色西服外套,搭配干净利落的短发,出现在AI大模型技术能力评估报告大会上。 前一天晚上还在修改议题,刚刚出差回来的百度集团副总裁吴甜在会上说到:“新版本文心一言能力已经超出ChatGPT 3.5,这也是在我们国内开展相关技术工作是重要的里程碑。” 这是继科大讯飞刘庆峰提到星火大模型即将赶超ChatGPT后,又一家大厂正式确认大模型超过ChatGPT。 今年3月,百度新一代知识增强大语言模型“文心一言”公开邀测,该模型基于文心大模型3.0版本打造。时隔3个多月,已经升级为3.5版本的文心大模型,在效果、功能、性能全面提升。 文心一言3.5赶超ChatGPT3.5,很大可能是在功能方面新增了插件机制,文心大模型3.5通过插件方式扩增了大模型的能力边界。 大模型强调大模型技术实力和底座能力。今年5月份,百度上线的新底座大模型正是文心大模型3.5,该模型是文心一言系统的基础模型,给了文心大模型扎实的底座基础,也让文心一言3.5成功赶超ChatGPT。 值得一提的是,在基础模型训练中,3.5版本还采用了飞桨最先进的自适应混合并行训练技术及混合精度计算策略,这大大加快了模型的迭代速度。 众所周知,百度一直在深耕全栈式人工智能技术研发,共四层:芯片层、框架层、模型层和应用层。 芯片层有昆仑芯;框架层有深度学习平台飞桨,有力支撑了大模型的高效训练和推理;模型层有文心大模型;在应用层,目前有15万家企业申请接入文心一言测试。 其中,飞桨平台已经有750万开发者,对比中国软件从业人员800万—1000万,尽管软件从业人员和深度学习开发人员不完全一致,但在人才数量上的优势也为文心3.5赶超ChatGPT提供了大容量智库,类似超脑的存在。 中国企业在获得中文语料和对中国文化的理解方面,相较于外国企业本来就有着天然的优势,中国制造业门类最全,具有面向实体产业训练产业AIGC的有利条件。 众多因素合力助推,文心大模型3.0为基座的文心一言发布一百多天后,在飞桨与文心的协同优化下,文心大模型3.5成长飞速,最新模型效果提升50%,训练速度提升2倍,推理速度提升30倍,成功赶超ChatGPT。 在基础技术之上,百度额外开展了三大增强技术:知识增强、检索增强和对话增强。 将大模型类比成人类,人如果用知识结构,知识体系的方式进行学习的话,学习效率更高。再学会使用工具进行搜索,实现端对端的极简化检索,又可以提升时效性。 大模型自己学习完之后,还得学会反馈式强化训练,对话增强很像是不断让大模型在做题,在对话中告诉大模型哪里对,哪里不对,通过提示的方式,让大模型能够增强记忆机制,有效的让他按照我们希望的方式来回答问题,教会这个孩子怎么样回答的更好。 除了技术实力,大模型需要落地。 在行业应用方面,百度文心大模型源于产业实践,服务于产业实践,已经摸索出大模型产业落地的关键路径,还发布了涵盖众多行业和领域的大模型,加速对行业智能化转型。 目前,国家电网、浦发、泰康、吉利、哈尔滨市、深圳燃气、TCL等企业单位,百度文心大模型均有合作。 此外,百度十年来研发投入超1000亿,2021年核心研发投入占比超23%,人工智能专业申请量和授权量连续5年排名国内第一,深度学习专利申请量全球第一。百度能在AI大模型领域有突破,与百度在要素资源上的大力投入也息息相关。 可以看出,大厂大模式,拼研发的时刻到了。 二、大厂大模型哪家强? 今年上半年正式公开宣布做大模型的企业就有近百家,各家大模型正陷入酣战。其中,有阿里、百度、腾讯、京东、字节跳动等互联网大厂玩家,也有科大讯飞、商汤科技等AI公司,还有其他“杂牌军”也混入其中。 半年时间,大模型赛道完成了从概念到落地的进程,这放在任何赛道都很炸裂。 但是,到目前为止,都没有明确的指标或者准则去验证谁家的大模型更优质,一个接着一个发布会,“王婆卖瓜自卖自夸”式的自我评价,令人眼花缭乱之余,并没有太多客观性。 那么,百模大战,究竟谁更胜一筹? 在IDC最新发布的《AI大模型技术能力评估报告,2023》中,首次提出AI大模型技术能力评估框架。 评估大模型共有三大维度:产品技术、服务生态、行业应用。 具体细分指标可达12个:算法模型、服务能力、通用能力、创新能力、平台能力、安全可解释、生态合作、行业覆盖、金融、工业、医疗、能源。 其中,算法模型和行业覆盖,是衡量大模型能力最重要的2个指标,特别是,二者可以形成持续迭代提升的飞轮。 产品技术能力中,“算法模型”维度是大模型能力最为核心的要素,也是决定大模型应用效果的根本所在。 原因在于,只有通过算法模型技术的突破,实现具有通用效果优势的大模型底座,才能支撑更广泛的行业覆盖,使各行各业充分享受技术突破带来的红利,破解AI落地门槛高的困境。 行业应用能力中,应用覆盖的广度是当下大模型厂商最为关注的指标,是大模型效果通用领先性、行业结合能力的综合体现。...
文心一言 VS 讯飞星火 VS chatgpt (67)—— 算法导论6.5 6题
星火

文心一言 VS 讯飞星火 VS chatgpt (67)—— 算法导论6.5 6题

文心一言 VS 讯飞星火 VS chatgpt (67)– 算法导论6.5 6题 六、在 HEAP-INCREASE-KEY 的第 5 行的交换操作中,一般需要通过三次赋值来完成。想一想如何利用INSERTION-SORT 内循环部分的思想,只用一次赋值就完成这一交换操作? 文心一言: 在 HEAP-INCREASE-KEY 的第 5 行交换操作中,我们可以通过利用 INSERTION-SORT 内循环部分的思想来进行优化,从而只用一次赋值完成这一交换操作。 通常,在 HEAP-INCREASE-KEY 的第 5 行交换操作中,我们需要通过三次赋值来交换 key 和 y 的值。第一次赋值将 key 的值赋给临时变量 temp,第二次赋值将 temp 的值赋给 y,第三次赋值将 y 的值赋给 key。 然而,我们可以利用 INSERTION-SORT 内循环部分的思想,通过一次赋值就完成这一交换操作。具体步骤如下: 1.将 key 的值赋给一个临时变量...
通用VS垂直,讯飞星火与网易子曰不同的“大模型解法”
星火

通用VS垂直,讯飞星火与网易子曰不同的“大模型解法”

配图来自Canva可画 随着大模型商业化应用的提速,全世界各国都开始孵化和孕育各自的行业大模型。在此背景下,国内各个细分行业的垂直大模型,日益受到产业界的关注和重视。 相比通用大模型,垂直大模型具有门槛较低、数据质量较好且靠近落地场景的优势,因而伴随着大模型产业化的深入,其发展空间进一步打开,正在成为下一阶段行业竞争的焦点。事实上,一些受大模型影响特别明显的垂直行业如教育行业,已经率先掀起了大模型竞赛。 大模型成教育领域新变量 今年以来,教育领域包括网易有道、好未来、科大讯飞等行业巨头,先后公布了自己在AI大模型领域的布局和进展,由此大模型之风迅速席卷教育行业。而在教育领域纷纷刮起大模型之风的背后,则与多方面的因素有关。 首先,教育领域和AI大模型有很高的契合度,因而具备更好的落地条件。当前AI大模型大都具备自然语音处理、语音识别、图像识别等诸多能力,其为智能教育在视、听、音等多模态下,实现教育场景全覆盖提供了可能,成为“AI+教育”的核心引擎。此外,随着多模态生成技术的成熟,多模态生成模型的深度融合,将进一步使AI教学、AI虚拟互动趋于立体化,打破扁平的文本式结构,通过图像、视频、数字人生成等技术为教辅产品提供丰富的教学素材和内容呈现形式,打造全新的智能教育生态。 其次,用户对于教育智能产品的接受度日渐提升,AI大模型能够为用户带去更加智能的教育体验。目前AI教育已经发展一段时间了,用户对于智能化的教育产品,也有了相应的认知与了解,而AI大模型的应用,则能为智能教育的发展增添新动能。比如,智能硬件接入AI大模型之后,硬件的交互体验得到了加强,产品智能化也有了“质”的飞跃。 最后,AI大模型可以同时在B端和C端发力,在撬动庞大教育市场的同时,可以做到最小成本实现“因材施教”的教学目标,非常契合当下教育市场的阶段需求。一般而言,教育的投入来源有二:一方面是C端的教育培训消费,另一方面是B端的教育信息化投入,而这两方面都可以构筑起规模相当庞大的市场。如在C端,AI有望成为学生的“智能老师”,为孩子提供作文批改和英语对话等个性化场景学习服务,实现因材施教;在B端,则可以聚焦相对标准化的考场阅卷、在线教学等场景,大幅度提升考试阅卷的效率和准确率。基于此,大模型正在成为教育领域全新变量。 不同路线、不同思路 从整个行业来看,由于参与玩家的背景不同,其所走的路线也存在显著差异。目前来看,发力教育领域的大模型厂商主要分为两类:一是以百度文心一言、科大讯飞星火大模型为代表的通用大模型厂商,其面向的是包括教育在内的泛行业企业;二是以网易有道、学而思等为代表的垂直大模型厂商,其主要专注教育细分领域。结合各个厂商的情况来看,不同路线的背后,实际上对应着厂商的不同思路。 对于大厂而言,由于它们总体综合实力较强,具备构建大模型的一些底层技术能力,因而其更倾向于走通用大模型路线,后期借助大模型与场景结合,快速搭建起服务生态。目前业内包括百度、腾讯、阿里、科大讯飞等厂商,都纷纷依托自身的技术优势、团队优势和资金支持,在通用大模型领域实现了抢跑。比如阿里发布了通义千问大模型、华为发布了盘古大模型、百度发布了文心一言、科大讯飞发布了星火大模型等,在抢夺市场机会的同时,其直面产业的“倾向”也越来越明显。 比如,百度就宣称与超过300家企业成为生态伙伴;4月阿里云也宣布与七家企业推动大模型在油气、电力、交通等行业落地;华为早前也发布了盘古金融、电力、药物分子三个垂直领域大模型;而刚刚公布MaaS解决方案的腾讯,已和数十个行业的22家企业达成大模型共建合作;科大讯飞更是宣布,星火大模型首批接入36个行业3000余家企业……可见,当下推动大模型场景落地、打通服务生态,依然是通用大模型厂商的核心任务。 对于垂直行业厂商而言,其在行业深耕已久,对用户的需求理解和场景落地具备更强的洞察能力,又综合了专家经验、组织能力、工程能力的knowhow优势,具备高质量触达用户场景的竞争力。与通用大模型厂商不同,一些重要的行业玩家如新华三、京东、网易有道、携程等,则聚焦大模型与产业的融合机会,紧盯垂直赛道。比如,京东发布了言犀大模型、京医千询大模型,携程发布了携程问道大模型,网易有道发布了基于教育的子曰大模型。相比通用大模型厂商而言,垂直大模型厂商在相关行业深耕已久,因而在寻找产业机会方面往往走得更加深入。 以网易有道为例,网易有道早在2016年就开始构建AI协同基础能力,同步组建语音、视觉、声音等团队,积累了四大底层技术:有道神经网络翻译(NMT)、计算机视觉、智能语音AI技术、高性能计算等,同时网易有道深耕在线教育多年,已经在名师、线上网课、用户体量等方面构建起了比较优势,这让网易有道相比行业外的厂商更了解教育,相比教育行业内的友商更懂AI。基于这种优势,网易有道更容易抓住大模型在教育领域的落地机会,并借助它打造差异化的智能硬件,以及差异化的服务和用户体验,夯实其行业竞争力。 从这个角度来看,通用大模型厂商与垂直大模型厂商只是分工不同,并没有绝对优劣之分。 有道打响教育大模型应用第一枪 作为国内首个自研教育大模型,网易“子曰”大模型的发布,正式打响了教育领域垂直大模型应用第一枪,其现实意义不言而喻。 一方面,相比底层技术,靠近前端应用的垂直大模型的技术价值、商业价值更具想象空间。正如前文所述,随着大模型逐步深入产业,其应用价值愈加凸显。以7月26日网易有道推出的子曰大模型为例,其基于大模型成功推出了6个已经落地,或者即将落地的应用,分别是虚拟人口语教练、中文作文指导、英语语法精讲、AIBOX、文档问答和LLM翻译。 以表现最为出彩的虚拟人口语教练为例,它已经在应用层面无限接近真人口语老师的水平了。比如,它在跟你互动过程中,会根据你的回答做出类似人类的评价,例如它问你“Can you tell me what you know about Chinese history?”你回答:“more than 5000 years,I learned”,它会跟一句:“yes,that is great,do you know about the Han Dynasty ……”形成联系上下文的有来有往的对话文本,全程虚拟人表情生动、发音地道,突破了以往“教条”的剧本式交流局限。 另外,它还具备很强的即时反馈机制和纠错能力。比如,笔者在跟它对话过程中,它能够根据笔者的发音和文字,生成练习报告给笔者以即时反馈,帮助笔者快速锁定语言卡点,覆盖8个话题场景和68个话题的内容储备,让其口语表达更精准,交流体验更接近真人水平。 而在虚拟人口语教练良好用户体验的背后,离不开其强大的底层“黑科技”实力。比如,虚拟人口语教练在语音识别能力方面进行了巨大的革新,它支持多语种的流式低延迟语音识别技术,让虚拟人Echo在中式英语、英语、中英混合等场景下游刃有余;声学降噪、回声消除、自动语音检测、自动断句等技术,则让它像一个真正的倾听者和交流者。在AI虚拟人的驱动方面,有道基于自主研发的情感识别算法和实时渲染驱动引擎,对播放的语音数据进行深度分析,使其面部表情更接近真人。 在其他应用方面,它的表现也毫不逊色。比如,在AI作文指导方面,它不仅能够批改,还能够像老师一样作指导;另外,它在语法精讲、LLM翻译、AIbox、文档问答等方面,都已经在落地或者正在落地,正在成为一个“全能的AI语言文字助手”。预计未来随着更多AI应用的落地,它将会在更多方面对用户生产力提升产生重大影响。 另一方面,网易有道子曰教育大模型的发布,也标志着网易有道多年深耕AI,在通用AI能力上走向了成熟,具备了产生应用的强大实力。前文提到,好的垂直大模型需要深厚的AI通用能力作为底座才能够走的更远,作为教育行业首个垂直大模型厂商,网易子曰大模型的推出,实际上正是建构在网易有道多年的AI通用技术能力之上。 作为国内NLP能力领先的公司,有道多年来一直致力于基于Transformer模型的创新和应用,还积累了OCR、ASR、TTS、CAPT等几大核心技术,正是这些技术的有效整合,打开了新的想象空间,让有道成为国内率先将AIGC技术落地教育场景内的企业。...
原创
            通用VS垂直,讯飞星火与网易子曰不同的“大模型解法”
星火

原创 通用VS垂直,讯飞星火与网易子曰不同的“大模型解法”

原标题:通用VS垂直,讯飞星火与网易子曰不同的“大模型解法” 配图来自Canva可画 随着大模型商业化应用的提速,全世界各国都开始孵化和孕育各自的行业大模型。在此背景下,国内各个细分行业的垂直大模型,日益受到产业界的关注和重视。 相比通用大模型,垂直大模型具有门槛较低、数据质量较好且靠近落地场景的优势,因而伴随着大模型产业化的深入,其发展空间进一步打开,正在成为下一阶段行业竞争的焦点。事实上,一些受大模型影响特别明显的垂直行业如教育行业,已经率先掀起了大模型竞赛。 大模型成教育领域新变量 今年以来,教育领域包括网易有道、好未来、科大讯飞等行业巨头,先后公布了自己在AI大模型领域的布局和进展,由此大模型之风迅速席卷教育行业。而在教育领域纷纷刮起大模型之风的背后,则与多方面的因素有关。 首先,教育领域和AI大模型有很高的契合度,因而具备更好的落地条件。当前AI大模型大都具备自然语音处理、语音识别、图像识别等诸多能力,其为智能教育在视、听、音等多模态下,实现教育场景全覆盖提供了可能,成为“AI+教育”的核心引擎。此外,随着多模态生成技术的成熟,多模态生成模型的深度融合,将进一步使AI教学、AI虚拟互动趋于立体化,打破扁平的文本式结构,通过图像、视频、数字人生成等技术为教辅产品提供丰富的教学素材和内容呈现形式,打造全新的智能教育生态。 其次,用户对于教育智能产品的接受度日渐提升,AI大模型能够为用户带去更加智能的教育体验。目前AI教育已经发展一段时间了,用户对于智能化的教育产品,也有了相应的认知与了解,而AI大模型的应用,则能为智能教育的发展增添新动能。比如,智能硬件接入AI大模型之后,硬件的交互体验得到了加强,产品智能化也有了“质”的飞跃。 最后,AI大模型可以同时在B端和C端发力,在撬动庞大教育市场的同时,可以做到最小成本实现“因材施教”的教学目标,非常契合当下教育市场的阶段需求。一般而言,教育的投入来源有二:一方面是C端的教育培训消费,另一方面是B端的教育信息化投入,而这两方面都可以构筑起规模相当庞大的市场。如在C端,AI有望成为学生的“智能老师”,为孩子提供作文批改和英语对话等个性化场景学习服务,实现因材施教;在B端,则可以聚焦相对标准化的考场阅卷、在线教学等场景,大幅度提升考试阅卷的效率和准确率。基于此,大模型正在成为教育领域全新变量。 不同路线、不同思路 从整个行业来看,由于参与玩家的背景不同,其所走的路线也存在显著差异。目前来看,发力教育领域的大模型厂商主要分为两类:一是以百度文心一言、科大讯飞星火大模型为代表的通用大模型厂商,其面向的是包括教育在内的泛行业企业;二是以网易有道、学而思等为代表的垂直大模型厂商,其主要专注教育细分领域。结合各个厂商的情况来看,不同路线的背后,实际上对应着厂商的不同思路。 对于大厂而言,由于它们总体综合实力较强,具备构建大模型的一些底层技术能力,因而其更倾向于走通用大模型路线,后期借助大模型与场景结合,快速搭建起服务生态。目前业内包括百度、腾讯、阿里、科大讯飞等厂商,都纷纷依托自身的技术优势、团队优势和资金支持,在通用大模型领域实现了抢跑。比如阿里发布了通义千问大模型、华为发布了盘古大模型、百度发布了文心一言、科大讯飞发布了星火大模型等,在抢夺市场机会的同时,其直面产业的“倾向”也越来越明显。 比如,百度就宣称与超过300家企业成为生态伙伴;4月阿里云也宣布与七家企业推动大模型在油气、电力、交通等行业落地;华为早前也发布了盘古金融、电力、药物分子三个垂直领域大模型;而刚刚公布MaaS解决方案的腾讯,已和数十个行业的22家企业达成大模型共建合作;科大讯飞更是宣布,星火大模型首批接入36个行业3000余家企业……可见,当下推动大模型场景落地、打通服务生态,依然是通用大模型厂商的核心任务。 对于垂直行业厂商而言,其在行业深耕已久,对用户的需求理解和场景落地具备更强的洞察能力,又综合了专家经验、组织能力、工程能力的knowhow优势,具备高质量触达用户场景的竞争力。与通用大模型厂商不同,一些重要的行业玩家如新华三、京东、网易有道、携程等,则聚焦大模型与产业的融合机会,紧盯垂直赛道。比如,京东发布了言犀大模型、京医千询大模型,携程发布了携程问道大模型,网易有道发布了基于教育的子曰大模型。相比通用大模型厂商而言,垂直大模型厂商在相关行业深耕已久,因而在寻找产业机会方面往往走得更加深入。 以网易有道为例,网易有道早在2016年就开始构建AI协同基础能力,同步组建语音、视觉、声音等团队,积累了四大底层技术:有道神经网络翻译(NMT)、计算机视觉、智能语音AI技术、高性能计算等,同时网易有道深耕在线教育多年,已经在名师、线上网课、用户体量等方面构建起了比较优势,这让网易有道相比行业外的厂商更了解教育,相比教育行业内的友商更懂AI。基于这种优势,网易有道更容易抓住大模型在教育领域的落地机会,并借助它打造差异化的智能硬件,以及差异化的服务和用户体验,夯实其行业竞争力。 从这个角度来看,通用大模型厂商与垂直大模型厂商只是分工不同,并没有绝对优劣之分。 有道打响教育大模型应用第一枪 作为国内首个自研教育大模型,网易“子曰”大模型的发布,正式打响了教育领域垂直大模型应用第一枪,其现实意义不言而喻。 一方面,相比底层技术,靠近前端应用的垂直大模型的技术价值、商业价值更具想象空间。正如前文所述,随着大模型逐步深入产业,其应用价值愈加凸显。以7月26日网易有道推出的子曰大模型为例,其基于大模型成功推出了6个已经落地,或者即将落地的应用,分别是虚拟人口语教练、中文作文指导、英语语法精讲、AIBOX、文档问答和LLM翻译。 以表现最为出彩的虚拟人口语教练为例,它已经在应用层面无限接近真人口语老师的水平了。比如,它在跟你互动过程中,会根据你的回答做出类似人类的评价,例如它问你“Can you tell me what you know about Chinese history?”你回答:“more than 5000 years,I learned”,它会跟一句:“yes,that is great,do you know about the Han Dynasty ……”形成联系上下文的有来有往的对话文本,全程虚拟人表情生动、发音地道,突破了以往“教条”的剧本式交流局限。 另外,它还具备很强的即时反馈机制和纠错能力。比如,笔者在跟它对话过程中,它能够根据笔者的发音和文字,生成练习报告给笔者以即时反馈,帮助笔者快速锁定语言卡点,覆盖8个话题场景和68个话题的内容储备,让其口语表达更精准,交流体验更接近真人水平。 而在虚拟人口语教练良好用户体验的背后,离不开其强大的底层“黑科技”实力。比如,虚拟人口语教练在语音识别能力方面进行了巨大的革新,它支持多语种的流式低延迟语音识别技术,让虚拟人Echo在中式英语、英语、中英混合等场景下游刃有余;声学降噪、回声消除、自动语音检测、自动断句等技术,则让它像一个真正的倾听者和交流者。在AI虚拟人的驱动方面,有道基于自主研发的情感识别算法和实时渲染驱动引擎,对播放的语音数据进行深度分析,使其面部表情更接近真人。 在其他应用方面,它的表现也毫不逊色。比如,在AI作文指导方面,它不仅能够批改,还能够像老师一样作指导;另外,它在语法精讲、LLM翻译、AIbox、文档问答等方面,都已经在落地或者正在落地,正在成为一个“全能的AI语言文字助手”。预计未来随着更多AI应用的落地,它将会在更多方面对用户生产力提升产生重大影响。 另一方面,网易有道子曰教育大模型的发布,也标志着网易有道多年深耕AI,在通用AI能力上走向了成熟,具备了产生应用的强大实力。前文提到,好的垂直大模型需要深厚的AI通用能力作为底座才能够走的更远,作为教育行业首个垂直大模型厂商,网易子曰大模型的推出,实际上正是建构在网易有道多年的AI通用技术能力之上。...
讯飞星火认知大模型V1.5来了,加速抢跑用行动证明领先
星火

讯飞星火认知大模型V1.5来了,加速抢跑用行动证明领先

人工智能发展如火如荼,大模型的诞生风起云涌,不过虽然看到了很多大模型的发布,但还是很少能看到大模型的进步,让人不由得怀疑大部分企业是不是只在跟风。 不过,刚刚发布一个月的讯飞星火大模型却紧锣密鼓地又召开了一次升级发布会,可以看出讯飞是真正在大模型时代发力狂奔,而这次发布的“讯飞星火认知大模型”V1.5甚至超越了上次发布会所承诺的更新速度,不仅在多种交互能力上实现了突破,在教育医疗等多个垂直领域也获得了巨大进步。 高考题上见真章 这两天恰逢高考,关于AI和高考的话题自然也就热了起来。搜狐科技使用五款AI大模型对2023高考上海数学试卷的10道填空题进行了测试,结果科大讯飞星火认知大模型答对了5题,正确率50%。ChatGPT和百度文心一言都答对了4题,正确率40%。而阿里通义千问和360智脑则10道题全错,正确率0%。 从这个结果上来看,上次讯飞发布会所说的讯飞星火大模型文本生成、数学能力已超过ChatGPT并非是吹牛。而在6月9号的发布会上,“讯飞星火认知大模型”V1.5重点呈现大模型在知识问答、数学能力、多轮交互中的升级,可以说AI能力又进一步,相信在领先幅度上又有加大。 所以无论从那个角度来看,讯飞都是在大模型领域做的最认真也是迭代速度更快的。我觉得大模型的竞争是一个分秒必争的竞争,大家不仅各自在模型学习上永无止境,在算法和功能的落地体验上,也要不断的适配。大模型最终不会是一个聊天软件,而是真正要形成生产力的AI发动机,从这个角度来说,在针对场景化的落地上,比如教育、医疗、应用适配方面,讯飞星火大模型确实还是走在前面的。要知道,大模型最终的分界点还是要看谁能够先实现“智慧涌现”,也就是一下子形成一个质的飞跃和变化。这种跨越式的升级会一下子拉开各家之间的差距,就好像高中生高考进入大学一样。并不是所有的大模型最终都能实现“智慧涌现”的,这可能也是最终判断大模型是否能够成功的关键。能力升级,应用落地在大模型的能力判断上,行业其实还没有统一标准,大部分测试也都相对局限,在这一点上,作为人工智能“国家队”之一,科大讯飞被授予人工智能关键技术和应用评测工业和信息化部重点实验室大模型工作组的副组长单位,参编中国信通院大模型标准体系2.0的建设,正在用我们自己的能力去构建行业的标准。 而在后者的应用落地上,显然这是讯飞最大的优势所在,无论是软件还是硬件,现在都已经有了成熟的产品应用,而在大模型产品的加持下,讯飞硬件产品在这次618大促上的表现也异常出色,大促开场不久就完成了去年全天的销售额,讯飞AI学习机系列激活同比增长214%,讯飞智能办公本系列激活同比增长176%,讯飞听见网站新增用户同比增长205%。 6月9日,是科大讯飞的24周年庆,而在这次的发布会上,讯飞星火认知大模型V1.5主要的升级核心有两点,一个是讯飞星火大模型在能力上的升级,一个则是讯飞星火大模型在应用上的落地。讯飞星火认知大模型V1.5除了大模型本身能力的整体提升外,还在综合能力上实现三大升级,包括:开放式知识问答取得突破,多轮对话、逻辑和数学能力再升级。在现场,科大讯飞总裁吴晓如、研究院院长刘聪针对性的进行了测试,提出了诸如“2023年全国高考甲卷的作文题是什么,并分析一下它传递的意义。“ “高考刚刚结束,孩子即将开启新的起点,请给你的孩子写一封暖心的信。”这样更为开放性的问题,以及“一条船上有三个人,但是有两个父亲,两个儿子,请问是怎么回事?” “1个鱼缸里有很多条鱼,共有5个品种,至少要捞出多少条鱼,才能保证其中有4条相同品种的鱼?”这样逻辑性和数学性兼顾的问题,都获得了很好的回答。现场甚至还演示了拍照识别数学试卷,大模型准确答卷的测试,充分体现出了讯飞星火大模型V1.5的能力增强。为了更好的服务用户,在现场星火APP同步大模型发布,成为大模型的具体载体,而面向生活、工作等用户高频使用场景上线200+小助手,把AI落地做到了实处。科大讯飞还表示将进一步推动星火认知大模型在教育、医疗、工业、办公等领域落地应用,赋能星火语伴APP、医疗诊后康复管理平台、羚羊工业互联网平台、讯飞听见智慧屏等产品,并开放了讯飞星火开发接口,携手开发者共建“星火”生态。如果说五月份科大讯飞董事长刘庆峰表示“星火大模型距离ChatGPT差距不远,有些地方甚至有所超越”还让人觉得有点吹牛的成分,那么这次的展示显然凸显出了科大讯飞的底气。刘庆峰表示,“今天我们再次如期发布星火大模型的最新成果,是因为我们所有的技术平台都是完全自主研发的,我们对每一个阶段的技术都是可控的,也非常有信心。讯飞不仅要致敬和追赶OpenAI,更要在源头上做自主创新,在类脑智能、神经网络大模型、博弈智能等方面探索通用人工智能的更多潜在路径和前沿交叉研究机会。” 自国内大模型批量上市之后,很多人都会发现一个问题,就是感觉各大通用大模型似乎没有太大差距,基本都能做到有问有答,但好玩之余似乎没有什么地方能够用到。即便是在海外,同样的问题依旧存在,不少领域真正实用的大模型实际上并非通用大模型,而ChatGPT的各种产品落地,也并没有带来更为惊艳的用户体验,依旧还是一个加强版的搜索引擎。 所以,从这里我们可以看出,大模型的发展方向有两个关键点,一个是“智慧涌现”的关键节点,一个是具体场景的落地应用。前者似乎有些不可预测,但后者则是完全可以尝试领先一步的。毕竟,我国的科技行业一直在应用端有着无可比拟的优势,率先在应用端实现领先突破似乎是逆袭ChatGPT的关键路径。 科大讯飞一早就建立了认知大模型“1+N”专项攻关的体系,其中“1”就是通用的认知智能大模型,“N”就是将“讯飞星火”在教育、办公、汽车、人机交互、医疗等领域进行应用落地。而这次讯飞星火认知大模型V1.5更进一步拓宽了对“N”个行业领域的赋能。比如AI口语助手升级的星火语伴APP,已经可以像外语口语老师一样进行开放式对话、情景交流,并进行实时口语纠错,配合虚拟老师形象,可以让用户可以身临其境的练习口语,并支持9种语言文本、语音和图片翻译。在办公领域,科大讯飞发布了业界首个搭载大模型的会议室智能终端——讯飞听见智慧屏。它可以实现动态会议记录、会议内容自动整理输出,一键生成多种类型的会议文案,助力用户高效办公。在医疗方面,讯飞医疗全面升级医疗诊后康复管理平台,将专业的诊后管理和康复指导延伸到院外,可以根据患者健康画像自动分析,平台可为患者智能生成个性化康复计划,包括重点关注、用药指导、康复运动、出院随访、健康知识、患者咨询等,并督促患者按计划执行。在工业领域,在星火大模型的基础上,羚羊平台推出了工业AI——“羚机一动”。中小企业在羚羊平台上自由发布需求,羚机一动针对企业需求给出专业化建议策略,智能匹配方案、服务商、专家等资源,等等。可以说,讯飞星火大模型正如其名称一样,真正地已经在各个领域开始星火燎原了。刘庆峰在现场宣布,讯飞将开放星火认知大模型开发接口,将七大维度能力、200+小助手对应能力全面开放给开发者,并且支持多端接入快速集成,支持私有化部署,与广大开发者共建生态。他表示:“通用人工智能的全新时代将是一个伟大的历史进程,绝不是一蹴而就的,所以我们既要有短期攻关的雄心,更要有长期主义的恒心。这是我们应该遵循的产业逻辑和科研发展应有的规律,这样才能够在长跑中真正胜出,真正的解决社会刚需,建设美好世界。”往期推荐荣耀618迎来开门红,高质量增长背后的长期主义逻辑超级618,李佳琦和美ONE不止于“直播带货”做行业的逆行者,梦百合联名三体打造真正智能健康床品让每一次交流都有价值,iFLYBUDS Nano+用AI打破场景从荧幕到现实,乐森机器人蹚出了自己的路阿里再进化,持续创新公司治理华为平板再出旗舰,全新华为MatePad Air对iPad发起总攻360、智谱AI官宣合作 双向奔赴的二者能否复制ChatGPT成功?率先拥抱折叠屏时代,搜狐新闻不忘初心带来绝佳大屏体验光学影像未来在手机,手机未来在中国机库音乐,卫浴破圈|安华卫浴打造年轻人的自由美学中美创业环境有不同,美国更年轻,中国更开放从高效率到高质量,蒙牛“GREEN”战略的定力和远见走进荣耀深圳研发实验室,解密行业高端竞赛终极胜负手先旗舰,后折叠,vivo折叠屏手机的不妥协之路以创新破局,挽行业将倾,荣耀笔记本的突破与启示性能升级,智慧翻倍,华为智慧屏再度刷新行业上限手机遗失一个月找回无望?看荣耀如何给用户“安全感”从微盟2022年财报看视频号带来的业绩新增量账号简介2015至2022年,微博连续八年互联网十大最有影响力大V2021年百家号年度影响力创作者2021年百度APP年度个人作者2021年一点资讯年度十大科技创作者2020年百家号百大创作者2020年人民网科技领域年度创作者2020年一点资讯一点号年度影响力作者2020年至2021年商业新知新耀之星创作者2020年Donews灵眸奖2020年百家号百大创作者2017至2019年克劳锐最具影响力科技互联自媒体 2019年百度百家号年度优质个人创作者 2019年经济观察报年度财经自媒体2019年Donews年度十大专栏作者2019年蓝媒汇年度精英30人2018年百度动态影响力红人2018年度中国财经TMT行业“领秀榜”年度最佳自媒体人2017至2018年媒体训练营最佳媒体人奖2017年蓝鲸自媒体联盟年度科技大V2017年自媒体作者极客大奖2016年新浪科技自媒体界领袖2015年凤凰年度自媒体人2015年速途网新媒体联盟十佳自媒体