【AI编年史】GPT诞生后的700多天,世界发生了什么?视频盘点国内外AI模型平台国外篇ChatGPT 公司:OpenAIChatGPT(全名:Chat Generative Pre-trained Transformer),基于GPT系统大模型构建,是OpenAI采用“从人类反馈中强化学习”(RLHF)训练方式,在GPT-3基础上研发,并于2022年11月30日发布的能够对话的GPT-3.5版本。ChatGPT的本质是提高人脑对各种信息资料进行收集、整理、计算、分析等能力的智能工具,是为人脑”观念建构”提供丰富、精准的方案、图式等资料或条件等的工具体系。2023年3月,OpenAI推出GPT-4;2023年5月、7月、8月、11月,2024年1月、5月、12月,OpenAI先后推出iOS版、安卓版、企业版、自定义版本、团队版、教育版ChatGPT应用。ChatGPT是一款聊天机器人程序,能够基于在预训练阶段所见的模式和统计规律生成回答,还能根据聊天的上下文进行互动,真正像人类一样来聊天交流。它强大的自然语言处理能力和多模态转化能力使之可用于多个场景和领域。它可用来开发聊天机器人,编写和调试计算机程序,撰写邮件,进行媒体、文学相关领域的创作,包括创作音乐、视频脚本、文案、童话故事、诗歌和歌词等。它还可以用作自动客服、语音识别、机器翻译、情感分析、信息检索等。2025年1月14日,OpenAI宣布推出名为Tasks的测试版新功能。ChatGPT Pro 公司:OpenAIChatGPT Pro是OpenAI推出的订阅服务,售价每月200美元。购买这项服务可以扩展访问OpenAI的最佳模型和工具,包括无限制地访问其最智能的模型OpenAI o1,包括最新发布的o1 pro,以及o1-mini、GPT-4o和Advanced Voice。Grok 公司:xAIGrok是马斯克旗下xAI团队发布的首个AI大模型产品。它于2023年11月5日发布。马斯克认为,相比较 OpenAI 的 ChatGPT、谷歌的 Bard 和微软的 Bing Chat,Grok 最大的不同是存在幽默感。当地时间2024年3月28日,人工智能初创公司xAI宣布将推出Grok-1.5,该模型能够进行长语境理解和高级推理。2025年1月,马斯克旗下人工智能公司xAI推出首款面向消费者的独立应用。2025年1月, xAI 公司上线推出了网页版 Grok AI 聊天机器人。泰坦 公司:亚马逊泰坦(Titan),是亚马逊推出的大型语言模型。2023年4月13日,亚马逊云服务部门宣布推出自有的大型语言模型泰坦。LLaMA 公司:MetaLLaMA,是元宇宙平台公司(Meta)公开发布的产品。2023年7月,Meta公司发布了人工智能模型LLaMA 2的开源商用版本,意味着大模型应用进入了“免费时代”,初创公司也能够以低廉的价格来创建类似ChatGPT这样的聊天机器人。2024年7月23日,Meta发布LLAMA 3.1 405B开源人工智能模型。Copilot 公司:微软Copilot是微软在Windows 11中加入的AI助手,该AI助手是一个集成了在操作系统中的侧边栏工具,可以帮助用户完成各种任务。Copilot依托于底层大语言模型(LLM),用户只需说几句话,做出指示,它就可以创建类似人类撰写的文本和其他内容。2023年5月24日,微软在其年度Build开发者大会上宣布,将在Windows 11中加入一个名为Copilot的AI助手。Replika 公司:LukaReplika是一家名为Luka的公司在2016年就推出了自己的人工智能聊天机器人产品。Google智能助理 公司:谷歌Google智能助理是Google开发的智能助理,于2016年5月在Google I/O发布。与Google即时不同,Google智能助理可以参与双向对话。智能助理被集成在Allo应用、Google Home设备、Android 6.0或以上的设备、Pixelbook、Wear OS、Android TV、iOS和Android Auto。Gemini 公司:谷歌Gemini是一款由Google DeepMind(谷歌母公司Alphabet下设立的人工智能实验室)于2023年12月6日发布的人工智能模型,可同时识别文本、图像、音频、视频和代码五种类型信息,还可以理解并生成主流编程语言(如Python、Java、C++)的高质量代码,并拥有全面的安全性评估。首个版本为Gemini 1.0,包括三个不同体量的模型:用于处理“高度复杂任务”的Gemini Ultra、用于处理多个任务的Gemini Nano和用于处理“终端上设备的特定任务”的Gemini Pro。谷歌AI模型的研发进程从2012年就已开始;2022年8月推出高级语言学习模型PaLM;2023年5月Google I/O大会上Alphabet首席执行官桑达尔·皮查伊发布了PaLM2与Bard,同时宣布Gemini即将问世;12月6日在一段官方公布的视频中,谷歌正式推出Gemini。谷歌计划逐步将Gemini整合到其搜索、广告、Chrome等其他服务中。从2023年12月13日开始,开发者和企业客户可以通过Google的AI Studio和Google Cloud Vertex AI中的Gemini API访问Gemini Pro。2023年12月7日,科技界指出Gemini与ChatGPT测试方法存疑,且分数存在夸大嫌疑,同时发布会演示视频也存在虚假剪辑问题。随后,对于视频“造假”一说,Gemini联合创始人奥里奥尔·维尼亚尔斯予以否认。2024年2月9日,谷歌宣布Gemini Ultra可免费使用,16日发布Gemini 1.5,21日发布开源模型Gemma。Gemma采用了与Gemini相同的技术和基础架构,基于英伟达GPU和谷歌云TPU等硬件平台进行优化,有20亿、70亿两种参数规模。Bard 公司:谷歌Bard 是谷歌在大型语言模型基础上推出的聊天机器人。Bard 基于 Google 的对话应用语言模型 LaMDA 的轻量级版本,使用更少的计算能力,使其能够扩展到更多的人,并提供额外的反馈。2023年3月21日,谷歌向公众开放Bard 的访问权限。美国和英国用户可以预约。2023年12月7日,谷歌发布了其最新、最先进的大语言模型 Gemini ,用户将能够在 Google Bard 中体验特别调整的 Gemini Pro 英语版本。Claude 公司:AnthropicClaude,美国人工智能初创公司Anthropic发布的大型语言模型家族,拥有高级推理、视觉分析、代码生成、多语言处理、多模态等能力,该模型对标ChatGPT、Gemini等产品。2023年3月15日,Anthropic正式发布Claude的最初版本,并开始不断升级迭代;同年7月,Claude 2正式发布;同年11月,Claude 2.1正式发布;次年3月4日,Claude 3系列正式发布。根据Anthropic官方,Claude 3系列旗舰模型Opus在本科和研究生水平的知识、数学和复杂任务理解方面均超过GPT-4和Gemini 1.0 Ultra。国内篇文心一言 公司:百度文心一言(英文名:ERNIE Bot)是百度全新一代知识增强大语言模型,文心大模型家族的新成员,能够与人对话互动、回答问题、协助创作,高效便捷地帮助人们获取信息、知识和灵感。文心一言从数万亿数据和数千亿知识中融合学习,得到预训练大模型,在此基础上采用有监督精调、人类反馈强化学习、提示等技术,具备知识增强、检索增强和对话增强的技术优势。2023年3月16日,百度新一代大语言模型文心一言正式启动邀测。8月31日,文心一言率先向全社会全面开放。开放首日,文心一言共计回复网友超3342万个问题。12月28日,百度首席技术官王海峰在第十届WAVE SUMMIT深度学习开发者大会上宣布文心一言用户规模已突破1亿。截至2024年11月12日,文心一言用户规模达到4.3亿。截至2024年4月16日,文心一言API日均调用量也突破了2亿,服务客户数8.5万,千帆平台AI原生应用数超过了19万。2024年9月4日,文心一言APP升级为“文小言APP”。讯飞星火认知大模型 公司:科大讯飞讯飞星火认知大模型是科大讯飞发布的大模型。该模型具有7大核心能力,即文本生成、语言理解、知识问答、逻辑推理、数学能力、代码能力、多模交互,该模型对标ChatGPT。2023年5月6日,科大讯飞正式发布讯飞星火认知大模型并开始不断迭代;6月9日,星火大模型V1.5正式发布;8月15日,星火大模型V2.0正式发布;9月5日,星火大模型正式面向全民开放;10月24日,星火大模型V3.0正式发布;2024年1月30日,星火大模型V3.5正式发布。4月26日,讯飞星火大模型V3.5更新。5月22日,讯飞星火Lite版永久免费。6月27日14:00,讯飞星火V4.0正式发布。8月30日,星火语音大模型更新,带来“星火极速超拟人交互”。讯飞星火认知大模型已位列中国头部水平,通过中国信通院组织的AIGC大模型基础能力(功能)评测及可信AI大模型标准符合性验证,并获得4+级评分。通义 公司:阿里云通义,由通义千问更名而来,是阿里云推出的语言模型,于2023年9月13日正式向公众开放。属于(AI Generated Content,AIGC)领域,是一个MaaS(模型即服务)的底座。为多模态大模型(Multimodal Models)。通义意为“通情,达义”,具备全副AI能力,致力于成为人们的工作、学习、生活助手。功能包括多轮对话、文案创作、逻辑推理、多模态理解、多语言支持,能够跟人类进行多轮的交互,也融入了多模态的知识理解,且有文案创作能力,能够续写小说,编写邮件等。2023年4月7日,通义的前身通义千问开始邀请测试,4月11日,通义千问在2023阿里云峰会上揭晓。4月18日,钉钉正式接通通义千问大模型。9月13日,通义千问大模型通过首批备案,正式向公众开放。通义千问APP在各大手机应用市场正式上线,所有人都可通过APP直接体验最新模型能力。12月1日,阿里云开源通义千问720亿参数模型。12月22日,阿里云通义千问成为首个“大模型标准符合性评测”中首批通过评测的四款国产大模型之一,在通用性、智能性等维度均达到国家相关标准要求。2024年4月7日,阿里云通义千问开源320亿参数模型Qwen1.5-32B,可最大限度兼顾性能、效率和内存占用的平衡。5月,通义千问2.5大模型发布并更名。5月9日,阿里云正式发布了通义千问2.5版本。5月21日消息,阿里云宣布通义千问GPT-4级主力模型Qwen-Long,API输入价格从0.02元/千tokens降至0.0005元/千tokens,直降97%。2024年8月19日,通义千问宣布启用新域名:tongyi.ai。腾讯混元大模型 公司:腾讯腾讯混元大模型(Tencent Hunyuan)是由腾讯公司研发的大语言模型,该模型基于Transformer神经网络架构,具有万亿参数规模,具备强大的中文创作能力、复杂语境下的逻辑推理能力,以及可靠的任务执行能力。“腾讯混元大模型”属于深度合成和生成式人工智能技术,是依托腾讯天工 公司:昆仑万维天工大模型是昆仑万维自研的双千亿级大语言模型,是中国首个对标ChatGPT的双千亿级大语言模型,可满足文案创作、知识问答、代码编程、逻辑推演、数理推算等需求。2023年4月17日,自研双千亿级大语言模型天工1.0发布。7月6日,天工AI助手App正式上线,8月23日,推出国内第一款AI搜索产品天工AI搜索,11月3日,昆仑万维“天工”大模型通过《生成式人工智能服务管理暂行办法》备案,面向全社会开放服务;2024年02月06日,“天工2.0”与新版“天工AI智能助手”APP发布。2024年4月17日,“天工3.0”基座大模型与旗下的“天工SkyMusic”音乐大模型正式开启公测。2023年7月27日,入选中国信通院“铸基计划”高质量数字化转型产品及服务全景图,9月6日,MLLM测评中,综合得分排名第一;2024年3月,获得第七届金璨奖“年度创新商业模式奖”。2024年5月, 在MMBench等多项权威多模态测评结果中,“天工 3.0” 超越GPT4V,多项评测指标达到全球领先水平。5月27日,昆仑万维集团宣布,天工AI每日活跃用户已超过100万。ChatGLM 公司:清华大学ChatGLM,清华技术成果转化的公司智谱AI研发的支持中英双语的对话机器人。盘古Chat 公司:华为“盘古Chat”是华为公司旗下一款直接对标ChatGPT的多模态千亿级大模型产品。思必驰DFM-2大模型 公司:思必驰思必驰自研的对话式语言大模型DFM-2(Dialogue Foundation Model),中文直译为“通用对话基础模型”,中文取首字母谐音“东风”,显示将用大模型助力行业实现“沟通万物、打理万事”。思必驰DFM-2大模型是思必驰研发的技术。2023年7月12日,思必驰正式发布DFM-2大模型。DFM-2 属于垂域大模型,是具有通用智能、针对垂域的行业语言大模型。可以实现通用人工智能的柔性定制,开展大规模、高质量、个性化的人工智能系统定制。ChatJD 公司:京东ChatJD是由京东推出的产业版ChatGPT。ChatJD定位为产业版ChatGPT,旨在打造优势、高频、刚需的产业版通用ChatGPT。ChatJD将通过在垂直产业的深耕,快速达成落地应用的标准,并不断推动不同产业之间的泛化,形成更多通用产业版ChatGPT,构建数据和模型的飞轮,以细分、真实、专业场景日臻完善平台能力,最终反哺和完善通用ChatGPT的产业应用能力。ChatLaw 公司:北京大学信息工程学院北大团队发布了中文法律大模型ChatLaw,为大众提供普惠法律服务。模型支持文件、语音输出,同时支持法律文书写作、法律建议、法律援助推荐。豆包 公司:字节跳动豆包是字节跳动公司基于云雀模型开发的AI工具,提供聊天机器人、写作助手以及英语学习助手等功能,它可以回答各种问题并进行对话,帮助人们获取信息,支持网页Web平台,iOS以及安卓平台。2016年,字节跳动公司成立人工智能实验室AI Lab,聚焦于自然语言处理、机器学习、数据挖掘等方面的研究。2023年8月17日,豆包开始小范围邀请测试,用户可通过手机号、抖音或者Apple ID登录。2024年5月15日,字节跳动产品和战略副总裁朱骏在2024春季火山引擎Force原动力大会上表示,豆包APP总下载量达1亿次,豆包大模型将开启商业化模式,价格相比同行便宜99.3%,定价0.0008元/千Tokens;8月8日,豆包上线音乐生成功能;10月10日,豆包发布首款AI智能体耳机Ola Friend;11月7日,豆包正式推出视频生成内测;12月3日,豆包已上线图片理解功能。LightGPT 公司:恒生电子LightGPT是恒生电子发布的金融行业大模型。MOSS 公司:复旦大学MOSS是复旦大学自然语言处理实验室发布的国内第一个对话式大型语言模型。2023年2月20日,解放日报·上观新闻记者从复旦大学自然语言处理实验室获悉,MOSS已由邱锡鹏教授团队发布,邀公众参与内测。2月21日,该平台发布公告,感谢大家的关注,同时也指出,MOSS还是一个非常不成熟的模型,距离ChatGPT还有很长的路需要走。360智脑 公司:360360智脑是360自研认知型通用大模型,依托360多年积累的大算力、大数据、工程化等关键优势,集成360GPT大模型、360CV大模型、360多模态大模型技术能力,具备生成创作、多轮对话、逻辑推理等十大核心能力、数百项细分功能,重塑人机协作新范式。为服务产业数字化,360发布企业级AI大模型战略,以人为本,构建安全可信大模型。2023年3月29日,360智脑大模型1.0版本发布。 6月13日,大模型升级至4.0版本,数字人、多模态应用、360全端应用等成果落地。拓世大模型 公司:拓世科技拓世大模型是拓世科技集团开发的具有巨大规模和复杂结构的人工智能大语言模型,拥有数万亿个参数,通过在庞大的数据集上进行训练,以AI为核心,构建了一个全面的数字化生态系统,可处理包括自然语言、图像、声音等在内的多种形式信息,具备理解和生成高质量内容的能力。2023年6月10号,拓世科技集团AI+战略暨AIGC拓世大模型发布会上正式发布拓世大模型TechGPT 公司:东北大学TechGPT,是中国东北地区首个全量微调并开源的大模型。鸿湖 公司:中国联通鸿湖是中国联通图文大模型,该模型训练参数达20亿,支持以文生图、以图生图、视频剪辑等多样化的AI能力。日日新 公司:商汤科技日日新(SenseNova),是商汤科技宣布推出的大模型体系,包括自然语言处理模型“商量”(SenseChat)、文生图模型“秒画”和数字人视频生成平台“如影”(SenseAvatar)等。2023年4月,商汤科技董事长兼首席执行官徐立宣布推出“日日新SenseNova”大模型体系。2023年8月,日日新大模型获批上线。2024年5月29日,商汤正式对外发布日日新大模型5.0粤语版。天河天元 公司:国家超级计算天津中心天河天元是国家超算天津中心搜集整理了网页数据、各种开源训练数据、中文小说数据、古文数据、百科数据、新闻数据,以及专业领域的中医、医药、问诊、法律等多种数据集,训练数据集总 token 数达到 350B,最终训练打造出的中文语言大模型。天擎 公司:美亚柏科天擎是美亚柏科发布的国内首个公共安全大模型。梧桐 公司:宇视科技梧桐是宇视科技发布的宇视AIoT(人工智能物联网)行业大模型。2023年5月9日,宇视科技发布行业大模型“梧桐”。悟道·天鹰 公司:智源人工智能研究院“悟道·天鹰”是北京智源人工智能研究院发布的语言大模型。悟道・天鹰Aquila语言大模型是第一个中英文双语大模型,支持商用、符合数据合规要求,在中英高质量合规的语料数据库基础上从零开始训练。小可 公司:电科太极小可,电科太极发布的生成式人工智能大模型产品。2023年6月9日,中国电科所属电科太极在京正式发布“小可”。序列猴子 公司:出门间间“序列猴子”,是李志飞研发的大模型产品,该大模型以语言为核心的能力体系涵盖“知识、对话、数学、逻辑、推理、规划”六个维度,能够同时支持文字生成、图片生成、3D内容生成、语音生成和语音识别等不同任务。轩辕 公司:度小满“轩辕”是度小满开源的国内首个千亿级中文金融大模型,轩辕大模型是在1760亿参数的Bloom大模型基础上训练而来,在金融名词理解、金融市场评论、金融数据分析和金融新闻理解等任务上,效果相较于通用大模型大幅提升,表现出明显的金融领域优势。千亿级的轩辕模型已可以在Huggingface中申请下载,面向所有金融机构开放。长虹超脑 公司:长虹长虹超脑是依托于多模态交互,语义理解及意图识别,大数据等技术构建起的人工智能超脑系统,号称具备能感知、能理解、能学习三大核心能力;可应用于日常生活答疑,专业领域探索以及个性化服务等方面;搭载于长虹电视上,以数字形象“长虹小白”的形式与用户交互,并执行指令。贞仪 公司:蚂蚁集团贞仪,是蚂蚁集团的技术研发团队正在自研语言和多模态大模型。紫东太初 公司:中科院紫东太初,是中国科学院自动化研究所研发的跨模态通用人工智能平台。全球首个图文音(视觉-文本-语音)三模态预训练模型(OPT-Omni-Perception pre-Trainer),同时具备跨模态理解与跨模态生成能力,取得了预训练模型突破性进展。“紫东太初”跨模态通用人工智能平台以多模态大模型为核心,基于全栈国产化基础软硬件平台,可支撑全场景AI应用。多模态预训练模型被广泛认为是从限定领域的弱人工智能迈向通用人工智能路径的探索。自动化所“紫东太初”跨模态通用人工智能平台瞄准成为实现通用人工智能的开天之斧,在智能世界混沌初开之际开辟新局。2023年6月16日,中国科学院自动化研究所发布紫东太初2.0。2023年8月,中科院旗下紫东太初的大模型位列首批通过《生成式人工智能服务管理暂行办法》备案的名单,可正式上线面向公众提供服务。TigerBot 公司:虎博科技 TigerBot是一款由国内团队虎博科技自研的多语言任务大模型,覆盖生成、开放问答、编程、画图、翻译、头脑风暴等15大类能力,支持子任务超过60种,且支持插件。商量 公司:商汤科技商量(SenseChat),是商汤科技旗下的中文语言大模型应用平台。2023年4月10日,商汤科技举办技术交流日活动。商汤研发的大语言模型被命名为“商量SenseChat”。2023年8月31日,商汤科技官宣,商汤日日新大模型旗下自然语言应用“商量SenseChat”正式面向用户开放服务。书生·浦语 公司:上海人工智能实验室书生·浦语(InternLM)是2023年6月7日,由上海人工智能实验室、商汤科技联合香港中文大学、复旦大学及上海交通大学发布的千亿级参数大语言模型,具有1040亿参数它是在包含1.6万亿token的多语种高质量数据集上训练而成的。2023年9月20日,正式推出书生·浦语大模型(internlm)200亿参数版本internlm-20b,并在阿里云魔搭社区(modelscope)开源首发,是基于2.3t token预训练语料从头训练的中量级语言大模型。2024年1月18日,发布新一代书生·浦语2.0(InternLM2),在数理、代码、对话、创作等各方面都有长足进步,能够一次性处理约30万汉字的输入内容,在55个主流评测集上,InternLM2与多个同量级模型接受了综合评测,结果显示:InternLM2的轻量级(70亿参数)和中量级(200亿参数)版本性能处于领先水平;200亿参数版本尽管只是中等规模,但在整体表现上达到了与ChatGPT比肩的水平。2024年11月25日,上海人工智能实验室向社会用户开放了实验室开发的“书生·浦语”大模型。书生·浦语不仅在知识掌握、阅读理解、数学推理、多语翻译等多个测试任务上表现优秀,而且具备很强的综合能力,因而在综合性考试中表现突出,在多项中文考试中取得超越ChatGPT的成绩,其中就包括中国高考各科目的数据集(GaoKao)。书生·浦语2.0不仅在客观性能指标上提升显著,在主观体验上也有明显改善,可以为用户提供更好的对话和交互体验,具备较强的“共情”能力和丰富的结构化创作能力。硅基知识大模型 公司:深兰科技硅基知识大模型是深兰科技研发的一款针对垂直领域、特定用户、细分应用场景的、用户可训练的生成式大语言模型。知海图AI 公司:知乎和面壁科技知海图AI,是知乎和面壁科技合作发布的中文大模型,于2023年4月13日正式开启内测。WPS AI 公司:金山办公“WPS AI”是金山办公旗下具备了大语言模型能力的一款生成式人工智能应用,也是中国协同办公赛道首个类ChatGPT式应用。2023年7月6日,金山办公正式推出基于大语言模型的智能办公助手WPS AI,官网同步上线。2024年7月5日, 金山办公发布WPS AI 2.0。西湖大模型 公司:西湖心辰(杭州)科技有限公司2023 年 07 月 09 日,西湖心辰(杭州)科技有限公司正式推出自研的通用大模型——“西湖大模型”。西湖大模型具备长期记忆、情感感知和主动聊天等功能,并且融合了文字、图片、语音等多种模态。蓝心大模型 公司:vivo蓝心大模型是vivo发布的自研大模型矩阵。2024年10月10日,vivo在开发者大会上正式发布自研的全新蓝心大模型矩阵,全面升级语言大模型和端侧大模型能力,并带来vivo自研的语音大模型、图像大模型以及多模态大模型。SoulX 公司:上海任意门SoulX,是社交平台Soul上线的自研语言大模型。Kimi 公司:月之暗面Kimi是北京月之暗面科技有限公司于2023年10月9日推出的一款智能助手,主要应用场景为专业学术论文的翻译和理解、辅助分析法律问题、快速理解API开发文档等,是全球首个支持输入20万汉字的智能助手产品。Kimi在二级市场一度复现了ChatGPT“带货能力”的势头,引发了一众“Kimi概念股”狂飙猛涨。2024年3月18日,Kimi智能助手启动200万字无损上下文内测。3月21日,Kimi因流量突然剧增无法正常使用。2024年4月18日,月之暗面官宣旗下Kimi智能助手更新。4月24日,月之暗面宣布Kimi大模型学会“使用工具”了,API已支持Tool Calling功能。5月,Kimi推出付费打赏功能,开始试探C端付费意愿。10月,月之暗面正式上线具备AI自主搜索能力的Kimi探索版,搜索量是普通版的10倍,一次搜索即可精读500个页面。Baichuan 公司:百川智能Baichuan是百川智能研发的超千亿参数的大语言模型。百川智能采用了“动态数据选择”、“重要度保持”以及“异步CheckPoint存储”等创新技术手段,提升了Baichuan的各项能力。2024年5月22日,百川智能发布基座大模型Baichuan 4。7月4日—6日,2024世界人工智能大会在上海召开。智谱清言 公司:智谱华章智谱清言,是北京智谱华章科技有限公司推出的生成式AI助手,可在工作、学习和日常生活中为用户解答各类问题,完成各种任务。2023年8月31日,“智谱清言”上线。2024年8月29日,智谱清言APP支持视频通话功能。元象大模型 公司:深圳元象元象大模型是由深圳元象XVERSE从头训练、全链路自主研发的高性能通用大模型系列,现已成功研发XVERSE-7B、13B、65B等多个量级的高性能大模型,并且全部开源,免费商用。GPT诞生后的740天里AI这样点亮世界 盘点2024年AI大事件2024年逐渐进入尾声,今年被称为AI落地元年,在以创意生成、营销服务为代表的诸多领域,AI正在全面走向落地。回看这波AI的发展历程,ChatGPT横空出世是一个重要节点。当时,世界上的绝大多数人并没有意识到,人类正进入一个全新的通用AI时代。ChatGPT诞生以来的七百多天里,生成式AI浪潮一步步演进,改变了我们生产生活:最初,围绕着基础大模型,全球范围掀起了一场大模型的军备竞赛;之后,人们发现,AI能力不只在基础模型上,还在有用有趣的应用里。一众企业纷纷摸索将AI落地到各类场景里;而经过两年的演进,当下AI正步入全面应用爆发阶段——以创作、营销为代表的诸多领域里,AI正扮演生产力工具,帮助企业实现降本增效。01 百模大战的那些日子2023年1月,ChatGPT创造了一项新的历史纪录。推出仅2个月,月活跃用户数量就突破了1亿,成为史上用户量增长最快的消费级应用。这一登峰造极的速度和关注烈度,不亚于一场科技核爆。它也向全世界科普了一个新的概念,生成式AI。ChatGPT所代表的基于Transformer架构的生成式预训练AI,正引领着人工智能行业进入一个全新的通用AI时代。全球科技圈由此展开一场对追赶OpenAI步伐,研发更大参数规模能力更强模型的竞逐。去年2月,发明Transformer架构的谷歌没有快速推出大模型,但投资款先打出去了。它向创业公司Anthropic投资约3亿美元。不久,Meta推出了Llama1,在一众硅谷巨头中,最先到达了基础模型战场。而被谷歌投资的Anthropic则在一个月后上线Claude 1,试图跟上OpenAI的节奏。国内企业很快加入了混战。去年3月16日,以百度的文心一言为起点,国内轰轰烈烈的百模大战拉开了序幕。4月阿里推出通义千问,商汤发布日日新系列大模型。之后几个月里,智谱、百川、MiniMax、腾讯等一众大模型新贵和老牌巨头争相推出了自己的大模型。大模型六小虎也一个个浮出水面。大语言模型赛道风起云涌之际,一家名为Midjourney的文生图AI独角兽突然在朋友圈刷屏。这家神奇的公司只有11名正式员工,却凭借着简单易操作的界面和出色的图片生成效果,吸引了超 1000 万付费订阅用户,年营收也超 1 亿美元。全网惊呼“伟大的公司只需11人”时,AI在创意营销和内容生成的想象空间也被彻底打开,许多营销设计领域的职业人士都意识到,AI真的来了。除了大语言模型领域不断迭代追赶,更多模态的模型战场也热闹非凡。今年年初Sora刷屏带火视频生成赛道,人们进一步发现,创意内容创作的门槛有望进一步降低。Sora公布概念视频后国内不少企业陆续推出了可试用产品。到今年6月,快手的视频生成模型可灵AI上线,一口气把视频生成的时长提到了分钟级,引发全球几十万人排队试用。这一领域里中国企业追赶速度惊人,有后来居上的架势。基础模型的竞逐盛况也使得市场对AI算力的需求不断提升,英伟达的市值迎来了高光时刻。2023 年 6 月 13 日,英伟达市值突破 1 万亿美元,之后它一路增长,目前已超3.4万亿美元,成为市值最高的公司之一。02 应用来了去年11月,比尔盖茨在个人博客上发表了一篇长文,他预言五年内每个人都将拥有AI私人助理,AI将会极大重构人类生产生活。某种程度上,这是一个信号,也逐渐成为业界共识——基础模型能力不断升级固然令人心潮澎湃,更大的想象空间在AI应用环节。生成式AI也入了第二个阶段。大模型赛道的关注重点转向了应用落地,人们发现各个行业和领域的软件应用都值得用AI重做一遍,企业纷纷尝试用AI重构业务。搜索是AI最先重构的赛道之一。最先崭露头角的玩家是一家初创公司Perplexity AI。它在ChatGPT发布之后上线,一年时间用户总查询次数就超50亿次,融资金额也创下了互联网搜索初创公司融资金额新纪录。国内第一个AI爆款妙鸭相机,破圈的速度非常惊人。只需要上传几张生活图片,就能生成精美写真,最小成本一键变美。去年7月开始,朋友圈里一度到处是它的痕迹。不过,这股让线下影楼和海马体等企业瑟瑟发抖的旋风,来去都像一阵风。热潮过后,怎么留住用户?这也是做AI应用的企业都要面对的天问。车企则看到了AI对自动驾驶和座舱交互升级的潜力。小米、小鹏、华为……一众企业都致力于“可见即可说”的交互带上汽车。只需在车内说出自己的需求,基于大模型升级AI很少出现听不懂用户指令的情况,“智障”的AI助手正在离我们而去。还有企业尝到了把AI应用到具体行业场景的甜头。海外的数字营销企业AppLovin因为把AI能力融入到广告投放及用户匹配场景,在过去一年股价快速攀升,今年以来市值增长近八倍。03 AI营销落地元年当下,大模型正在进入全面落地阶段。以内容制作、创意生成、市场分析投放及客户服务为代表等AI营销领域,大模型正率先落地。而高效简单的AI营销工具,也帮助嗅觉灵敏的企业,在竞争中赢得了先机。调味品赛道商家合家美是一个典型的案例。这家企业此前希望能将快手作为新的业务阵地,但又纠结于投入产出问题。这也是广大中小商家普遍的疑虑,一年要投入几十万,要招募培养主播,还有硬件设备、带宽及直播间装修等运营支出,业务能做起来吗?有了AI升级的数字人产品后,情况正快速发生变化。数字人的好处在于,商家可以低成本开播,拿到收益的同时,降低了传统直播间的前期投入风险。另外,现在的数字人在大模型能力的加持下,已经在直播场景里有不错的表现,比如讲话的语调已经非常自然,也能讲解商品信息。今年5月,合家美用上磁力引擎智能化产品里的女娲数字人,成效显著。开播1个月GMV超过10万元。经过几个月摸索,现在这家企业月GMV突破了100万,AI数字人ROI已经达到2~3的水平。

AI编年史可以追溯到多个关键节点,以下是对AI发展历程的详细梳理:

一、基础理论奠基阶段(1940年代-1950年代)

1942年‌:美国科幻小说家艾萨克·阿西莫夫(Isaac Asimov)提出了著名的“机器人三定律”,这为人工智能和机器人技术的发展奠定了哲学基础。

1943年‌:美国神经生理学家沃伦·麦卡洛克(Warren McCulloch)和数学家沃尔特·皮茨(Walter Pitts)提出了M-P模型,为神经网络的研究奠定了基础。

1949年‌:唐纳德·赫布(Donald O. Hebb)描述了突触可塑性的基本原理,对学习和记忆提供了生理学层面的新理解。

1950年‌:阿兰·图灵(Alan Turing)发表了《Computing Machinery and Intelligence》论文,提出了图灵测试,为判断机器是否具有智能提供了一种方法。同年,马文·明斯基(Marvin Minsky)和邓恩·埃德蒙(Dunn Edmund)构建了第一台神经网络计算机SNARC。

二、术语提出与初步研究阶段(1950年代)

1955年‌:约翰·麦卡锡(John McCarthy)、马文·明斯基、克劳德·香农(Claude Shannon)等科学家共同提出了“Artificial Intelligence”一词,标志着人工智能作为一个研究领域正式诞生。同年,赫伯特·西蒙(Herbert A. Simon)和艾伦·纽维尔(Allen Newell)开发了“逻辑理论家”程序,被认为是人类历史上第一个人工智能程序。

1956年‌:达特茅斯会议召开,会议上探讨了用机器模拟人类智能等问题,并首次引入“Artificial Intelligence”一词。此次会议被广泛认为是人工智能学科正式诞生的标志。

三、早期成果与挫折阶段(1950年代-1970年代)

1957年‌:弗兰克·罗森布拉特(Frank Rosenblatt)在IBM-704计算机上模拟实现了“感知机”神经网络模型。同年,赫伯特·西蒙等人推出了通用问题解决器(General Problem Solver, GPS)。

1959年‌:乔治·德沃尔(George Devol)与约瑟夫·英格伯格(Joseph Engelberger)发明了人类首台工业机器人——Unimate。同年,亚瑟·塞缪尔(Arthur Samuel)成功编写了一套具有“学习能力”的西洋跳棋程序,首次提出了“机器学习”的概念。

1960年代‌:由于计算机性能和数据存储能力的限制,AI技术的发展进展缓慢,实际应用效果未达预期,AI进入第一次低谷期。

四、专家系统兴起阶段(1960年代-1980年代)

1968年‌:爱德华·费根鲍姆(Edward Feigenbaum)提出了第一个专家系统——DENDRAL,标志着专家系统的诞生。此后,专家系统在多领域被广泛使用,推动了AI的第二次发展浪潮。

1980年代‌:专家系统性能受到知识获取的限制,且缺乏灵活性与推理能力,AI发展再次陷入低谷。

五、重要突破与基础奠定阶段(1990年代-2010年代)

1997年‌:IBM超级计算机深蓝战胜国际象棋世界冠军卡斯帕罗夫,标志着机器在某种程度上能超越人类智能。

2010年代‌:DeepMind成立,GoogleBrain立项。2012年,Geoffrey Hinton团队开发AlexNet模型,在计算机视觉领域取得重大突破,成为深度学习革命的开端。

六、技术深化与广泛应用阶段(2010年代至今)

2015年‌:OpenAI成立,致力于探索通用人工智能。

2016年‌:AlphaGo战胜围棋世界冠军李世石,成为AI领域的重大里程碑。

2022年‌:OpenAI发布生成式聊天机器人ChatGPT,引发了新一轮AI热潮。

2024年‌:AI技术在多个领域持续突破,包括脑机接口、生成式视频大模型Sora、人形机器人等。

综上所述,AI编年史是一段充满探索、突破与起伏的历史。从基础理论奠基到术语提出与初步研究,再到早期成果与挫折、专家系统兴起、重要突破与基础奠定,以及技术深化与广泛应用,AI技术不断发展壮大,深刻改变了人们的生活和工作方式。

AI编年史 另外一个版本

20 世纪 40-50 年代:起源与奠基

1942 年:美国科幻小说家艾萨克・阿西莫夫在《Runaround》中提出 “机器人三定律”,为人工智能的伦理研究奠定了基础。

1943 年:沃伦・麦卡洛克和沃尔特・皮茨发表论文,提出人工神经网络的初步模型 M-P 模型。

1946 年:世界上第一台电子计算机 ENIAC 在美国宾夕法尼亚大学诞生,标志着人类开始尝试用电子设备模拟人类思维过程。

1950 年:阿兰・图灵发表《计算机器与智能》论文,提出图灵测试;马文・明斯基和邓恩・埃德蒙构建了第一台神经网络计算机 SNARC;克劳德・香农发表《Programming a computer for playing chess》论文,并发明机械老鼠 “忒修斯”。

1955 年:约翰・麦卡锡、马文・明斯基、克劳德・香农、纳撒尼尔・罗切斯特四人共同提出机器智能研究项目,首次引入 “人工智能” 一词;赫伯特・西蒙和艾伦・纽维尔开发出第一个人工智能程序 “逻辑理论家”。

1956 年:达特茅斯会议召开,标志着人工智能作为一个研究领域正式诞生。

20 世纪 60 年代:初步发展

1963 年:约翰・麦卡锡在斯坦福大学创立人工智能实验室。

1965 年:英国数学家厄文・古德发表 “AI 威胁论” 文章;托马斯・卡沃扩展提出 K 最近邻算法。

1966 年:美国麻省理工学院的约瑟夫・魏泽鲍姆发明世界上第一个聊天机器人 ELIZA;美国斯坦福研究所研发成功首台人工智能机器人 Shakey。

1968 年:美国科学家爱德华・费根鲍姆提出第一个专家系统 DENDRAL。

20 世纪 80 年代:机器学习兴起

1981 年:“窄 AI” 的概念诞生。

1986 年:杰弗里・辛顿发明反向传播算法,为深度学习发展注入活力。

20 世纪 90 年代:稳步发展

1997 年:IBM 的 “深蓝” 击败国际象棋世界冠军卡斯帕罗夫,展示了 AI 在复杂决策问题上的潜力。

21 世纪:快速发展与广泛应用

2002 年:iRobot 公司推出全球首款家用自动化扫地机器人。

2005 年:美国军方开始投资自动机器人,波士顿动力的 “机器狗” 是首批产品之一。

2008 年:谷歌在 iPhone 上发布语音识别应用,开启数字化语音助手浪潮。

2011 年:IBM Watson 在 Jeopardy 答题竞赛中战胜人类选手。

2012 年:杰弗里・辛顿团队在 ImageNet 图像识别比赛中展示的深度卷积网络取得巨大成功。

2014 年:伊恩・古德费洛提出生成对抗网络(GAN);聊天机器人 Eugene Goostman 通过图灵测试;谷歌向自动驾驶技术投入重金,Skype 推出实时语音翻译功能。

2024 年:生成式 AI 广泛渗透,如 ChatGPT 成为人们常用工具;谷歌宣布研发出 Willow 超强量子芯片。

AI编年史完整详细版本

1942年,美国科幻小说家艾萨克·阿西莫夫(Isaac Asimov)在自己的短篇小说《Runaround(环舞)》中提出了影响深远的“机器人三定律”:机器人不得伤害人类,或坐视人类受到伤害;除非违背第一定律,否则机器人必须服从人类命令;除非违背第一或第二定律,否则机器人必须保护自己。后来,这篇小说被合入1950年出版的短篇科幻小说集《I,Robot(我,机器人)》中。

1943年,美国神经生理学家沃伦·麦卡洛克(Warren McCulloch)和数学家沃尔特·皮茨(Walter Pitts),基于人类大脑的神经网络,发表了《A logical calculus of ideas immanent in nervous activity(神经活动中内在思想的逻辑演算)》论文,提出了一个形式神经元的计算机模型,并将其取名为M-P(McCulloch&Pitts)模型。

1949年,唐纳德·赫布(Donald O. Hebb)在自己的著作《The Organization of Behavior; a Neuropsychological Theory(行为的组织:一种神经心理学理论)》中,描述了突触可塑性的基本原理,对学习和记忆提供了生理学层面的新理解。赫布也凭此被誉为“神经心理学与神经网络之父”。

1950年,阿兰·图灵在《Mind(心灵)》杂志上发表了重要论文《Computing Machinery and Intelligence(计算机器与智能)》,并提出了著名的图灵测试。

阿兰·图灵

1950年,马文·明斯基(Marvin Minsky)和邓恩·埃德蒙(Dunn Edmund)构建了第一台神经网络计算机SNARC。1950年,克劳德·香农(Claude Shannon)发表论文《Programming a computer for playing chess(为下棋编程计算机)》”。

智星云 AI Galaxy-GPU云服务器_GPU服务器租用_远程GPU租用_深度学习服务器_高性比价便宜GPUwww.ai-galaxy.cn/

香农认为,总有一天,计算机会击败世界冠军。这一年,他还发明了一种由机电继电器电路控制的可以走迷宫的机械老鼠——忒修斯(Theseus)。

克劳德·香农

1954年,Georgetown(乔治敦)大学和IBM合作,进行了一次名为“Georgetown Experiment”的实验,成功地使用机器将60多个俄语句子翻译成英文。这是机器翻译和NLP(自然语言处理)的一次重要尝试。

1955年9月,约翰·麦卡锡(John McCarthy)、马文·明斯基、克劳德·香农、纳撒尼尔·罗切斯特(N. Rochester)四人,共同提出了一个关于机器智能的研究项目。在项目中,首次引入了“Artificial Intelligence”这个词,也就是人工智能。

智星云 AI Galaxy-GPU云服务器_GPU服务器租用_远程GPU租用_深度学习服务器_高性比价便宜GPUwww.ai-galaxy.cn/

1955年,赫伯特·西蒙(Herbert A. Simon,也译为司马贺)和艾伦·纽维尔(Allen Newell)开发的一个名为“逻辑理论家(Logic Theorist)”的程序。“逻辑理论家”被认为是人类历史上第一个人工智能程序。

1956年6月,在约翰·麦卡锡等人的召集下,著名的达特茅斯会议(Dartmouth workshop)在美国新罕布什尔州汉诺威镇的达特茅斯学院召开。这场会议标志着人工智能作为一个研究领域正式诞生。

1957年,美国康奈尔大学的心理学家和计算机科学家弗兰克·罗森布拉特(Frank Rosenblatt),在一台IBM-704计算机上,模拟实现了一种他发明的叫“感知机 (Perceptron) ”的神经网络模型。

弗兰克·罗森布拉特1957年,赫伯特·西蒙等人在“逻辑理论家”的基础上,又推出了通用问题解决器(General Problem Solver,GPS)。这是一个旨在模仿人类解决问题的程序。1957年,卡内基梅隆大学建立了世界上第一个人工智能研究实验室。1958年,约翰·麦卡锡正式发布了自己开发的人工智能编程语言——LISP(LIST PROCESSING,意思是”表处理”)。后来的很多知名AI程序,都是基于LISP开发的。

约翰·麦卡锡(1927-2011)1959年,美国发明家乔治·德沃尔(George Devol)与约瑟夫·英格伯格(Joseph Engelberger)发明了人类首台工业机器人——Unimate。Unimate重达两吨,安装运行于通用汽车生产线,可以控制一个机械臂,搬运和堆叠热压铸金属件。

左图为Unimate右图是约瑟夫·英格伯格(左)、乔治·德沃尔(右)

1959年,赫伯特·格兰特(Herbert Gelernter)开发了几何定理证明程序。

智星云 AI Galaxy-GPU云服务器_GPU服务器租用_远程GPU租用_深度学习服务器_高性比价便宜GPUwww.ai-galaxy.cn/

1959年,IBM科学家亚瑟·塞缪尔(Arthur Samuel)在自家首台商用计算机IBM701上,成功编写了一套西洋跳棋程序。这个程序具有“学习能力”,可以通过对大量棋局的分析,逐渐辨识出“好棋”和“坏棋”,从而提高自己的下棋水平。因为首次提出了“机器学习(Machine Learning)”的概念,亚瑟·塞缪尔被后人誉为“机器学习之父”。

亚瑟·塞缪尔(1901-1990)

1959年,约翰·麦卡锡和马文·明斯基创立了麻省理工学院人工智能项目。

1961年,莱昂纳德·莫里克(Leonard Merrick Uhr)和查尔斯·沃斯勒(Charles M Vossler)发表了题目为《A Pattern Recognition Program That Generates, Evaluates and Adjusts its Own Operators(生成、评估和调整其自身算子的模式识别程序)》的模式识别论文,描述了一种利用机器学习或自组织过程设计的模式识别程序的尝试。1963年,约翰·麦卡锡在斯坦福大学创立了人工智能实验室。

智星云 AI Galaxy-GPU云服务器_GPU服务器租用_远程GPU租用_深度学习服务器_高性比价便宜GPUwww.ai-galaxy.cn/

1965年,英国数学家厄文·古德(Irving John Good)发表了一篇对人工智能未来可能对人类构成威胁的文章,可以算“AI威胁论”的先驱。

1966年,美国麻省理工学院的约瑟夫·魏泽鲍姆(Joseph Weizenbaum),发明了世界上第一个聊天机器人——ELIZA。ELIZA 通过关键词匹配规则对输入进行分解,而后根据分解规则所对应的重组规则来生成回复,是现在Siri、小爱同学等问答交互工具的鼻祖。

魏泽鲍姆(坐者)正在与ELIZA对话

1966年,查理·罗森(Charlie Rosen)领导的美国斯坦福研究所(SRI),研发成功了首台人工智能机器人——Shakey。它具备一定程度的人工智能,能够自主进行感知、环境建模、行为规划并执行任务。

研究人员正在调测Shakey

1966年,美国计算机协会(ACM)设立图灵奖(Turing Award),被称为“计算机界的诺贝尔奖”。1967年,托马斯·卡沃(Thomas Cover)基于艾沃林·菲克斯(Evelyn Fix)和约瑟夫·霍德吉斯(Joseph Hodges)的研究,扩展提出了K最近邻算法(k-nearest neighbors algorithm)。

智星云 AI Galaxy-GPU云服务器_GPU服务器租用_远程GPU租用_深度学习服务器_高性比价便宜GPUwww.ai-galaxy.cn/

1968年,美国科学家爱德华·费根鲍姆(Edward Feigenbaum)提出了第一个专家系统——DENDRAL,并对知识库给出了初步的定义。这标志着专家系统的诞生。DENDRAL面向的是化学行业,可以帮助化学家判断物质的分子结构。

爱德华·费根鲍姆(坐着的那位)

1969年,马文·明斯基和西蒙·派珀特(Seymour Papert)发表著作《感知机: 计算几何学导论》的书,对罗森布莱特的感知器提出了质疑。这导致了神经网络研究十余年的中断。

马文·明斯基

1969年,马文·明斯基为导演斯坦利·库布里克(Stanley Kubrick)的电影《2001漫游太空》担任顾问,塑造了片中超级智能计算机HAL9000的银幕形象。

电影海报

1970年,麻省理工学院博士研究生特里·维诺格拉德(Terry Winograd)开发了早期自然语言理解程序SHRDLU。该程序可以部分理解语言,是”微型世界”项目的一部分。

1972年,柯尔麦伦纳(Colmeraner)及其研究小组在法国马赛大学提出逻辑编程语言PROLOG。

智星云 AI Galaxy-GPU云服务器_GPU服务器租用_远程GPU租用_深度学习服务器_高性比价便宜GPUwww.ai-galaxy.cn/

1972年,美国医生兼科学家爱德华·H·肖特利夫(Edward H. Shortliffe)创建了可以帮助进行医学诊断的专家系统——MYCIN。

爱德华·H·肖特利夫

1973年,政府部门对AI的资助开始大幅滑坡,AI研究进入了“AI寒冬(AI Winter)”。

1973年,数学家莱特希尔(Lighthill)向英国政府提交了一份关于人工智能的研究报告(著名的《莱特希尔报告》),对当时的AI研究进行了严厉且猛烈的批评,认为其宏伟的目标根本无法实现,研究已经彻底失败。

1975年,马文·明斯基在论文《A Framework for Representing Knowledge(知识表示的框架)》中,提出用于人工智能中的知识表示学习框架理论。

智星云 AI Galaxy-GPU云服务器_GPU服务器租用_远程GPU租用_深度学习服务器_高性比价便宜GPUwww.ai-galaxy.cn/

1977年,爱德华·费根鲍姆在第五届国际人工智能联合会议上,提出了“知识工程(Knowledge Engineering)”的概念,进一步推动了专家系统的普及。

1977年,中国著名数学家吴文俊院士在《中国科学》期刊发表了具有划时代意义的科学论文——《初等几何判定问题与机械化证明》,在国际上引起了巨大轰动。吴文俊院士所独创的新方法在国际上被誉为“吴方法”。它能够使人工智能自动并有效地证明几何定理,也被应用到其他数学领域。

吴文俊院士

1979年,美国国家标准技术研究所开始制定基于知识的推理系统规范语言(知识表示语言KRL)。

1979年,日本学者福岛邦彦博士模仿生物的视觉皮层(visual cortex),开发了一种用于模式识别的神经网络模型Neocognitron(神经认知机)。Neocognitron是第一个使用卷积和下采样的神经网络,也是现代卷积神经网络的雏形。

福岛邦彦

1979年,斯坦福大学的汉斯·莫拉韦克(Hans Moravec)设计了斯坦福卡车(Stanford Cart)。这是一台可以自主导航和避障的机器人。这是机器人领域的一个重要里程碑。

1980年,在美国的卡内基梅隆大学(CMU)召开了第一届机器学习国际研讨会,标志着机器学习研究的兴起。

1980年,卡耐基梅隆大学研发的专家系统XCON(eXpertCONfigurer)正式商用,为当时的计算机巨头公司DEC每年省下数千万美金。1981年,理查德·保罗(Richard.P.Paul)出版了第一本机器人学课本《Robot Manipulator:Mathematics,Programmings and Control(机器人机械手:数学、编程与控制)》。

智星云 AI Galaxy-GPU云服务器_GPU服务器租用_远程GPU租用_深度学习服务器_高性比价便宜GPUwww.ai-galaxy.cn/

1981年,日本通商产业省(MITI)拨款8.5亿美元,用以研发第五代计算机项目(FGCS)。FGCS的目标是造出一台人工智能计算机,能够与人对话、翻译语言、解释图像、完成推理。不久后,英国、美国纷纷响应,开始向信息技术领域的研究提供大量资金。

1981年,“窄AI(Narrow AI)”的概念诞生。相关研究不再寻求通用智能,而转向了面向更小范围的专业任务领域。

1982年,约翰·霍普菲尔德(John Hopfield)在自己的论文中重点介绍了Hopfield网络模型(模型原型早期由其他科学家提出)。这是一种具有记忆和优化功能的循环(递归)神经网络。

约翰·霍普菲尔德

1982年,戴维·马尔(David Marr)发表代表作《视觉计算理论》,提出计算机视觉(Computer Vision)的概念,并构建系统的视觉理论,对认知科学(CognitiveScience)产生了很深远的影响。

1983年,通用电气公司搞出了柴油电力机车维修专家系统(DELTA)。这个系统封装了众多GE资深现场服务工程师的知识和经验,能够指导员工进行故障检修和维护。

1983年,特伦斯·谢诺夫斯基(Terrence Sejnowski)和杰弗里·辛顿(Geoffrey Hinton)提出了“隐单元”的概念。1986年,他们提出了一种生成式随机神经网络(generative stochastic neural network)——Boltzmann Machine(玻尔兹曼机)。

智星云 AI Galaxy-GPU云服务器_GPU服务器租用_远程GPU租用_深度学习服务器_高性比价便宜GPUwww.ai-galaxy.cn/

1983年,美国国防部高级研究计划局(DARPA)通过“战略计算促进会(Strategic Computing Initiative)”,重启对高级计算和人工智能研究的资助。

1984年,美国数十家大公司联合成立了微电子与计算机技术公司(MCC)。该公司发起了人工智能历史上最大也是最具争议性的项目Cyc(大百科全书)。

1986年,戴维·鲁梅尔哈特(David Rumelhart)、杰弗里·辛顿(Geoffrey Hinton)和罗纳德·威廉姆斯(Ronald Williams)等人共同发表了一篇名为《Learning representations by back-propagation errors(通过反向传播算法的学习表征)》的论文。在论文中,他们提出了一种适用于多层感知器(MLP)的算法,叫做反向传播算法(Backpropagation,简称BP算法)。BP算法不仅为多层神经网络的发展奠定了基础,也打破了马文·明斯基当年提出的“神经网络具有局限性”魔咒,意义非常重大。

智星云 AI Galaxy-GPU云服务器_GPU服务器租用_远程GPU租用_深度学习服务器_高性比价便宜GPUwww.ai-galaxy.cn/

1986年,澳大利亚计算机科学家罗斯·昆兰(Ross Quinlan)提出ID3决策树算法。

1987年,LISP机器市场在崩溃,AI领域进入了“第二个AI冬天”。

LISP系列主机

1988年:计算机科学家和哲学家犹大·伯尔(Judea Pearl)出版了著作《Probabilistic Reasoning in Intelligent Systems(智能系统中的概率推理)》。伯尔还发明了贝叶斯网络。

1988年,贝尔实验室的法国科学家杨立昆(Yann LeCun)等人,提出了卷积神经网络。这是一种专门用于处理图像数据的神经网络模型。

Yann LeCun

1990年,澳大利亚科学家罗德尼·布鲁克斯(Rodney Brooks)提出了“由下自上”的研究思路,开发能够模拟人脑细胞运作方式的神经网络,并学习新的行为。

1990年,美国认知科学家、心理语言学家杰弗里·艾尔曼(Jeffrey Elman)提出了首个递归神经网络——艾尔曼网络模型。递归神经网络能够在训练时维持数据本身的先后顺序性质,非常适合于自然语言处理领域的应用。

智星云 AI Galaxy-GPU云服务器_GPU服务器租用_远程GPU租用_深度学习服务器_高性比价便宜GPUwww.ai-galaxy.cn/

1992年,因为未能实现十年前提出的目标,日本终止了FGCS项目。

1993年,在花费近10亿美元且远未达到预期的情况下,DARPA结束了战略计算计划。

1995年,克里娜·柯尔特斯(Corinna Cortes)和弗拉基米尔·万普尼克(Vladimir Vapnik)开发了支持向量机(Support Vector Machine,SVM)。支持向量机是一种映射和识别类似数据的系统,可以视为在感知机基础上的改进。

1995年,约阿夫·佛罗因德(Yoav Freund)和罗伯特·沙皮尔(Robert Schapire)提出了AdaBoost (Adaptive Boosting)算法。

智星云 AI Galaxy-GPU云服务器_GPU服务器租用_远程GPU租用_深度学习服务器_高性比价便宜GPUwww.ai-galaxy.cn/

1997年5月,IBM的计算机“深蓝(DEEP BLUE)”以2胜1负3平的成绩击败国际象棋世界冠军加里·卡斯帕罗夫,震惊了全世界。

1997年,德国计算机科学家瑟普·霍克赖特(Sepp Hochreiter)及其导师于尔根·施密德胡伯(Jürgen Schmidhuber)开发了用于递归神经网络的LSTM(长短期记忆网络)。

1998年,Yann LeCun等人提出了一个用于手写数字识别的卷积神经网络——LeNet,初步展示了神经网络在图像识别领域的潜力。2000年:本田发布了ASIMO,一种人工智能的人形机器人。

2001年,布雷曼(Leo Breiman)和阿黛尔·卡特勒(Adele Cutler)提出随机森林(Random Forest)。

2003年,约书亚·班吉欧(Yoshua Bengio)发表一篇基于人工神经网络打造自然语言模型的论文《A Neural Probabilistic Language Model(一种神经概率语言模型)》,提出了具有奠基意义的NNLM“神经网络语言模型”。他还提出了”词向量”的概念。

智星云 AI Galaxy-GPU云服务器_GPU服务器租用_远程GPU租用_深度学习服务器_高性比价便宜GPUwww.ai-galaxy.cn/

2006年,多伦多大学的杰弗里·辛顿在Science期刊上,发表了重要的论文《Reducing the dimensionality of data with neural networks(用神经网络降低数据维数)》,提出深度信念网络(Deep Belief Networks,DBNs)。

杰弗里·辛顿

2006年,在斯坦福任教的华裔科学家李飞飞发起创建了ImageNet项目,号召民众上传图像并标注图像内容。

2009年,ImageNet正式发布,包括了1400万张图片数据,超过2万个类别,为全球AI研究(神经网络训练)提供了强大支持。

李飞飞和ImageNet

2006年,谷歌公司推出了一种基于统计学习的语音识别技术,该技术被广泛应用于语音助手、智能家居等领域。

智星云 AI Galaxy-GPU云服务器_GPU服务器租用_远程GPU租用_深度学习服务器_高性比价便宜GPUwww.ai-galaxy.cn/

2008年,谷歌在iPhone上发布了一款语音识别应用,开启了数字化语音助手(Siri、Alexa、Cortana)的浪潮。

2011年10月,苹果推出语音助手Siri。

2011年,IBM的计算机沃森(Watson)在美国电视智力竞赛节目“危险边缘”中,击败两位人类冠军选手,展示出其在自然语言处理和知识推理方面的强大能力。

2012年,杰弗里·辛顿和他的学生伊利亚·苏茨克沃(Ilya Sutskever)和亚历克斯·克里切夫斯基(Alex Krizhevsky)参加了ImageNet大规模视觉识别挑战赛。他们设计的深度神经网络模型AlexNet在这次竞赛中以压倒性优势获得第一名,引起了业界轰动。

杰弗里·辛顿师徒三人

2012年,加拿大神经学家团队创造了一个具备简单认知能力、有250万个模拟“神经元”的虚拟大脑Spaun,通过了最基本的智商测试。

智星云 AI Galaxy-GPU云服务器_GPU服务器租用_远程GPU租用_深度学习服务器_高性比价便宜GPUwww.ai-galaxy.cn/

2012年,谷歌“Google Brain”项目的研究人员吴恩达(Andrew Ng)、杰夫·迪恩(Jeff Dean)等人,搭建了一个神经网络(10亿参数),用来训练对猫的识别。他们的训练数据是来自youtube的1000万个猫脸图片,用了1.6万个CPU,整整训练了3天。

吴恩达

2012年7月,谷歌公司推出虚拟助手GoogleNow,即谷歌助手的前身。2012年,谷歌公司正式发布谷歌知识图谱Google Knowledge Graph。

2013年,辛顿师徒三人共同成立了一家名为DNNresearch的公司。后来,这家公司被谷歌以几千万美元的价格竞购。

智星云 AI Galaxy-GPU云服务器_GPU服务器租用_远程GPU租用_深度学习服务器_高性比价便宜GPUwww.ai-galaxy.cn/

2013年,谷歌公司的托马斯·米科洛夫(Tomas Mikolov)带领研究团队发表了论文《Efficient Estimation of Word Representations inVector Space(词表示向量空间的有效估计)》,提出了Word2Vec。Word2Vec基于给定的语料库,通过优化后的训练模型,可以快速有效地将一个词语表达成高维空间里的词向量形式,为自然语言处理领域的应用研究提供了新的工具。

2014年,谷歌公司收购了专注于深度学习和强化学习技术的人工智能公司——DeepMind公司。

2014年6月,一台名为Eugene Goostman(尤金·古斯特曼)的聊天机器人通过了图灵测试。

智星云 AI Galaxy-GPU云服务器_GPU服务器租用_远程GPU租用_深度学习服务器_高性比价便宜GPUwww.ai-galaxy.cn/

2014年,蒙特利尔大学博士生伊恩· 古德费洛(Ian Goodfellow),从博弈论中的“二人零和博弈”得到启发,提出了生成对抗网络(GANs,Generative Adversarial Networks)。

伊恩· 古德费洛

2015年,Microsoft Research的何恺明(Kaiming He)等人提出的残差网络(ResNet),在ImageNet大规模视觉识别竞赛中,获得了图像分类和物体识别的优胜。

2015年1月,埃隆·马斯克、斯蒂芬·霍金和史蒂夫·沃兹尼亚克等人在一封公开信上签名,要求禁止开发人工智能武器。2015年11月,谷歌公司开源了重要的深度学习框架Tensor Flow。

智星云 AI Galaxy-GPU云服务器_GPU服务器租用_远程GPU租用_深度学习服务器_高性比价便宜GPUwww.ai-galaxy.cn/

2015年12月,埃隆·马斯克(Elon Musk)、萨姆·奥尔特曼(Sam Altman)、彼得·泰尔(Peter Thiel)、里德·霍夫曼(Reid Hoffman)等人在旧金山联合成立了OpenAI公司。

2016年,谷歌提出联邦学习方法,它在多个持有本地数据样本的分散式边缘设备或服务器上训练算法,而不交换其数据样本。

2016年3月,DeepMind开发的人工智能围棋程序AlphaGo(阿尔法狗),以4:1的总比分战胜了世界围棋冠军李世石,震惊了全世界。

2016年2月,中国香港的汉森机器人公司(Hanson Robotics)推出了一款名为索菲亚(Sophia)的仿人机器人。它能通过图像识别“看”东西,做出面部表情,并能使用人工智能进行交流。

2016年,微软公司推出了小冰(Xiaoice)。这是一款利用自然语言处理和情感计算技术提供社交聊天服务的人工智能系统。

智星云 AI Galaxy-GPU云服务器_GPU服务器租用_远程GPU租用_深度学习服务器_高性比价便宜GPUwww.ai-galaxy.cn/

2017年1月,Facebook人工智能研究院开源了PyTorch。这是一个用于机器学习和深度学习的开源深度学习框架。

2017年5月,升级版的AlphaGo以3:0战胜世界排名第一的中国围棋棋手柯洁。

2017年10月18日,DeepMind团队公布AlphaGo Zero。从空白状态学起,只需3天就以100:0的战绩击败曾战胜柯洁的AlphaGo系统。

2017年12月,Google机器翻译团队在行业顶级会议NIPS上,发表了重磅论文《Attention is all you need(你所需要的,就是注意力)》,提出只使用“自我注意力(Self Attention)”机制来训练自然语言模型——Transformer(转换器、变压器)。Transformer彻底改变了深度学习的发展方向。它不仅对序列到序列任务、机器翻译和其它自然语言处理任务产生了深远的影响,也为后来AIGC的崛起打下了坚实的基础。

智星云 AI Galaxy-GPU云服务器_GPU服务器租用_远程GPU租用_深度学习服务器_高性比价便宜GPUwww.ai-galaxy.cn/

2018年5月,谷歌推出Google Duplex服务,允许人工智能助手通过电话预约。2018年6月,OpenAI发布了第一版的GPT系列模型——GPT-1。同时,他们还发表了论文《Improving Language Understanding by Generative Pre-training(通过生成式预训练改进语言理解)》。

2019年和2020年,OpenAI接连发布了GPT-2和GPT-3。2018年10月,谷歌发布了有3亿参数的BERT(Bidirectional Encoder Representation from Transformers)模型,意思是“来自Transformers的双向编码表示”模型。

2019年,DeepMind公司开发了阿尔法星际争霸(AlphaStar),这是一台专门用于玩星际争霸2游戏的人工智能系统。

2019年3月份,OpenAI正式宣布重组,成为一家”利润上限(caped-profit)”的公司。

7月,重组后的OpenAI拿到了微软包括Azure云计算资源在内的10亿美金投资。微软将作为”首选合作伙伴”,今后可获得OpenAI技术成果的独家授权。

2020年2月,微软推出Turind Natural Language Generatio(T-NLG),这是一种生成式语言模型,是当时最大的语言模型。

智星云 AI Galaxy-GPU云服务器_GPU服务器租用_远程GPU租用_深度学习服务器_高性比价便宜GPUwww.ai-galaxy.cn/

2020年6月,OpenAl发布了GPT-3语言模型。该模型通过预先训练的算法生成文本,并完成人类几乎无法完成的语言任务。随后,OpenAI发表了论文《Language Models are Few-Shot Learner》,阐述了大模型的各种新能力,而最重要的就是小样本(few-shot)学习能力。

2020年6月,论文《Denoising Diffusion Probabilistic Models(去噪扩散概率模型,DDPM)》发表。这篇论文第一次把2015年诞生的Diffusion”扩散模型”用在了图像生成上。不久之后,DDPM以及后续的Diffusion扩散模型就全面取代了GAN(生成式对抗网络),成为了AI绘画大模型的主流技术。

2020年11月30日,DeepMind公司宣布其研制的人工智能系统AlphaFold2可以精准预测蛋白质的3D结构,即解决了“蛋白质折叠”问题,被认为是解决了生物领域50年来的重要难题,是人工智能的又一次巨大成功。

2021年1月,OpenAl发布了可从文本生成图像的人工智能模型DALL-E。2021年1月11日,谷歌公司发表论文《Switch Transformers:Scaling to Trillion Parameter Models with Simple and Efficient Sparsity》,提出了最新语言模型—Switch Transformer。这个模型以高达1.6万亿的参数量,成为历史上首个万亿级语言模型。

2021年2月,Open AI开源了新的深度学习模型CLIP(Contrastive Language-Image Pre-Training)。同时,OpenAI还发布了自己基于CLIP的AI绘画DALL-E 模型。

2021年6月30日,OpenAI和GitHub联合发布了AI代码补全工具GitHub Copilot。Copilot的AI技术核心正是OpenAI的新模型CodeX(随后的8月份也对外发布了)。

2021年5月,谷歌公司引入了Language Model for Dialoque Applications(LaMDA)。这是一个大型语言模型,用于在对话中生成类似人类的反应。

2021年10月,第一个开源的AI绘画大模型Disco-Diffusion诞生。2022年3月,OpenAI发布InstructGPT,同时发表论文《Training language models to follow instructions with human feedback(训练语言模型以遵循带有人类反馈的指令)》。

2022年3月,AI绘画工具Midjourney问世,创始人是David Holz(戴维·霍尔兹)。2022年4月,OpenAI发布了AI绘画大模型DALL-E 2。2022年7月,DeepMind破解了几乎所有已知的蛋白质结构,其AlphaFold算法数据库里包含了2亿种已知蛋白质结构。

智星云 AI Galaxy-GPU云服务器_GPU服务器租用_远程GPU租用_深度学习服务器_高性比价便宜GPUwww.ai-galaxy.cn/

2022年8月,Stability AI开源了Stable Diffusion绘画大模型的源代码。这是一款基于文本描述生成图像的文本到图像工具。

2022年11月,OpenAI发布了基于GPT模型的人工智能对话应用服务——ChatGPT(也可以理解为GPT-3.5),彻底引爆了全世界。

2023年1月,微软宣布对OpenAl进行多年期巨额投资,数十亿美元。2023年2月7日,谷歌公司发布了由LaMDA提供支持的聊天机器人Bard。2023年2月25日,Meta公司发布LLaMA模型并开源。7月19日,Meta公司发布了人工智能模型LLaMA 2的开源商用版本。2023年3月15日,OpenAI发布了GPT-4。

2023年3月16日,百度发布文心一言。2023年5月11日,谷歌正式开放超级AI大模型PaLM2。2023年6月,英伟达市值突破1万亿美元。美股“七巨头”(Magnificent 7,分别是:谷歌母公司Alphabet、亚马逊、苹果、Meta、微软、英伟达和特斯拉)的股价开始不断攀升。

2023年11月,首份人工智能监管声明《布莱切利宣言》发布。2023年11月18日,OpenAI CEO山姆·奥特曼(Sam Altman)被开除,引发全网关注。22日,OpenAI官方推特宣布,Sam Altman回归并重新担任OpenAI CEO。

2023年12月6日,谷歌公司发布多模态大模型Gemini 1.0(双子星)。

2024年2月15日,OpenAI发布人工智能文生视频大模型Sora。

2024年5月14日,OpenAI举行春季发布会,推出新旗舰模型GPT-4o。

2024年7月23日,Meta发布LLAMA 3.1 405B开源人工智能模型。

本篇文章转发自知乎:智星云算力平台 视频来源抖音秋芝2046

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注