文章主题:自然语言处理, 人工智能模型, 智谱AI, ChatGLM3

666AI工具大全,助力做AI时代先行者!

1699723038447.jpg

(图片来源:unsplash)

钛媒体App获悉,10月27日下午举行的中国计算机大会(CNCC2023)一场论坛上,阿里、腾讯投资的人工智能(AI)独角兽公司智谱 AI 正式发布全新自研的第三代基座大模型ChatGLM3系列。

新版本的ChatGLM3包含ChatGLM3-1.5B(15亿)、3B和6B参数三种形式,其表现不仅在于多模态理解、代码模块、网络搜索等方面的小幅提升,更显著的是推理速度相对于最佳开源模型的提升幅度达到了2-3倍。此外,通过集成自研的AgentTuning技术,ChatGLM3在智能规划和执行方面的性能比ChatGLM-2提升了1000%。值得一提的是,ChatGLM3还借助了华为昇腾生态的优势,使得算力推理速度实现了3倍以上的提升。

智谱AI的CEO张鹏阐述,他们研发的最新模型ChatGLM3旨在提升跨模态能力,针对的是GPT-4V(即多模态版本的GPT-4)。这一技术升级代表了ChatGLM系列的全新进化。

“对标OpenAI是智谱 AI 成立以来的目标。智谱 AI 致力于让机器像人一样思考,我们希望利用ChatGLM3通用基座模型能力,与合作伙伴一起共同的支撑千行百业,进入生成式 AI‘第二阶段’。”张鹏称。

1699723039361.jpg

据悉,智谱 AI 成立于2019年,脱胎于清华大学计算机系知识工程研究室团队,是清华大学知识成果转化的创业公司,瞄准 AI 大模型研发落地,公司CEO张鹏毕业于清华计算机系,总裁王绍兰为清华创新领军博士,清华大学计算系教授唐杰也参与研发中国最大规模预训练模型悟道2.0。

在2020年,智谱AI开启了对GLM预训练架构的探索与研发,并成功训练出了拥有100亿参数的GLM-10B模型;进入2021年,通过运用MoE架构,智谱AI成功地训练出了万亿稀疏模型;而在2022年,智谱AI进一步公布了一款具备1300亿级参数的超大规模预训练通用模型GLM-130B,基于此,智谱AI构建了大模型平台以及丰富的产品矩阵。

在2023年,我国的人工智能领军企业智谱AI推出了一款具有千亿参数规模的基础座对话模型ChatGLM,并且还公开了单卡版模型ChatGLM-6B。这些先进技术已经得到了广泛的应用,覆盖了个人开发者和企业应用领域。紧接着在今年的6月份,智谱AI再次升级了ChatGLM模型系列,其中包括了6B、130B、12B(120亿参数)、32B、66B等不同规模的模型,其推理速度相较于上一代产品提升了42%。据智谱AI的相关负责人张鹏透露,ChatGLM2-12B、32B和66B模型的性能,相较于GPT-4版本的ChatGPT有了显著的提升。具体来说,ChatGLM2-12B模型的性能提升了16%,ChatGLM2-32B模型的性能提升了36%,而ChatGLM2-66B模型的性能更是达到了280%的增长。这些数据充分展示了智谱AI在人工智能领域的技术实力和创新能力。

目前,智谱 AI 的开源模型在全球范围内已经获得了超过1000次的下载。除此之外,该公司也在积极尝试商业化的发展,致力于开发和生产 AIGC(生成式AI)模型和相关产品系列。其中,智谱清言和高效率代码模型 CodeGeeX 已经成功获得批准并投入使用。

融资方面,创立至今的四年多,智谱AI 共完成四轮融资。10月20日,智谱 AI 宣布年内累计融资额超过25亿元人民币,投资方包括社保基金中关村自主创新基金(君联资本为基金管理人)、美团、蚂蚁、阿里、腾讯、小米、金山、顺为、Boss直聘、好未来、红杉、高瓴等多家机构,而君联资本等部分老股东跟投,华兴资本担任独家财务顾问。

截至目前,智谱 AI 公司估值已超过100亿元,是国内 AI 领域独角兽企业。公司称,上述融资将用于基座大模型的进一步研发,更好地支撑行业生态。

1699723039634.jpg

此次,智谱 AI 发布的最新ChatGLM3通用基座大模型,在性能、推理、算力、Agent智能体能力、API商业化等方面均有提升。

在性能层面上,ChatGLM3-6B在中英双语的44个公开数据集测试中,展示出了我国同等规模模型的优势,位居首位。相较于ChatGLM2-6B,它在多个排名中提升了33%以上,GSM8K基准更是取得了179%的提升。而在推理效率上,ChatGLM3-6B的表现同样卓越,其与当前由伯克利大学开源的vLLM相比,速度快了2-3倍,同时推理成本也降低了一半。

新模型采用了自研的AgentTuning技术,有效提升了模型的智能体能力,使其在智能规划和执行方面超越了ChatGLM2。该模型能够支持多种复杂的场景,包括工具调用、代码执行、游戏、数据库操作、知识图谱搜索与推理以及操作系统等,表现出了极高的适应性。据最新的AgentBench基准测试显示,ChatGLM3-turbo和GPT-3.5在某些方面的表现已经非常接近。而在我国自身的算力平台上,例如昇腾生态,ChatGLM3推理速度更是提升了3倍,展现出了强大的性能优势。

在模型尺寸方面,ChatGLM系列首次引入了1.5B、3B等小型参数模型,这是为了在满足用户需求和降低算力成本之间达到平衡。其中,ChatGLM3-1.5B这款边缘侧模型可以支持国产芯片,并且可以在笔记本电脑、手机、汽车等不同场景中进行部署。它的速度可以达到每秒20个令牌,同时在精度上,1.5B和3B模型的表现与ChatGLM2-6B模型相差无几。

现场演示中,对标ChatGPT、基于ChatGLM3的 AI 聊天机器人平台“智谱清言”,如今不仅可以实现表格生成柱状图、折线图,而且还可以获得实时新闻搜索数据、看蔬菜写菜谱以及代码生成函数等能力。

然而,钛媒体App也发现,在比如“用代码画心形”这类问题上,智谱清言仍存在一定的输出错误等幻觉问题。

另外,在To B企业端方面,智谱AI 提供的 API 开放平台支持开放模型、专属模型、本地化私有模型部署方案,帮助企业去构建自主可控大模型。同时,ChatGLM3 开发平台从三种量级整合为ChatGLM3-turbo,只提供一个标准 API模型方案,整体价格降低50%。

“这(ChatGLM3模型价格)达到国内最低,甚至在全世界范围之内大模型 API 售价最低的水平线。”张鹏表示。

1699723040315.jpg

据钛媒体App了解,目前智谱 AI 公司主要销售三类技术产品:数字人SaaS/PaaS方案,科技情报SaaS/PaaS方案,以及包括ChatGLM系列在内的认知大模型PaaS/MaaS平台方案。

张鹏透露,目前智谱 AI GLM大模型已经应用于政务、金融、能源、制造、医疗等领域,支持华为昇腾、神威超算、海光DCU等10余种国产硬件生态,合作伙伴包括阿里、腾讯云、火山引擎、华为、美团、微软、OPPO、海天瑞声等数十家公司。

(本文首发钛媒体App,作者|林志佳)

举报/反馈

自然语言处理, 人工智能模型, 智谱AI, ChatGLM3

aigc666aigc999_0.jpg

AI时代,拥有个人微信机器人AI助手!AI时代不落人后!

免费ChatGPT问答,办公、写作、生活好得力助手!

搜索微信号aigc666aigc999或上边扫码,即可拥有个人AI助手!

Leave a Reply

Your email address will not be published. Required fields are marked *