文章主题:阿里云, CTO, 周靖人, 通义千问

666AI工具大全,助力做AI时代先行者!

4月7日,阿里云公开“阿里版GPT”通义千问邀测入口引发关注。4月11日,阿里云智能CTO周靖人在北京云峰会现场宣布,将开放通义千问的能力,帮助每家企业打造自己的专属大模型。未来阿里所有产品也将接入通义千问进行全面改造。

阿里云CTO周靖人。

我很荣幸地向大家推荐通义模型家族的最新成员——通义千问。通义千问是一款超大型语言模型,具备处理人类指令的能力,并能与人类进行多轮对话。此外,该模型还整合了多模态知识理解能力,并能与其他外部增强型API进行互联互通。这些特点使得通义千问成为一款非常先进的人工智能助手。

在周靖人的现场演示中,展示了通义千问的多项能力,其中包括出色的多轮对话能力以及文案创作能力,涉及小说续写、邮件编写、企业策划等多个领域。此外,它还拥有强大的多语言处理和多模态交互能力。然而,值得注意的是,目前开放的邀请测试入口仅针对文字对话能力进行了开放。

据报道,钉钉和天猫精灵已率先接受测试,并在经过评估认证后推出了全新功能。钉钉的演示显示,该功能类似于微软的Copilot“副驾驶”,允许用户随时随地在钉钉上唤醒AI助手。在钉钉文档中,通义千问能够创作诗歌、小说、撰写邮件以及制定营销策划方案等,全方位地协助办公。在钉钉会议上,通义千问还能实时生成会议记录,并自动总结会议纪要,生成待办事项。除此之外,钉钉还展示了一项拍照生成小程序的场景,只需上传一张功能草图,无需编写任何代码,就能立即生成订餐轻应用。

通义千问具备多轮对话能力、文案创作能力。

天猫精灵官方预告的演示Demo表明,新接入通义千问系统后的天猫精灵,实现了真正的自由对话交互。用户不再局限于被动接收信息,而是可以随时打断、切换话题,甚至根据自身需求和场景,动态生成内容。例如,当用户在跑步时,可以要求天猫精灵 “合成1小时歌单,50%穿插摇滚风格的歌曲”,或者与天猫精灵就文化、人生展开深入探讨。新天猫精灵不仅可以轻松回答小朋友的各类难题,更可以与用户共同创作出全新的”宇宙大爆炸”故事。

发布会后,阿里云智能CTO周靖人接受南都采访时表示,阿里体系内产品何时完成AI化升级改造并未有时间表,目前还有很多探索性的工作,“在智能化时代,如何利用好这些模型,能够把它结合在自己的业务体系里面,这是大家所面临的同样的机遇。”

关于通义千问与OpenAI旗下ChatGPT之间的能力差异,周靖人毫不掩饰地表示:“ChatGPT在各个领域均保持着优势,这是科技发展的必然结果。目前,我们都在努力追求进步,互相竞争。在这个阶段,ChatGPT的技术领先地位尤为明显,我们需要持续跟进并努力弥补自身的不足。期待在未来阶段,通义千问也能为技术创新贡献自己的力量。”

周靖人接受包括南都

在内的媒体采访摘要

记者:目前阿里大模型的整体规划是怎么样的,未来有什么目标?

周靖人:阿里算是中国最早投入大模型研究的公司之一,我们从2019年开始,就在做各种各样预训练大模型的研发,一直以来,我们认为大模型正在从多模态、自然语言、视觉等各个方面逐渐逼近于人的智慧,能够把我们的相关知识体系、推理能力逐渐融合在一起。

今天发布的通义千问其实是我们在这条既定技术路线上面的产品,也是向大家展示我们过去几年的工作,但这并不代表我们最终的技术成果,因为我们还在不断地探索,包括阅读、自然语言、视觉、语音等方方面面都是我们持续创新和突破的方向。

记者:阿里所有的APP接入通义千问有没有时间表,进度有多快?

周靖人:我们目前没有一个时间表,我觉得今天这部分的工作,也有一定的探索性的元素在里面,如何能够使用好这个模型,其实就像CEO张勇讲的,今天包括阿里在内的所有企业,都是在同一起跑线上。这并不是一蹴而就的,如何能够把模型的能力真正发挥出来,能够结合在自己的业务体系里面来,需要业务系统的创新。

今天,通义千问为大家展示了一种技术能力,然而要将这种能力转化为具体的业务应用,仍需大家共同努力与探索。只有通过携手合作,我们才能充分发挥千问模型所具有的潜力。

记者:在您自己的评估中,通义千问跟ChatGPT对比,水平如何?

周靖人:坦诚讲GPT在各个方面都是处于一个领先地位,这是科技进步的一个必然阶段,今天大家是你追我赶,在这个阶段,它的很多技术比较领先,这是我们需要去补偿的,需要不断弥补我们一系列的不足,希望下个阶段,千问也能够贡献自己的一系列技术的创新。

尽管千问项目并非专为应对ChatGPT而设立,但在大模型研究领域,我们始终遵循着自身的发展策略。过去,我们涉猎了多模态、视觉以及自然语言等多个领域,不断拓展知识边界。如今,千问项目仅是我们探索预训练大模型领域的某个截面或环节,而非最终形态。

我深信,ChatGPT的问世具有重大意义,其中之一便是充分挖掘语言模型的巨大潜力。如今,这一潜力仍有大量空间等待开发,同时开放着无数令人憧憬的应用场景。因此,我们热切期待与大家一起继续探索和创新,不仅包括技术的创新,更涉及业务体系的创新。

记者:怎么样做到把模型的训练和运行成本降到1/10或者1/100?

周靖人:这有很多的技术细节。比如模型训练,涉及到如何有效地把所有的资源用起来,也许你可能用到了几千张卡,如果某一个时间点只有几百张卡在跑,其他的卡都闲置掉,其实在无形之中没有有效的把资源应用起来。具体一点,包括分布计算的执行图,怎么做动态的优化,怎么避免网络的拥塞等等,都是非常细致的工作,才能真正把训练一个模型的效率提升。甚至今天用更少的计算资源,能解决更大规模的模型训练的问题。

模型在服务这部分也是类似的情况,包括如何做到模型的压缩,模型的裁减,模型知识的蒸馏等,如当我们进入到一个专属模型,真正在部署的时候,如何对专属模型进行进一步成本的降低,能够有效的把真正解决行业问题所需要的那部分智能保留,把其他部分的智能能够节省下来,这中间有非常多的技术的创新和技术的突破,这正是阿里云在这方面比较有优势的地方。

记者:为企业定制的专属大模型和现在的通用大模型有何不同?

周靖人:通义千问是一个通用大模型,并不是为某一个业务问题去优化或者定制的,更多是从整个知识体系方面做的一系列融合。应用到实际场景中,每个企业有自己特殊的需求,有很多行业知识和经验,把这些知识体系,也融入到大模型里面来,这是今天我们企业专属大模型要解决的一个问题。

背后的实现路径之一是,我们会为企业提供一个专门的数据空间,企业能够把它相关的信息放入到这样一个数据空间,这个数据空间是完完全全隔离、安全的,也是专属的。企业在把相关信息注入到数据空间的时候,不需要做任何的数据预处理,不管是PPT的方式还是PDF方式,还是Word的方式,甚至以前一些手册、图片、视频的方式,都可以授权到今天的数据空间里面来。我们会提供一键式生成大模型的能力,在企业的授权下去理解相关企业的各种模态的数据,有效地跟通义千问结合在一起,让千问能够深刻了解企业所处的行业,吸取行业知识,帮助解决行业特定问题。

另外一种方式是通过API的方式,把模型的能力释放出来,我们需要更多的开发者,让开发者通过API,通过SDK把模型的能力、模型的应用场景拓宽,能从而产生更大的业务价值。

采写:南都记者 马宁宁

AI时代,拥有个人微信机器人AI助手!AI时代不落人后!

免费ChatGPT问答,办公、写作、生活好得力助手!

搜索微信号aigc666aigc999或上边扫码,即可拥有个人AI助手!

发表回复

您的电子邮箱地址不会被公开。 必填项已用 * 标注