《通义千问：揭秘阿里巴巴全新大语言模型》

文章主题：通义千问, 阿里巴巴, 大语言模型, 人工智能

对话访谈人：王兆洋骆轶航

对话受访人：周靖人

对话整理人：李晓贤

4月7日，阿里巴巴旗下大语言模型——“通义千问”开启邀测。

阿里巴巴达摩院对于其研发的大语言模型“通义千问”的命名方式进行了阐述。他们表示，“千问”这个词语代表了这款模型能够处理大量的提问，而这些问题的背后蕴含着无尽的知识和智慧。只有真正理解并热爱这个领域的人，才能够提出如此深刻的问题。同时，他们也认为AI与人类一样，都具有无尽的交互热情，愿意接受并处理万千交互。

在体验了邀请码对大型模型的强大功能之后，我们有幸与该技术背后的负责人，阿里云智能 CTO 周靖人进行了一次独家的交流，并提出了我们的 “千问”。这次对话为我们提供了更深入的了解 of the technology and its capabilities.

以下为对话实录：

“通义千问”不是起点也不是终点，而是既定路线上的一个节点

在本文中，我们将探讨通义千问这款产品的品玩体验。尽管我们已经对其进行了多次评估，但它仍给我们留下了深刻的印象。此外，我们在网络上发现了一些关于通义千问的各类测试，这让我们更加好奇，你们是如何测试这款产品以及评价其性能的呢？首先，通义千问的多功能特性令人赞叹不已。我们不禁想了解，你们是如何针对这些功能进行测试的？在测试过程中，有哪些方面是你们关注的重点？同时，我们也想了解，你们是如何确保这些功能在不同场景下的稳定性和可靠性的？其次，通义千问的学习能力也让人印象深刻。我们很好奇，你们是如何设计和实现这种学习能力的？在实际应用中，这款产品是否能够根据用户的需求和反馈进行自适应调整？又是如何保持其在面对大量新数据和新任务时的学习效果？再者，通义千问的用户界面和交互设计也是我们关注的焦点。在品玩过程中，我们注意到这款产品的设计风格简洁大方，易于上手。那么，你们是如何在如此短的时间内构建出如此优秀的用户界面和交互设计的呢？在设计过程中，有哪些原则和理念是被你们所坚持的？最后，我们还想了解通义千问在数据安全和隐私保护方面的表现。在当前信息时代，数据安全和隐私保护变得越来越重要。我们很想知道，通义千问在这方面是如何保证用户数据的保密性和完整性的？在开发过程中，你们是如何遵循相关法律法规和标准的？总之，我们对通义千问的品玩体验充满了好奇。通过深入了解你们是如何测试和评价这款产品的，我们可以更好地了解通义千问的优缺点，并为未来的发展提供有价值的参考。

周靖人表示，要全面评估一个大模型是非常具有挑战性的。目前，整个行业尚无统一的标准。同时，个人的评价也具有一定的主观性。

在某些情况下，模型的表现取决于其 ability to解读与应对用户的不同回应。它会根据你的反应持续优化自己的沟通方式，以便更好地理解你的喜好。这种自我调整的过程实际上体现了模型在理解和适应方面的强大能力。

我们将进行一系列 comprehensive evaluations, encompassing a diverse range of assessments. These tests will include creative writing exercises, copywriting assignments, basic problem-solving tasks, and even simple mathematical computations. Moreover, we will introduce multimodal extensions to our evaluations, as well as knowledge-enhancing assessments.

在我们的内部，目前使用的是一种测试集。然而，未来我们计划逐步改变这种模式，让评价一个模型的任务不再由人类完成，而是由模型自身来进行评估。我们坚信，总有一天我们会达到这个目标。

品玩：那么如果对标ChatGPT，通义千问现在是什么水平？

周靖人：我们要承认ChatGPT尤其是GPT4目前还是非常领先的。我觉得这是一个正常的过程。

然而，若要直接对其进行比较，这实际上具有很大的难度。我们应该更加关注如何使我们的模型克服自身的局限性，并在更多的场景中展现出其独特的优势。当前，所有模型都还无法真正地模拟人类智慧体的程度。

品玩：阿里并不是因为ChatGPT的出现才开始密集投入大模型的，之前也展示过很多模型研究的进展，那“通义千问”在阿里的大模型研究历程里是什么位置？

周靖人：这个模型是我们的一个中间态。

今天我们在不断探索基于多模态的大模型的路径上，或者说接近于多模态真正的趋近人类智慧体的路径上的一个节点。它不是起点也不是终点，是个既定路线上的节点。我们这次是把过去积累的一部分工作向社会，向开发者开放，但我们在这方面还有长足的工作，需要进一步地去突破去创新。

品玩：尽管你强调多模态，但我们注意到这一次并没有提供文生图的功能。

周靖人：对，很多公司在做文生图，其实达摩院也有相关的一系列工作发表了，像我们的Composer模型等，不光能够做文生图，还可以根据你的一些详细指令去修改这个图。所以给通义千问接入文生图并不是最难的，它更多是一个工程上的问题。

我们其实认为，今天更难的是把各个模态的模型能力融入进一个模型，比如怎么把视觉的能力融入到语言模型里面。因为一个人获取知识的方式有视觉、语言、听觉等，不会把它们用独立的形态分割开来，在人脑里它都是一个可贯通的知识体，能够把不同形式的输入有机的联合在一起。今后的多模态必然能够做到，不管是任何一个模态来的信息，你的知识体系或者接受到的信号都能够在一个高维的空间里有机融合在一起。

我觉得这个是必然会发生的。这个也是接下来GPT4或5一定会有突破的地方，我们也在这方面有不少的投入，也是我们认准的一个重要方向。

品玩：也就是说阿里的大模型路线，是多模态的一张蓝图绘到底，而这些都是计划的一部分。

周靖人：我们从2019年就开始尝试各种各样的大模型，从StructBERT到M6，再到PLUG再到最新的Composer等一系列视觉模型，其实本质都是在预训练大模型的整体思路上不断进行探索，不断创新。

我认为今天大模型其实在不断地逼近我们人的智慧。人的智慧很重要的一点就来自于语言，LLM（large language model ）开始能根据自然语言理解有效地提取人类大量的知识体系，在这方面是非常独特的。

今天我们看到类似ChatGPT，类似通义千问所表现出来的一些能力，其实都是在这条道路上。所以对我们行业内的人来讲，我们并不认为这条道路好像就是2023年突然出现。我们认为这是一个长期以来技术发展的演进过程。甚至我们认为今天看到的所谓大模型的能力也都是冰山一角，今后还会有整体更惊人的一系列表现。

我认为ChatGPT的推出，更重要的是教育了整个社会。上一次半年前我们聊到大模型的时候，可能连科技界部分工作者都还不看好这条路线。今天 ChatGPT 基于 Chat 这样一个产品的形态做得非常出色，把相关的能力有效地表达出来了，不光是对模型一线的工作者，更多是让大众和各行各业的人都突然有如梦惊醒的感觉。甚至，今天它给我们整个计算机科学领域都带来了一个惊讶的反应，或者说快速的教育过程，大家快速认识到基于一个智慧体的预训练大模型会有多么出色的表现。

在这个过程中间，我们对ChatGPT所采用的一些技术和各个方面能够达到的惊艳效果也是感到出乎意料。但阿里不是说今天有了ChatGPT，我们才加入这样一个阵列，或者说我们才能凑热闹，也来做一把模型。其实我们在这方面一直在积累，应该说是国内最早探索大模型方向的公司之一。

ChatGPT非常领先，但下次也许就是我们在引领技术的发展

品玩：所以对大模型而言，ChatGPT究竟改变了什么？

周靖人：它基于SFT（有监督精调），包括基于reinforcement learning（强化学习）的调优方式让人眼前一亮。

今天其实我们回过头去看，模型中融入知识的潜力是巨大的，但是在InstructGPT 出来之前，其实缺乏一个有效的手段把这方面的能力释放出来。现在这些技术的使用能更有效地把模型作为知识体的能力释放出来，快速地去解决一些具体的问题。

品玩：这对大模型研究路线有什么影响？

周靖人：首先，ChatGPT包括InstructGPT给我们很多启发，我相信 OpenAI 其实有长足的技术前瞻性，当他发布GPT3.0 或者3.5 版本的时候，实际上是各个方面都陆陆续续已经准备好了。

但最终我们认为类似人类智慧体的预训练大模型一定是多模态的。我们长期以来在这方面做投入，因此ChatGPT的诞生并没有让我们转变投入方向。后来GPT4的发布其实在无形之中验证了大家实看法比较一致——AI会朝着多模态的体系进一步发展。

所以今天我们方向是一致的，在实现路径上我们要取长补短，这是科技发展的必经之路。今天ChatGPT有一些很出色的工作，我们要把他们的一系列工作和一些进展融入到我们技术路线里面来。

品玩：如何看AI行业的议程正在被ChatGPT设置这个事实，就是说无论其它玩家做什么，都会被拿来跟ChatGPT做对标。

周靖人：我觉得这就是科技的魅力。

这种你追我赶是今天科技健康发展的必经之路。任何一个科技都是处于你追我赶中，今天可能我有一些新的想法，能把科技再往前推一步，那下一次有可能是由你来承担这方面的一些创新，大家都是在互相取长补短，不断的去推进科技前进。

在不断取长的过程里，我们也不能妄自菲薄，我们同样也希望能不断地去推进最先进的技术进步，下次也许就是我们在推动行业的发展。只有这样人类的整体科技才能不断地提升，不断的创新，不断地进行突破。

至于今天整个 OpenAI 已经在给我们设置议程，我觉得那是因为它是领先者，这必须承认，而接下来，如何能快速追赶上，如何能快速地去迭代模型将成为一个制胜的关键。

也就是说今天我们不乏有一些新的想法，那今天我如何能够去尝试？如果说每一次的尝试它需要花的时间是几个月甚至更长，那今天你整个的创新速度是跑不起来的。

品玩：它变成了一个系统效率的比拼。

周靖人：今天创新迭代的速度一方面需要我们有一些新的想法，但更重要的是需要今天云的基础设施。它能够让我们去快速地去尝试，去试错，能够快速拿到反馈，才能让科技创新不断加速。

我们讲它是一个全方位的竞争，不单单是说今天是模型本身的竞争，其实今天它既是研究又是工程，是从云的基础设施到 AI 算法，到今天数据处理，全方位的一个竞争，甚至涉及到了今天我们计算机科学的方方面面。有各种各样的分布式系统、底层的网络存储各个方面都会涉及到。那之所以 OpenAI 能够做出非常出色的工作，也来源于今天它跟微软 Azure 的有机结合，其实在无形之中也是强联合，能够不断通过云的基础设施，通过整个系统的一系列优化带动了今天OpenAI不断创新的速度。

我认为在这一场竞争里面，是一个公司全方位能力的一个表现，如果在任何一个环节稍微落后一点，都会在整个竞争上处于劣势。

“通义千问”其实是一个MaaS（模型即服务）的底座

品玩：也就是可能这个模型并没有完全成熟，但是它也需要先投入到一个真实甚至是一个商业的环境中去。今天模型的研发跟行业的应用已经在并行进行。

周靖人：对，人们逐渐认识到基于大模型本身强大的对知识理解和推理能力，找到一个如SFT和Prompt等方向后，就能够把小宇宙慢慢释放出来。那当然会激发基于大模型的一系列模型应用。

今天一定程度上人工智能业务算法的算法体系已经在改变，今后大家要慢慢学会怎么在大模型上去做二次的开发，去做相关的一系列算法和工作，包括把它适配到不同的场景。

去年我们在国内首次推出 model as a service模型即服务（MaaS），甚至我们是在全球第一个提出来这样一个概念的大公司。那我们也比较欣慰的看到越来越多的行业、云计算厂商还有更多的互联网公司也开始认同这样的一个观点，甚至今天也开始按照这样一个观点去打造自己的产品服务体系。我们已经已经真正进入到了一个模型的世界。

品玩：那么MaaS会让我们和OpenAI走上不同的演进道路么？

周靖人：我们认为今后 AI 的开发门槛会越来越低，我们期待的是连小学生也能用各种模型进行开发。今后我们需要形成的是一个一个模型的不同层级的结构。

而且一个通用的模型其实也很难解决所有问题。从开发者的角度，它会更多的以模型为第一思考的角度和元素，也就是说今天围绕着模型作开发的范式会逐渐诞生。我们去年在ChatGPT出来之前就提出并一直在强调 MaaS，其实就是这样一个理念背后的一系列的思考。

我们在思考模型的生态如何快速发展，所以提出MaaS，为了加速MaaS，我们又创建了“魔搭”这样的社区。所以几乎这些工作都是相互强关联的，是在我们整个AI战略和模型战略的主线上。

品玩：通义千问其实也就是MaaS的成果之一，对吧。

周靖人：是的，今天通义千问是以对话作为一个能力的表现形式，但我们期待一些企业级的应用诞生在上面，也就是说今天真正把通义千问模型作为MaaS上面的一个底座，能够在上面进行额外的开发，能够真正应用到一些各行各业的场景里面去。那这样就是真正意义上形成了MaaS。

达摩院支持别人在阿里云上开发大语言模型

品玩：也就是在阿里云上别人也可以开发自己的模型。

周靖人：我们是非常欢迎的。我们并不认为今天大模型是一家独大。

我们希望阿里云能够为大家提供一个高效的算力，不简简单单是一个算力的数字，而是能够把这部分的基础设施更好地提供给我们中国的创业公司，帮助他们在 AI 方面实现自己的创新，这样才能让中国整体的 AI 能力有一个全方位的提升。

品玩：其实我们对于初创公司做模型这件事情，整个达摩院包括整个阿里的态度其实是相当开放的？

周靖人：对。

品玩：那初创公司做大模型呢？你们怎么看？

周靖人：我觉得对待大模型，我们科技界一定是要保持开放的心态，对吧？因为很多的创新来自许多新的想法，其实这个我们很难说处于一个垄断的状态。

阿里应该说在这方面非常开放，我们愿意把我们的模型供大家使用，另外一方面我们也把我们模型所依赖的这样一个云的能力也对外进行服务。虽然我们也认识到今天小公司在训练大模型的经费和技术上有门槛，但我觉得这个是问题本身的特点所带来的。我们希望有更多的参与者不断地加入到这方面的科技创新。

卖个关子，还有下一款“通义”模型

品玩：今天很多人把大模型的突飞猛进归结于涌现（emergence）。您是否可以描述一下，通义千问的哪一个研发场景，让我们觉得这个它可能它是实现了一次非常成功的大规模的涌现？

周靖人：我觉得涌现可能是一个主观的定义。

品玩：不是一个科学的词汇，是吗？

周靖人：对，为什么这么说，因为它是对某一个个体认知体系的一个冲击，这个叫做一个涌现。那当然每个人的认知是不一样的，所以大家看到同样结果，也许对我是一个冲击，对你就不是一个冲击。

所以对于我们这些科技工作者来讲，今天所有的科技发展都是一步步来的。所以我刚才讲到，我们之所以从几年前国内最早就在做相关大模型的研究，如此笃定，其实我们每年都会有各种各样的一个涌现，我们每一份工作其实都有各种各样的一个涌现，当然这一次看起来是全社会的一个涌现，每个人都参与，但我还是认为科技的发展总是有一定的积累后，到了一定时刻有一个突破，其实中间有很多的技术细节，很多的know-how。

品玩：所以这些know-how是什么？很多人说现在找不到，跟炼丹似的，您同意这个说法吗？

周靖人：我觉得应该说今天我们有点类似处于早期深度学习发展的那个阶段。那个时候大家对整个深度学习的理解，也觉得是“不知道为什么，反正管用”，这点毫无疑问。坦诚地讲，今天的进步确实有很多工程以及经验的因素在里面，这中间的的确确还有很多方面值得研究，包括这个模型深层次的机理。今天我们大概知道这个模型为什么会有这么突发的一个表现，但真实的情况我们还是需要有一些理论的研究。

品玩：现在通义千问最希望或者最需要解决的问题是什么？

周靖人：这个模型可以优化的地方还有非常多。我刚才强调，它只是整体规划的一个部分，让大家体验到我们在工作上的一些进展，但是离我们的整体设计还有长足的工作需要去完成。

比如从模型本身和系统层来讲，如何能够更高效的去服务更大规模模型的训练，如何接入更多模态，提高在推理侧的代码能力，提升辅助人类日常工作生活方方面面的能力，结合行业知识的定制化能力等。

但是解决过程也是我们科技发展的一个必经之路，今天如果到一个时间点我们都觉得问题解决完了，这个领域也就不再令人兴奋了。正因为今天这个是一个刚刚发展起来的崭新的领域，我们认为想象的空间是巨大的。

品玩：最后一个问题，为什么叫通义千问，一定要这么文绉绉的吗？

周靖人：我们去年9月份的时候就发布了“通义”大模型系列，我们整体一系列的工作不是为了某一次发布而改变的策略，我们是有一个体系化的思考。今天我们千问是在我们既定的路线上面的一个节点。

所以通义是一个模型系列的名字，千问主要是指它目前一个主要的对话形态。千万次的追问是人类获取智慧的方式，我们希望千问也能够不断地学习逼近人类的智慧。

通义千问成为我们通义模型系列中重要的一员。我们接下来很快还会测试另外一款通义的模型，现在卖个关子。它也会叫通义什么，并且代表今天我们在相关领域的又一个重要进展。

通义千问, 阿里巴巴, 大语言模型, 人工智能

AI时代，拥有个人微信机器人AI助手！AI时代不落人后！

免费ChatGPT问答，办公、写作、生活好得力助手！

搜索微信号aigc666aigc999或上边扫码，即可拥有个人AI助手！

相关文章

发表回复 取消回复

发表回复取消回复