文章主题:阿里巴巴, 语言大模型, 通义千问, 企业邀测

撰文:李昊原
阿里巴巴近日宣布启动企业邀测语言大模型“通义千问”,标志着其正式加入大模型竞赛。尽管官方对该产品的介绍较为有限,但幸运的是,作为行业媒体,DoNews抢先获得了内测邀请码,得以与“通义千问”亲密接触,从而回答了许多关于该产品的疑问。

通义千问,作为一款源自阿里巴巴达摩院的大规模语言模型,其核心使命在于生成高质量、与给定词语相关的文本,旨在协助广大用户提升创新创意水平。这一名称背后的寓意,就是要能够广泛应对各种领域中复杂且独特的問題。

而在开始界面中,可以看到“写封邮件”“撰写短文”“电影脚本”“职场助理”四个选项。

在我们的测试过程中,我们对四个功能进行了逐一的评估。首先,我们尝试进行了发送邮件的操作。在这次操作中,我们提出了一个具体的需求:“请帮我向部门主管发送一封邮件,由于身体原因,我需要在下周一请假。”

作为对比,我们也让chatGPT回答了同一问题,不难看出,通义千问的回答更符合中国人的语言风格。

在职场助手的选择中,我们针对“作为一名科技记者,如何最新地报道人工智能的发展”这一问题进行了咨询。令人意外的是,来自通义千问和ChatGPT的答案之间存在着显著的不同。

通义千问和chatGPT在回答问题时所采取的方法存在一定的差异。通义千问的回答往往更加注重具体的行动步骤,而chatGPT则倾向于在学习的基础上逐步展开工作。这种差异性在一定程度上反映了两者在思考问题和解决问题时的思维方式不同。

除了上述的四项基础功能之外,通义千问还具备一个名为“百宝箱”的实用工具。这个“百宝箱”内含效率类、生活类和娱乐类共九个不同主题的选项,能够为用户提供更加精细化和细致化的服务。无论您是在提升工作效率、优化生活品质还是寻找娱乐方式上,都能在这个“百宝箱”中找到最适合您的解决方案。

比如商品描述生成,这就很明显是针对电商卖家,以下是它对“天猫精灵”生成的描述:

生活类中,菜谱的选项比较实用,但小学生作文却有点让人摸不着头脑,难道是为了给小学生减负?

还有一个常见的选项,就是续写(然后呢),我们尝试让它续写了《了不起的盖茨比》的经典开头。
在我年轻且经验不足的时候,父亲给予了我一个深刻的建议,这个建议至今仍历历在目。他告诫我:“每当 you 准备批评他人时,请谨记,这个世界并非每个人都能拥有与你相同的优越条件。”

从分析结果来看,通义千问在理解原文方面存在一定的困难,其续写能力也较为一般,尤其是在“文学性”方面仍有提升空间。然而,在娱乐类题目中,三个选项则展现出较高的人性化程度。

我们尝试让它夸赞下“马云的长相”,以下是生成的结果,似乎……也不无道理?

在最后,我们询问了通义千问对其他大规模语言模型的了解,它知道BERT和GPT,但对自己却颇具信心,认为具有更优秀的性能和更丰富的应用场景。

也希望通义千问的信心,能在未来成为现实。

AI时代,拥有个人微信机器人AI助手!AI时代不落人后!
免费ChatGPT问答,办公、写作、生活好得力助手!
搜索微信号aigc666aigc999或上边扫码,即可拥有个人AI助手!

