文章主题:阿里云, 通义千问, 人工智能大模型, 聊天机器人
随着聊天机器人ChatGPT、谷歌Bard和百度“文心一言”相继亮相,我国阿里云也加入了人工智能大模型的竞争行列,推出了“通义千问”这一强大的人工智能产品。
近日,我国知名云计算服务商阿里云正式推出了自主研发的大模型“通义千问”,并已开始向用户邀请测试体验。据悉,目前该模型的主要测试对象为企业的用户,其可以通过阿里云的官方网站(tongyi.aliyun.com)进行申请,一旦符合条件的用户将有机会参与到体验测试的活动中来。值得注意的是,阿里云方面强调,此次推出的“通义千问”模型将主要面向企业用户,旨在为企业提供更为优质、高效的智能服务。
来源:通义千问
在官方网站上,通义千问被定位为一个专为回应人类指令而设计的巨大模型。若用户希望尝试这一功能,需提前预约并报名。参与者在预约时需提供手机、邮箱、个人身份及实际应用场景等详细信息。
在7日的下午,我国知名媒体平台澎湃 journalist成功地登入了通识千问,并成功访问了该平台。在访问过程中,记者发现该平台的界面设计非常人性化,其中最引人注目的就是位于页面正中央的一个对话框。这个对话框清晰地显示了用户输入的上限——1000字。此外,对话框下方还详细展示了通识千问所具备的多项功能,包括电影脚本编写、职场助手提供、撰写短文以及发送邮件等。这些功能强大的工具,无疑使得通识千问在同类产品中脱颖而出,成为了备受关注的焦点。
来源:通义千问
在页面底部,我们发现了一个名为“百宝箱”的通道,它呈现了通义千问整合的9款应用程序。这些应用被细分为三个类别:提高效率、生活和娱乐。
来源:通义千问
通义千问作为我国继 ChatGPT 之后的第二大类 ChatGPT 产品,再次证明了人工智能在自然语言处理领域的强大实力。而在今年3月16日,百度公司更是推出了另一款聊天机器人“文心一言”,它具备了文学创作、商业文案创作、数理逻辑推算、中文理解和多模态生成等五大能力,这无疑为我国的智能对话技术增添了新的篇章。
为测试通义千问的能力,记者同时向它和文心一言进行提问,对比二者生成的回复有何不同。
通义千问自称训练数据来自2021年,难以获取实时信息
首先,记者向两款聊天机器人询问通识性问题,请它介绍作家莫言及其文学作品。
通义千问能够准确地介绍莫言的原名、出生日期、身份等信息,并强调莫言是第一个获得诺贝尔文学奖的中国作家。此外,它列举了莫言的三部代表作,不仅附上了发表时间,还对作品进行了简要概括。
来源:通义千问
文心一言同样提到了莫言本人的基础信息和作品,此外还列出了莫言获得的多项奖项。不过它并没有指出莫言是首位中国籍诺贝尔文学奖获得者。
来源:文心一言
随后,记者尝试向两款机器人提问最新发生的事件。遗憾的是,它们似乎都无法获取实时信息。
在被问及2023年的奥斯卡获奖影片时,通义千问表示“无法预测未来的奥斯卡获奖影片……建议您关注官方的奥斯卡奖项公告,以获取最新的信息。”
来源:通义千问
文心一言则“一本正经”地给出了错误的回答,称2023年的奥斯卡获奖影片为《寄生虫》。但事实上,《寄生虫》于2019年上映,并于2020年获得奥斯卡最佳影片、最佳国际影片、最佳原创剧本和最佳导演四项大奖。
来源:文心一言
无法获取最新信息,或意味着训练数据有限。通义千问告诉记者,自己的训练数据来自2021年,因此无法获取有关未来的信息。文心一言则表示,没有明确的数据截止日期。
相比之下,聊天机器人ChatGPT的数据库更新至2021年,上个月刚刚推出的多模态模型GPT-4的训练数据可追踪到2021年9月。
来源:通义千问
可写邮件、列提纲、提供菜谱
除了允许用户随机提问,通义千问还提供了多种应用功能。
记者首先进入“写封邮件”应用,要求其为刚毕业的大学生撰写一封求职邮件。通义千问所撰写的邮件格式较为标准,在开篇进行自我介绍并说明求职目的,还表达了对公司的向往和认同。
来源:通义千问
文心一言提供的邮件也较为标准。此外,它在回复中特别指出这是一个“符合规范的样例,你可以参考一下进行修改和调整”,还在名字落款处提醒用户要写自己的名字。
来源:文心一言
在“效率类”类应用中,通义千问具有写提纲、SWOT、商品描述生成三种功能。
记者首先测试了商品描述生成功能,分别要求通义千问和文心一言帮手机店给最新上市的折叠手机写一篇宣传文案,限制字数在100字以内,希望能突出折叠手机的优势和特点,吸引顾客购买。
这两款机器人均抓住了关键词“折叠手机”。通义千问突出了折叠手机在空间利用率方面的优势,写到“相比传统的直板手机,它可以有效地减少屏幕占用空间,方便携带”。文心一言则指出“它采用最新的折叠技术,可以在一款手机中实现智能手机和平板电脑的双重功能”。
但是,这两款机器人都未满足“100字以内”这一要求,字数远远超标。
来源:通义千问
来源:文心一言
随后,记者又测试了通义千问的“写提纲”应用。在被要求撰写一份关于“煤矿污染文章”的提纲时,它从煤矿污染的概念和影响、历史和现状、造成污染的原因、探讨对环境和人类的危害、治理方法和保护措施 、总结及展望等方面的内容,较为全面。
来源:通义千问
在“效率类”类应用中,通义千问具有彩虹屁专家、写情书、为你写诗三种应用功能。
记者要求两款机器人分别以“春雨、落花、伤感”为关键词作一首诗。通义千问撰写了一首七言诗,结尾较为押韵。
来源:通义千问
文心一言所写的诗较长,它在第一句里直接将关键词“春雨、落花、伤感”拼接在了一起,且其后的每一段中,不停地让关键词重复出现。
来源:文心一言
通义千问写的诗马马虎虎,它写的情书靠谱吗?记者尝试随机输入姓名,得到了一封略显浮夸的情书,这样看来情书还是本人亲自撰写更有诚意。
来源:通义千问
不会夸人怎么办,通义千问具有“吹彩虹屁”的功能。记者尝试让它夸奖别人文章写得好,通义千问再次浮夸了起来,“你的文章简直是天赐之作,如同一缕春风,轻轻拂过我的心灵。”
来源:通义千问
如果让通义千问自夸,它更是极尽赞美之词,“让我们一起来赞美通义千问,赞美它所传达的智慧之光,赞美它所传承的文化精髓!”
来源:通义千问
在生活类应用中,通义千问能够提供菜谱、写小学生作文、续写故事。记者测试了最实用的菜谱功能,向其询问蔓越莓曲奇的做法。通义千问提供了所需的材料,并详细介绍了操作步骤。
来源:通义千问
在测试的过程中记者注意到,通义千问的回复页面显示“仅展示最近10条对话”。在页面的最下方,还有一条关于回复内容的说明,“测试生成的所有内容均由人工智能模型生成,其生成内容的准确性和完整性无法保证,不代表我们的态度或观点。”
此外,记者发现如果离开通义千问一段时间后再次返回,页面会出现一条弹窗,提示用户太久没有操作,需要刷新页面重新开始。如果离开的时间更久,它还会自动返回登录页面,要求用户重新登录账号。
来源:通义千问
在最后,记者要求通义千问和文心一言互相进行评价,并指出对方的优点和不足。
通义千问表示,百度推出的聊天机器人“文心一言”(英文名:ERNIE Bot)是一款能够与人类进行自然语言对话的人工智能聊天机器人,其语言理解能力强、可以与用户进行多样化的交互、支持自然语言生成;但其对话深度有限、难以处理多义性和模糊性且可能存在bug和安全风险。
有意思的是,在此前的回复中,通义千问表示自己的训练数据来自2021年,而文心一言于2023年才问世,它却能够准确地说出文心一言的英文名以及优缺点等信息。
来源:通义千问
文心一言则表示,阿里推出的聊天机器人“通义千问”是一种新型的人工智能聊天助手,它可以通过自然语言处理技术和深度学习算法来理解和回答用户的问题和提问。它指出通义千问在智能化、多语言支持和自动回答;不足之处在于其语言理解能力、知识库有限以及技术存在限制。
来源:文心一言
AI时代,拥有个人微信机器人AI助手!AI时代不落人后!
免费ChatGPT问答,办公、写作、生活好得力助手!
搜索微信号aigc666aigc999或上边扫码,即可拥有个人AI助手!