文章主题:国盛海外, 夏君, 朱若菲, 刘澜

666AI工具大全,助力做AI时代先行者!

国盛海外:夏君/朱若菲/刘澜/刘玲

在启动基于阿里大模型的“通义千问”测试之后,我们对其进行了详细的评估,并与此同时,也对百度的“文心一言”进行了深入的体验。

在对比分析中,我们可以看到,百度文心一言与阿里通义千问都各自拥有独特的优势。例如,百度文心一言在文学创作、商业文案创作、数理推算、中文理解和多模态生成等方面表现出卓越的能力;而阿里通义千问则在基础问答的基础上,具备了写提纲、SWOT分析、商品描述生成、会飞菜谱、小学生作文、彩虹屁专家、写情书以及为你写诗等九大技能。为了全面评估这两款产品的性能,我们在多个角度提出了相关问题,并对它们进行了详尽的比较测试。

我们的测评核心围绕以下维度(样本有限,仅供参考交流):

内容生成模态:百度“文心一言”胜。多轮对话能力:阿里“通义千问”胜。数理推算:百度“文心一言”胜。中文理解:阿里“通义千问”胜。电商文案生成:阿里“通义千问”略胜。内容生成模态

当前,阿里“通义千问”仅具备文字输入与输出的功能,其应用范围主要局限于对文字信息的理解和处理。相比之下,百度“文心一言”则表现更为全面,除了文字之外,还能支持图像的输入和输出,为用户提供了更为丰富的交互方式。

阿里“通义千问”:

百度“文心一言”:

多轮对话

在我们的测试过程中,我们发现阿里“通义千问”在捕捉上下文关联方面表现得相当出色,特别是在前一个对话中的“座舱交互”场景方面。相比之下,百度“文心一言”在回答问题时似乎仅关注于当前轮次,而忽视了之前的对话背景。

阿里“通义千问”:

百度“文心一言”:

数理推算

如百度所强调的一般,文心一言在基本的数理计算方面具有优势。然而,在与此相关的阿里通义千问方面,其表现却显得不尽如人意。相反,经过我们调整参数后,百度文心一言始终保持准确的回答。

阿里“通义千问”:

百度“文心一言”:

中文理解:

在我们的测试案例中,阿里的“通义千问”在处理可能引发歧义的名词方面表现更为出色,同时具备更丰富的知识库和精确的理解能力。相比之下,百度的“文心一言”能够更好地捕捉并识别这些混淆信息。

阿里“通义千问”:

百度“文心一言”:

特定应用场景——电商文案生成

虽然两个选项都存在一定的基础性错误,但是它们都能从不同的角度对商品进行分类和推荐。然而,相较于阿里“通义千问”的电商文案,其他选项在推荐维度上更加丰富,归纳要点也更为明确。

阿里“通义千问”:

百度“文心一言”:

国盛海外, 夏君, 朱若菲, 刘澜

AI时代,拥有个人微信机器人AI助手!AI时代不落人后!

免费ChatGPT问答,办公、写作、生活好得力助手!

搜索微信号aigc666aigc999或上边扫码,即可拥有个人AI助手!

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注