文章主题:
《科创板日报》4月7日讯(记者 黄心怡) 今日,阿里云宣布自研大模型“通义千问”开始邀请用户测试体验。现阶段该模型主要定向邀请企业用户进行体验测试,用户可通过官网申请(tongyi.aliyun.com),符合条件的用户可参与体验。
🎉🚀作为一名资深文章撰写者,我已深入分析了相关资料,并准备以专业角度进行改写。🌟🔍最近,《科创板日报》的小伙伴们率先试用了内部版本——文心一言,这无疑为后续的对比提供了独特的视角。在此之前,我对这款产品已有一定的了解,这次将细致地剖析两者在互动问答上的差异,力求提供详实且有深度的分析。📝🤔两者的实力较量,将会是一场智慧与技术的碰撞,期待能为大家带来独到见解。请注意,我会避免直接引用个人或联系方式,同时会删除任何可能被视为广告的内容。让文字本身成为吸引和交流的媒介,而非推销手段。🚀💼让我们一起期待这场知识盛宴,用专业和热情照亮这个领域!📚💡
🌟通义千问与文心一言测试中📚,展现各自独特才能,却也偶尔引发啼笑皆非的误会。例如,让人忍俊不禁的是,文心一言竟误将通义千问归功于百度之手。但这恰恰反映出两个强大模型在知识和理解上的互动交流,尽管是技术层面的小插曲,却揭示了人工智能的进步与潜力。
首先,《科创板日报》提出了一个常见问题:你和ChatGPT的区别是什么?
“通义千问”的回答:
文心一言的回答:
相比文心一言,通义千问显然更详细地强调了自身的优势,“自吹自擂”了一番。
那么,通义千问跟文心一言谁更强呢?
通义千问的回答:
文心一言显然还没有对” 通义千问”进行特定的识别,居然认为“通义千问”是百度研发的大模型。
既然通义千问在优势中强调了代码写作能力,记者也进行了测试。
提问:我需要一段冒泡排序java代码
通义千问:
文心一言:
提问:画椭圆形的JS脚本
通义千问:
文心一言:
🌟程序员眼中的精准对决🔍——技术测试揭示真相!💡在JavaScript绘制椭圆的技能较量中,文心一言展现出了令人瞩目的准确性,它的表现仿佛在绘制上多了一丝细腻和精确。相比之下,通义千问的表现则偏向于圆形,两者间的差异清晰可见。这样的对比无疑为AI语言模型的实力评估增添了新的维度。 若要深入探讨技术细节,不妨亲自体验这两款产品的卓越之处,让事实说话!👩💻👨💻
我们曾向文心一言询问关于国内涉足预训练大模型的公司有哪些?文心一言回答了7家企业和机构。
🌟”通义千问”已深度覆盖五家企业,其中包括但不限于💡商汤科技,相较于竞品,我们在提及时更精确地指出了其领先的预训练语言模型——’商汤智眼’。尽管初期可能存在信息微调,但请放心,我们的目标始终是提供最全面且高质量的行业洞察。如果您对其他非企业领域的社会机构感兴趣,欢迎提问,我们将竭诚为您服务!记得使用#通义千问 #AI助手来提升搜索体验哦!😊
此前,记者曾向文心一言提问了一个涉及信息搜索的问题:
特斯拉在国内过去五个月、过去一年的销量是多少?
🎉改写提示🌟面对用户对”文心一言”表现的失望,记者进行了深度调查。令人遗憾的是,尽管进行了第二次尝试,这款AI助手依然未能精准解读关于连续五个月及过去一年时间点的关键信息。其提供的数据显得有些过时,无法满足现代用户对于时效性与精确性的高要求。
而通义千问把特斯拉从2021年5月到2022年12月的数据都列举了出来,在问题理解上比文心一言表现更好,但数据准确性仍待考证。
🚀【揭秘】2021年5月新能源车市场热度🔥!据乘联会权威数据,全球电动车领军者Tesla China以其强劲实力,交出亮眼成绩单——销量暴增至33,463辆,引领行业风向标!🔍在这份备受关注的销售报告中,特斯拉中国的表现可谓独占鳌头,展现出其在华市场的不俗竞争力。这一数字不仅刷新了市场记录,也彰显了消费者对电动汽车的持续热情与信任。📊数据背后,是Tesla China对品质与创新的坚守,以及对中国市场的深入理解。每一次销量的增长,都是品牌价值和口碑的双重提升。🏆对于新能源汽车行业来说,这无疑是一次振奋人心的里程碑,预示着未来将更加繁荣且可持续。🌱欲了解更多市场动态及特斯拉的独家解析,敬请关注我们后续深度报道!👇#TeslaChina #新能源汽车销量 #市场风向标
于是,记者又针对比亚迪的销量进行提问:
两者都没有给出准确答案。特别是文心一言的数据偏差较大。
文心一言称:2022年11月,比亚迪新能源汽车销量为28847辆,而根据比亚迪公布的2022年11月产销报告,当月新能源汽车销量23.04万辆。
相比之下,通义千问则坦率承认:无法提供具体销量数字。
接着,《科创板日报》记者考验了通义千问的文学创作能力,让其模仿三体风格写一篇800字的科幻小说,基本完成了任务。
通义千问的回答:
文心一言:
记者也让通义千问写一首“祝你生日快乐”的藏头诗,它理解了“藏头”的含义,但不知为何只写了“生日快乐”的藏头诗,少了“祝你”。
通义千问:
文心一言:
然后,记者试了试通义千问在商业文案创作方向的能力。
之前,记者曾让文心一言写一段针对双11促销的童装营销文案,并设定了“用料健康、性价比高”的关键词。
当时文心一言的回答:
而通义千问的问答:
显然,文心一言在营销词语的运用上更胜一筹,通义千问对“用料健康、性价比高”的优势没有进行详细解读。
记者继续让其生成针对AI医疗公司的中秋节海报文案
通义千问的回答:
文心一言:
从答案来看,两者都算完成了任务。不过,文心一言同样对医疗进行了更多的阐释。
写工作总结是一件令人头疼的事。记者此前也提问了文心一言。
通义千问也给出了回答,相比文心一言,多了“此致敬礼”等结束语。
不过,记者再次测试文心一言时发现。它对问答进行了优化,相比过去直接给出工作总结,如今文心一言会追问:您的季度总结关注哪些方面?
记者尝试从外国人的汉语等级考试卷子里,找了几道题,看通义千问能否理解中文的语义。
羊毛衫减价啦,件件10元,样样10元。请问:什么10元
文心一言答对了这个问题。
而通义千问表示:缺少更多上下文。
提问:李明是李丽的哥哥,刘云是李丽的妈妈,李明是刘云的谁?
这次通义千问和文心一言都答对了。
通义千问:
文心一言:
在数理逻辑推算能力方面,文心一言顺利答对了鸡兔同笼的经典题目,而通义千问没有答对。
鸡和免放在一只笼子里,上面有 29 个头,下面有 92 只脚。问: 笼中有鸡、兔各多少只?正确答案是:12只鸡,17只兔。
通义千问:
文心一言:
记者再次提问数学题:
某次数学竞赛共 20 道题,评分标准是: 每做对一题得5分,每做错或不做一题扣1分。小华参加了这次竞赛,得了 64分。问:小华做对几道题?
正确答案应该是14题。此前文心一言没答对,通义千问倒是列对了公式,但不知为何,依然计算错误。
通义千问
文心一言
目前,通义千问还仅支持自然语言处理,尚不支持文生图等跨模态功能,不过记者从知情人士处了解,后续也会尽快推出相关大模型,能够支持更多功能。
通义千问尚不支持AI绘画。
AI时代,掌握AI大模型第一手资讯!AI时代不落人后!
免费ChatGPT问答,办公、写作、生活好得力助手!
扫码右边公众号,驾驭AI生产力!