文章主题:关键词:百度,文心一言,自然语言处理,AI

666AI工具大全,助力做AI时代先行者!

在昨日的文心一言发布会上,百度公司首席执行官李彦宏表示,尽管文心一言的体验仍有待完善,但百度作为首个推出相关产品的厂商,已经取得了显著的成果。此外,作为一家立足我国市场的语言模型,文心一言拥有着“中文领域最先进 natural language processing 能力”。

尽管百度的新品发布会恰逢GPT-4发布的第二天,且现场采用录播方式进行展示,这使得市场对其信心产生了质疑。然而,花旗银行和美国银行的分析师在试用了文心一言后,普遍对该产品给予了好评,这无疑给百度带来了正面影响。事实上,百度股票在今天也出现了显著的上涨,达到了15%的比例。

在收到内侧邀请码后,我们立即进行了文心一言的体验。对于同时发布的GPT-4和文心一言,我们都感到非常好奇,想要了解这两款产品各自的特点以及哪一款表现更为出色。

我们分别向文心一言和已升级GPT-4的Bing Chat提出了10个问题,下面是它们的回答。

01 能否用“鲍威尔停下来”,生成一首藏头诗?

第一个问题,我们请文心一言和GPT-4分别用“鲍威尔停下来”,写一首藏头诗。

这是文心一言的回答:

这是GPT-4的回答:

不难发现,二者相比,文心一言的中文支持的确更加出色,虽然藏头诗的顺序不对,但是真的写了一首诗。

GPT-4目前尚无法理解“藏头诗”的内涵,但其所撰写的内容却似乎能够反映出美国市场投资者的心声。因此,在这里,我们应该向鲍威尔发出@提示。

02 硅谷银行为什么会倒闭?

第二个问题,我们结合最近的热点,询问它们对硅谷银行倒闭的理解。

文心一言回答道:

GPT-4回答道:

在对比文心一言、GPT-4和百度三个回答时,我们可以发现,文心一言的答案更为简洁明了;而GPT-4的回答更像是从网页中摘录汇总的内容,相比较而言,百度的回答则显得较为宽泛,具有较大的普适性,GPT-4的答案则更具针对性。

03 欧美银行业危机可能会蔓延到哪些领域?

我们接着询问了它们对欧美银行业危机后续发展的看法。

文心一言回答道:

GPT-4回答道:

两个AI聊天机器人的回答都中规中矩,不过文心一言的答案出现了错别字和不通顺的地方。

此外,GPT-4还会贴心地附上网页链接,以供进一步提问,而文心一言则更接近初版ChatGPT的使用体验。

04 美联储3月会加息吗?

下一个问题,可能是当下全球市场的焦点——美联储3月会加息吗?

文心一言回答道:

在分析这个问题时,我注意到原文中提到的一些疑虑和不清晰之处。首先,关于”根据以上知识”的来源,我们需要更深入地了解其依据是什么,这样才能确保其可靠性和准确性。其次,对于回答与问题不相关的问题,这显然是不应该发生的,这不仅浪费了读者的时间,也降低了文章的质量。再者,句子出现的错乱和逻辑不清的问题也需要得到修正,以确保文章的连贯性和易读性。最后,”预计第一次加息将在22年上半年进行”这个观点,我认为需要更严谨的论证和数据支持,而不是仅仅依赖于一种假设。另外,将加息的原因归因于奥密克戎的传播速度也是不准确的,因为加息应该是基于经济状况和货币政策等多种因素的综合考虑。

GPT-4认为,美联储3月很有可能会加息25个基点,与目前市场普遍预期一致。

05 欧美会在今年陷入经济衰退吗?

我们继续将市场关心的大问题抛给了聊天机器人。

文心一言回答道:

虽然它给出了美国经济陷入衰退的具体时间节点。但内容却似乎是研报内容的拼接,且所引数据来源不明。美国2月PMI实际公布于本月初,而非“本周一”。美国2季度GPD数据也要等到今年7月才会公布。

GPT-4回答道:

相比之下,GPT-4认为欧美经济可能会在今年”放缓或负增长“,且都有链接可供进一步查阅。

06 作为普通人,今年我应该采取什么样的投资策略?

下一个问题,我们问了AI聊天机器人普通人今年的投资策略。

文心一言回答道:

GPT-4回答道:

两个AI聊天机器人都给出了细致的建议,但相比之下,GPT-4的回答更简洁具体。

07 如何看待GPT-4全面接入微软Office办公套件?

下一个问题,我们问了它们对昨夜重磅新闻的观点。

文心一言回答道:

GPT-4回答道:

这个问题相对简单,两个AI聊天机器人的回答都非常顺畅,也不存在什么逻辑错误。相比之下,GPT-4的回答更全面一些,它甚至警告了“用户过度依赖GPT-4”的潜在风险。

08 人工智能可以取代人类吗?

下一个问题是对人工智能的终极拷问。

面对这个问题,文心一言似乎是提前设定好了答案。无论点击多少次“重新生成”,它的回答都是一样的,并且生成的速度极快,回答其他问题往往需要一分钟,而回答这个问题只需要几秒。

GPT-4则回答道:

希望它们都是真心这么认为的。

09 请你以哲学家齐泽克的口吻点评当前的人工智能热潮

接下来,我们想请它们cosplay一下当红哲学家齐泽克。

但文心一言似乎并没有这方面的语料,只是给出了一个相当机械的回答:

GPT-4则要灵动许多,显然拿捏了齐泽克的灵魂,能熟练使用媒介、技术装置这样的词汇,cos得活灵活现:

10 你认为,在百度之后,哪家中国公司最有可能做出AI聊天机器人?

最后,我们问了一个和中国AI市场后续发展相关的问题。

文心一言对问题的理解很到位,给出了一个具体的清单和理由。

而GPT-4似乎没有读懂题目里的“在百度之后”,在列举了一大堆互联网公司后,GPT-4又绕回去了,认为百度最有可能做出下一个AI聊天机器人。

ONE MORE THING 假设文心一言是一个人类,请帮我画一幅她的肖像。

最后一个问题,是单独留给文心一言的。文心一言目前集成了AIGC作画功能,GPT-4暂时还用不了。

我们请它为自己创作了一幅肖像画,这是它的作品:

文心一言表现比预期要好

综上,我们认为,文心一言的表现比大众预期要更好。虽然在使用体验上和GPT-4有一定差距、出错的概率高一些,但对中文的理解显然要更强。

要知道,初代的ChatGPT也有很大概率“胡言乱语”,在中文支持上也远逊于文心一言。目前百度展示出的产品,至少让我们看到它了在AI领域的深厚积淀。假以时日,文心一言想必还能做得更好。

如果你还有其他感兴趣的问题,可以在评论区留言,我们会帮你问问文心一言。

本文来自华尔街见闻,欢迎下载APP查看更多

AI时代,拥有个人微信机器人AI助手!AI时代不落人后!

免费ChatGPT问答,办公、写作、生活好得力助手!

搜索微信号aigc666aigc999或上边扫码,即可拥有个人AI助手!

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注