文章主题:内测文心一言, ChatGPT, 人工智能, 自然语言处理

666AI工具大全,助力做AI时代先行者!

原标题:内测文心一言,和ChatGPT差在哪里

245b829c4b3743cebf6ab51fb2d896e6.gif

6e1ba6e5724e45b188258e8bec72ddf1.jpeg

文心一言的初体验,确实还没ready。

作者 | 蔓蔓周

首图来源:thechinaproject

硬着头皮也好,万众期待也罢,北京时间3月16日下午,百度新一代大语言模型文心一言发布了。

怎么说呢,虽然一开始就知道可能会输给GPT-4(李厂长自己说:这个门槛有点高),但还是盼着文心一言好,盼着百度好,盼着中国首个生成式AI产品好。

但伴随着发布会的,是百度港股市值的大跳水,虽然最后回调了一波,但二级市场对中国版“ChatGPT”似乎信心不足。

e57e702005444f818bb8665e59931bfa.jpeg发布会期间百度股价实时数据

在吸收了谷歌Bard发布时的经验教训后,我们提前做好了视频录制并做好准备,然而这并未有效阻止股价的下跌。相反,李厂长以其独特的皮带造型和年轻的面容成为了弹幕留言关注的焦点。

6048c9ea068e415c94f18953a0ebb14a.png被调侃的李彦宏

最近,百度公司发布了一则令人瞩目的新闻。在文心一言新闻发布会结束仅仅三个小时,就有6.5万的企业用户进行了API调用服务的测试。此外,与百度智能云基于文心一言展开的合作咨询数量也达到了惊人的5590条。这一系列数据充分展示了文心一言在业界的强大影响力以及合作伙伴对其的信任度。

01

测试开始,有惊有喜

根据发布会上的展示,文心一言具备五种能力,包括了文学创作、商业文案创作、数理逻辑推算、中文理解、多模态生成。

c1744b60a98f47d290170377522d2029.jpeg

硅兔君拿到了内测邀请码后,第一时间开始了测试。

文学创作

在这场盛大的发布会上,我们紧随时尚潮流,将近期备受瞩目的科幻巨作《三体》作为参考,展示了文心一言在文学创作方面的卓越能力。当面临提出的六个问题时,文心一言都能轻松应对,展现出其强大的实力与才华。

硅兔君用《哈利波特》再考了考他(毕竟都是史诗级巨作)。

对于《哈利波特》的创作背景和作者简介,文心一言刚开始给了一个“省事”的答案。

978bf9bc669b48f58589bf2c2be609ef.png

但我并不满意,又问了一遍,这个版本就明显学术了很多。

59cdda5f98f54aefaf6135a81fdefc89.png

紧接着我问了发布会上同样的问题,让文心一言为续写《哈利波特》提供思路,答得还可以。

dd9ab8e292a847d497430e694a0b81af.png

硅兔君又问了个比较八卦的感情线问题:赫敏和哈利波特之间,有爱情吗?

文心一言给出的答案建议各大明星经纪公司参考一下,以后回应恋情别只会发律师函。

6dad999ea374488f92179beeda85dbdd.png

商业文案创作

针对商业文案创作这块,硅兔君就拿自己做个测试,提问:

如果要新建一个关于硅谷科技创投新闻的自媒体账号,融入“兔”这个字,可以给账号起个什么名字?

de2fd594da1a435c8b065edd02bf2056.png

文心一言给出的答案其实挺赞,考虑到硅谷的属性,甚至也有英文的名字。

VentureBuddies这个名字你别说,你还真别说~

在我给予此名字肯定之后,让我运用文心一言为其撰写简介,画风突然从中文转变为英文,并且神秘地为其设定了一个“近期居家办公”的背景,令人费解。

d160b90cdd294e81b69ec5aa7ee83a4d.png

说实话不咋地,乱七八糟的。

逻辑数理

逻辑数理推算是生成式大模型的一道坎儿,不仅考数理,更考逻辑。

在发布会上,我们展示了ChatGPT在鸡兔同笼问题上的应用。当ChatGPT刚刚上线时,它曾出现过失误。然而,经过我们的测试,文心一言能够发现这些问题并提出纠正意见,从而给出准确的答案。这充分证明了文心一言的强大功能和可靠性。

可当硅兔君尝试问了几个小学生逻辑数学题,文心一言翻车了!

张老师15年前15岁,15年后多少岁?

af4d7324358443ffa0f6545d85b6230c.png

文心一言答错了,怕描述不够清楚又问一遍,依然令人遗憾…

(知道答案的朋友可以评论区见,看看多少人答对)

ed8d6f3987234b5587d18372d7f6c2cd.jpeg

接着问了个更绕的:

一个西瓜进价50元,卖了70元,老板收了100元假币,请问老板一共损失多少钱?

e1d4cd1249ac47d09a24570c93a3da9b.png

这个问题同样问了ChatGPT,它一顿逻辑推理疯狂输出之后,给出了一个不同答案。

1a969a6663eb4d6799d37c3620e15ab7.png

事情变得很有意思了,你们说谁对?

中文理解

在中文理解上,硅兔君用了常被错误理解的成语来提问,结果ChatGPT确实错误地学习了现代用法。

“差强人意”是什么意思?

正确答案

f1321ea92e414f8182dfbe3b803c0c9e.png

错误答案

e12fe5549ec343e1a2240c406ac01195.png

一题见分晓,这一局文心一言完胜了。

多模态生成

最终,也是最为引人入胜的多模态生成技术。硅兔君遵循发布会的语言规范进行了两次尝试,但均未能达到预期效果,不得不承认与GPT-4相比,仍有较大差距。

b9d8255581bb4a60b60e42f4d3a78911.png

在视频制作方面尚未取得实际进展,同时也提供了“无法生成视频”的回应。这不足为奇,因为如果没有相应的解决方案,那么在发布会上使用录像就显得非常合理了,以免出现大型失误现场。

6d6f54225568451c96a41e7912d83fc8.png

还有一个被忽略的点就是编程能力,在发布会上并没有展现,也是ChatGPT的优势之一。硅兔君让文心一言用C语言编一个小游戏,这是它给出的回答:

d513cb519da24c568e6a3acbc21bd5f4.png

02

文心一言 vs ChatGPT

ChatGPT 作为一款人工智能语言模型,虽然在许多方面表现出色,但也存在一些不足之处。首先,在处理复杂问题时,ChatGPT 的回答可能不够准确或深入。其次,由于其基于大型语言模型,ChatGPT 在某些情况下可能会产生语法错误或不连贯的表达。此外,ChatGPT 的训练数据主要来源于英文网络,因此在处理其他语言时可能会出现困难。最后,尽管 ChatGPT 可以提供大量的信息,但它缺乏人类情感和道德判断,这使得它在某些情境下无法满足需求。总之,虽然 ChatGPT 是一款先进的人工智能工具,但我们在使用它时也需要谨慎对待其局限性。

1. 知识库的深度和广度仍需要进一步提高:虽然ChatGPT可以回答各种领域的问题,但它的知识库还不够完备,有些问题可能无法找到合适的回答。

2. 生成式对话的质量还有待提高:尽管ChatGPT可以生成自然流畅的对话,但它的生成式对话还不如人类专业演员,有时可能会出现口误或重复等问题。

3. 某些情况下可能会出现错误或不准确的回答:由于训练数据的限制,ChatGPT在某些情况下可能无法正确理解用户的意图,或者回答内容可能不够准确或恰当。

4. 依赖于预先训练的数据集:目前的ChatGPT主要是基于文本进行对话生成的,如果未来想要扩展功能或使用场景,可能需要更多地依赖于预先训练的数据集,这会增加开发难度和维护成本。

5. 中文表达能力有待改进:作为一个英文名称为GPT的机器学习模型,其中文名称“小微”似乎并没有体现出与真实世界中的Micronesia相关的含义和特点,这可能会影响其普及程度和应用范围。

总之,尽管ChatGPT在许多方面都表现出色,但它也存在一些缺点和局限性。

?以上是文心一言对ChatGPT的评价,把人家的缺点安排得明明白白。

麦克风交给ChatGPT,很遗憾,它好像还不知道文心一言的到来…

总的来讲,百度这波发布,正如李彦宏所说:“因为有市场需求,百度各个产品线,大家都在等着用这样的技术。”

(都在催,不得不赶紧上线)

也如李彦宏所说:“怀胎十月,一朝分娩。”

(我们还只是个孩子)

不过全世界都知道前一天GPT-4的问世,在这个节骨眼上顶着压力发布产品的勇气还是值得肯定的。

硅兔君认为我们需要做的,是再给一些耐心。就如开头说的那样——我们都盼着它好。

文末互动:

对于百度文心一言的发布,你怎么看?

?评论区留言告诉我们你的想法哦~返回搜狐,查看更多

责任编辑:

内测文心一言, ChatGPT, 人工智能, 自然语言处理

aigc666aigc999_0.jpg

AI时代,拥有个人微信机器人AI助手!AI时代不落人后!

免费ChatGPT问答,办公、写作、生活好得力助手!

搜索微信号aigc666aigc999或上边扫码,即可拥有个人AI助手!

Leave a Reply

Your email address will not be published. Required fields are marked *