文章主题:五月四日, 百度, 李彦宏, 算力
在5月4日的内部活动演讲中,百度创始人、董事长兼首席执行官李彦宏指出,虽然算力可以购买,但创新能力却无法购买,需要依靠自身努力打造。然而,从当前的情况来看,我国的AI领域尚未出现广泛认可的产品,真正意义上的突破仍需时日。🚀
出品| 微果酱(wjam123456)
作者| 陈出木
🎯最近,李彦宏中国在一次演讲中透露,他们的文心一言内部测试已经进行了一个多月,成功完成了四轮大规模的技术升级。这一系列举措使得大模型的推理成本大幅降低,甚至降低了十倍。换句话说,他们在推理性能方面取得了近10倍的提升。🚀🕓当其他公司还在思考如何展开训练时,我们已经在大规模推理方面取得了显著的成果。这充分展示了我们在人工智能领域的领先地位和强大实力。💪🤖文心一言的成功升级,不仅彰显了我国在AI技术研发上的创新力,也进一步证明了我们对于推动人工智能进步的坚定决心。我们相信,通过不断的技术突破和优化,文心一言将为广大用户提供更加高效、智能的服务。🌟💡事实上,自文心一言内测启动以来,我们已经取得了许多重要的进展。在未来,我们将继续努力,为广大用户提供更优质的产品和服务,共同推动我国人工智能事业的发展。🚀
这十分自信里,不知道产品体验能占几分?
相较于Bing(必应)突然全面开放,文心一言现在仍然处于内测阶段,此前申请过内测资格的小伙伴们正在排队体验,如果申请成功将收到短信通知。
“文心一言”与”Bing”的界面颇为相似,但对AI新手而言,前者在对话框中提供了便捷的提问模板插入功能。用户只需输入”/”,便可快速获取撰写报告、绘制图表以及查询相关知识等问题的模板。
那么,文心一言和Bing相比如何呢?果酱妹替大家测试了一下~
01#
中文理解
鉴于文心一言宣称自己“擅长中文”,果酱妹向它提问了一个经典的中文脑筋急转弯——能否把大象放进冰箱。但文心一言的脑筋似乎并不能很好地“转弯”,回答认为大象不能放进冰箱。
在深度引导下,我们将原先的问题进行了更为常见的调整,变成了“将大象放入冰箱需要多少步骤”这个标准谜面。只有这样,文心一言才能为我们提供果酱妹所期望的解答。同时,我们也仿佛没有忘记这是一个需要脑筋急转弯的问题,因此在回答的过程中,还不忘提醒我们要“务必确保大象的舒适”。🐘🍇
🍓果酱妹向Bing提出了相同的问题,然而Bing却能够洞察到:“这是一个著名的连环谜语”,无需任何引导就能精准地回答提问者真正想要了解的信息。
脑筋转不了弯没关系,那么作为中文写作的辅助工具
,文心一言的表现如何呢?
果酱妹将体验文心一言的选题任务交给了它,直接生成的文章近似于初中生写作水平,但遣词造句显得生硬,需要后期进行人工优化。
而面对果酱妹提出的细化要求,文心一言展现了简单在原文章中加了一段的偷懒操作。
在对话中,当果酱妹提出“细化”的问题时,文心一言表现出听懂指令的能力,然而却以“婉拒”的方式回答,依然输出了原始内容。这表明,尽管文心一言具备一定的理解和回应能力,但在某些情况下,它可能无法完全满足用户的需求,需要进一步的优化和改进。
相比闪现反骨的文心一言,Bing更像是在乖巧中透着敷衍。面对写文章的要求,Bing总是会先推荐相关阅读文章,不打算接茬写稿,等到提问者进一步要求,它会在认真交互一轮之后给出一篇不太及格的短文。
可见,两者对于文字工作都只能做到汇总网络资料的程度,更进一步则还是得依靠人类进行编排和串联。而再细看会发现,文心一言生成的文章比Bing生成的文章会多一些连接词和过渡句,更加符合中文创作习惯。
这一点在果酱妹让两者用“天气真好”作一首藏头诗时也有所体现。
Bing显然不太能理解“藏头诗”,给出的结果差强人意,只是反手给了一个可用的“藏头诗在线生成器”链接。
而文心一言在传统文化领域基本完胜,轻松生成符合要求的藏头诗。
02#
信息检索
作为都是接入了AI的搜索引擎,对于普通用户来说,信息检索或许是用得最多的功能。这就要求AI输出的回答必须是准确的,否则其他功能玩得再花也难以获得大众的青睐。
在测试过程中,对于确定的信息,诸如某本书的作者、某个名人的生日等,文心一言和Bing都可以轻松驾驭。但如果提问最近的新闻或网络热梗等,两位AI都可能会给出错误的答案。
比如关于“GPT-5什么时候发布”这个问题,此前有诸多媒体报道将在今年发布,实际上OpenAI的创始人在前几天对此作了辟谣。
而显然,文心一言只注意到此前的信息,忽略了最新的内容。
Bing也犯了同样的错误。
03#
AI绘画
在这个环节的测试中,果酱妹让文心一言和Bing分别画画:
画一幅画:一位扎着马尾辫的美少女在阳光下奔跑,二次元画风,色彩丰富,展现出快乐、自由的感觉,穿着白色背心、黄色短裤、白色运动鞋
Bing首先表示自己不能画画,但可以提供找灵感的渠道以及网络图片集合。
就提供的图片搜索结果来看,和果酱妹提出的要求属实差得有点远。
而有AI绘画平台文心一格支撑着的文心一言,在经过几轮交互、引导之后,能给出一张满足部分要求的画作。过程中,文心一言出现的较大缺陷集中在AI一直难以驾驭的手部和眼睛细节。
04#
解答数学题
果酱妹找了几道数学题给两个AI试手,结果半斤八两,稍稍需要逻辑能力的题目基本都无法解答。
文心一言属于一本正经胡说八道型,一堆数学符号之后得出错误答案。
在投喂了正确答案之后,文心一言通过错误的算式强行得出既定答案。无论果酱妹如何质疑,文心一言都保持着礼貌但瞎说的解题态度。
Bing则属于碰运气的差生,同样的题目首次解答错误,在得到答案之后就顺利地推导出了过程。
但当果酱妹兴致勃勃地提问了更难的题目之后,Bing便招架不住了,也出现了强行推导既定答案的情况。根据其底部出现的来源,果酱妹猜测是因为Bing没有组卷网的会员,所以没办法输出正确答案。(这一刻简直能与AI共情)
05#
经过对文心一言和Bing的不完全测试,大家会发现,两者仍然存在差距,但差距并没有大家想象的那般如鸿沟。
目前AI普遍做不来的任务,文心一言和Bing都无法解决。而在AI的功能舒适区中,文心一言的交互会让你感受到AI的生硬感,Bing的应答则更加流畅。
但作为一款工具,实用性应该在第一位。两者都属于接入AI的搜索引擎范畴,最关键的是能够解决用户提出的问题。就目前来看,完全依赖AI作答,以替代人工检索,暂时还不能够实现,如果只是作为工作辅助,它们确实已经展现出一定优势。
可以说,经过一个多月的内测,文心一言有了更多的语料投喂,确实表现出了成长的效果。但其优势如果只有对中文的理解,普通大众很难放弃同样支持中文且经过更长时间训练的Bing。
不过,现在下定论仍然过早,文心一言还在发展初期,让我们期待其正式开放那天,看看是否如李彦宏所说完成了国产AI的自建。而退一万步说,比起Bing,文心一言的最大优势应该是不需要科学上网吧。
AI时代,拥有个人微信机器人AI助手!AI时代不落人后!
免费ChatGPT问答,办公、写作、生活好得力助手!
搜索微信号aigc666aigc999或上边扫码,即可拥有个人AI助手!