摘要: 立即掌握CHAT GPT国内使用方法及账号购买指南。详尽CHAT GPT怎么用教程,免费获取CHAT GPT国内版。点击了解更多!
Google在Claude 2发布后,立即宣布了全新版本Bard的发布。这个版本支持多种语言,其中包括中文,让广大网友们可以尽情享受这个新玩具。
本次更新内容概述
这次更新的主要内容包括:
- 支持40多种语言,包括中文(带有图形界面)
- 图像识别功能,需要将显示语言设置为英语
- 对话朗读功能
- 聊天记录和对话分享,可以将代码导出到Replit
- 回复内容可以进行编辑
除了官方公布的这些内容,有网友似乎还发现了一些小问题:
有人发现六月份更新的代码执行功能好像无法使用了。
那么Bard的表现究竟如何呢?下面我们就来详细看看。
弱智吧问题几乎全军覆没
对于支持中文的大型模型,如果没有我们的弱智吧问题,似乎就有些不尊重对手了【狗头】。
首先是一个灵魂拷问:
这个问题既聪明又直接,但是Bard的回答并没有绕过弯路。不过它至少懂得安慰你……
或许是因为对人际关系太过陌生,那么我们换个不涉及人的问题试试:
这个回答……我真的很好奇,到底有没有莲藕是不空心的。
而面对这些未解之谜,Bard也有自己的解释:
你后面说的很有道理,但是「是给盲人看」这个结论又是怎么得出来的呢?
不过Bard也有不上当的时候:
我们确实要「认清事实放弃幻想」,这次Bard总算扳回一局。
总体来看,这个环节中,判弱智吧胜出对各位读者应该没有意见吧?
除了弱智吧问题真的很有趣外,中文的一大特色就是「一字多义」。
例如下面这个经典场景:
人要是行,干一行行一行,一行行行行行,行行行干哪行都行。
要是不行,干一行不行一行,一行不行行行不行,行行不行干哪行都不行。
Bard对这句话整体上理解没有问题,但是拆分出来的解释却让人摸不着头脑。
不过GPT-4在这道题上也没能完全答对:
好吧,那我们再换两个简单的问题。
结果是外甥打灯笼——照旧(舅),整体上Bard的理解没问题,但是一拆开解释就不行了。
无论是弱智吧问题还是一字多义,Bard对中文的理解都给人一种似懂非懂的感觉。
那么在创作方面呢?
我们让它写一个故事试试,故事的质量还不错,就是有点眼熟:
如果莎士比亚还活着,谷歌现在应该已经坐在被告席上了。
看来Bard在中文方面还有很长的路要走。
此外,我们还测试了Bard的阅读理解能力,让它总结一篇论文:
结果Bard给出了三个风马牛不相及的版本,而且都……是……错……的……
(这篇论文实际上是关于RLHF的)
不过,有没有一种可能,人家根本没在说中文呢?
看来是我们的问题太过复杂,让Bard产生了一些错觉……
那我们休息一下,然后看看宣传中的图像识别功能如何吧~
图像识别功能有待提高
有网友表示在图像识别功能上测试了很多内容都失败了:
不过我们还是持着不信邪的态度进行了测试。
要使用图像识别功能,需要在Google账户设置中将显示语言改为英语。
我们找出了之前某个AI绘画工具生成的「四指库克」的图片,看Bard能否识别其中的华点。
这张图片如下:
结果Bard并不支持对人物的图像识别,甚至直接将我们的图片给删掉了……
好家伙,不会做题就把卷子撕了可还行……
不过需要注意的是,如果上传的图片违反了Bard的用户规则,也会被删除。
那我们再换一张图片试试:
即使汤姆猫本猫来了,也会毫不犹豫地认出这是个水杯。
不过,你是怎么从这个白色的logo中看出这是个水杯的呢?
当然,对于水杯这样的物体,很容易被识别,所以我们再来一个有些迷惑性的测试:
果然不出所料,Bard上当了,其实这是个纸巾盒。
「听人劝,吃饱饭」,看来这句话说得一点也没错。
综上所述,在这次Bard的更新中,最值得关注的两个功能都没有达到宣传的效果。
至于代码、数学等其他经典项目,由于Bard这次并没有进行更新,就不再进行测试了。
看来,Google赶超微软在O(penAI)方面迈得还是有些大了。
你认为Bard未来的表现能与CHAT GPT媲美吗?
参考链接: