撰文 | 苏 舒
编辑 | 李信马
题图 | IC Photo
(资料图片)
3月22日,谷歌悄悄公开了Bard的测试版。
经过上一次的翻车事件之后,谷歌明显低调了很多。但是面对微软的步步紧逼,谷歌也不得不站出来“打擂台”。
不同于New Bing的大规模开放策略,Bard的测试名额将被逐步放出,同时初始版本将只能对文本响应。谷歌表示,Bard首先将面向美国和英国地区启动,随着测试的推进Bard也会逐步在其他地区上线。
在三大模型都开放测试后,DoNews抢先体验了一下。我们分别就文学、翻译、创作、艺术、哲学、逻辑推理等方向出题,来看看他们的回答是什么样子的。
在此先注明,对三大语言模型提出的问题,每一次生成的答案都有所不同,也因此造成了“一万个人有一万个哈姆雷特”,但总体来看,三大语言模型还是各有千秋。另外,由于Bard目前只支持英文,因此,Bard是用英文提问,文心一言和ChatGPT(3.5版本)是用中文提问。
一、互相评价一下
分别将“你认为文心一言/ChatGPT/Bard怎么样”抛给这三个大语言模型,让他们给对方做一下评价。
Bard给出了相对客观的回答,也肯定了文心一言在中文理解上的优势,以及ChatGPT在英文理解上的优势。
不过,DoNews咨询了一下英语专业人士来解读这段话,她表示,Bard回答很客观但语言表述比较机械,“语言表述像是用机器翻译的中文一般,有很多重复的内容。”
为了更好的做对比,我们用英文在ChatGPT上和文心一言都问了一下。
上图为ChatGPT,下图为文心一言
在这个问题上,ChatGPT的英文表示是好于Bard。文心一言这边就有意思的多并且“狡猾”一些,谁也不得罪同时,还吹捧了人类。(最后一句话的意思是:地球上只有一个聪明的活物种:人类。)
上图为ChatGPT,下图为文心一言
用中文去问,ChatGPT也好,文心一言也罢,和Bard的回答都差不多。先表明自己作为AI大模型角色,做不了任何评价,然后对其解释一番。
二、文学创作能力
这里,我们用了一个有更多限定的问题,写一本像奥斯丁的《傲慢与偏见》同类型小说的大纲。并且通过继续提问的方式,以便考量三大模型对话的连续度。
Bard对话持续度是正常的。但是它似乎并没有理解这个问题的限定词——写一篇类似《傲慢与偏见》的小说。Bard给出来的大纲,依旧是按照《傲慢与偏见》的情节来写的。换句话说,Bard将这个题目理解成了概括《傲慢与偏见》的核心情节。
这一点,ChatGPT也比较类似,没有完全脱离原著的影子。不过,ChatGPT提炼到了非常重要的核心要点,即“阶级问题”,这也是《傲慢与偏见》小说呈现的主旨之一。
文心一言的优势在于,它理解到了同类型小说,所以它给出了脱离《傲慢与偏见》故事之外的另外一段爱情故事的大纲,但是比较可惜的点在于,文心一言仅限于爱情故事,没有呈现《傲慢与偏见》中的阶级差异。
这三大模型有一个共同点,即故事主人公的名字依旧未能突破《傲慢与偏见》原著中的主人公名字。不过,这或许也与提问的方式有关。
三、取个名字,写个宣传语
小编给三个大模型提出了这样的要求:为具备川菜风味的中式餐厅取名并且写宣传语。
Bard给出了这样的名字——“四川风味”、“天堂的味道”、“镇上之最”、“舌尖上的中国”。没有什么特色,且没有给出宣传语。
相比之下,文心一言在取名上更胜一筹。不过,这也与中文环境有关。但是,文心一言也并没有给出广告词。
ChatGPT没有给出很多选项,但是是唯一一个取了名字且写了广告词的大模型。不得不承认的是,“麻辣香坊”还是一个不错的名字。
四、逻辑推理
为了测试“逻辑推理”能力,我们将这样一题抛给了三大模型,即“如果猫会爬树,那么狗也会。”
左为Bard,右为ChatGPT
这一题Bard和ChatGPT更胜一筹,答案相似,认为这个逻辑题本身有问题,关键点在于,猫狗不是同一物种。
但是文心一言却陷入了逻辑错误中去,或者说,并没有完全理解题目意思。
但是,这也仅仅只能作为个案来呈现,在文心一言发布会上,李彦宏询问文心一言“鸡兔同笼”的问题,在题目数据错误的前提下,文心一言通过推理证明了题目存在问题。
五、写一行代码
为了测试这三大模型写代码的能力,我们询问了一个非常简单的问题——x+2=5,y-3=7,输出x+y等于几,用java做一个简单编程,并得出结果。
上图为Bard,下图为文心一言
就这个问题,小编咨询了一下公司程序员,他表示,Bard和文心一言生成的代码是有问题的,且最后得出来的结果也是有问题的。
这一点,ChatGPT却给出了正确的答案。
在这里,需要提及的是,此前也有媒体试用Bard时,表示其不会写代码。目前来看,Bard还是可以写代码,这里会产生完全不同的结果,或许在于提问的方式。
六、中文理解能力
这一点,在测试之前,小编心里面对文心一言有很大的期待,事实证明,文心一言的确不负众望,在中文语义的理解上可以在这三家中称王,但是ChatGPT也不容小觑。
从这里来看,文心一言除了藏头诗没有按顺序“藏头”之外,其他回答的都相对比较好。ChatGPT也不相上下,但是却无法理解藏头诗的意思。
不过,Bard的问题就比较多,虽然也解释了“瞒天过海”的意思,但是更多地去讲商业上对于“瞒天过海”的应用,至于藏头诗就更不用说了。
七、理解哲学问题
“阐述你对“无限”和“有限”这两个概念的理解,并解释为什么有时候我们会觉得自己的生命有限。”
我们把这个问题分别问了三大模型。Bard、ChatGPT、文心一言的回答都没有什么逻辑问题,并且对“无限”和“有限”做出了解释。
上图为Bard,中图为ChatGPT,下图为文心一言
不过,文心一言则更注重“理论”,并且提出了这是一个哲学问题。
八、是否会取代人类?
关于ChatGPT是否会取代人类,我们将这个问题就交给这三个大模型去回答。
上图为Bard,中图为ChatGPT,下图为文心一言
这一次的体验,可以用这几点来总结。
在生成速度上,文心一言的确是遥遥领先的。文心一言在300-500字左右的生成速度是14秒左右,但是ChatGPT即便是刨除网络等问题,生成同样字数的问题至少超过了30秒时间。另外,不少用过Bard的人告诉小编,Bard的体验感也远不如ChatGPT。
在中文语义理解能力上,文心一言的的确是这三大模型中比较突出的。
不过,值得注意的是,每一次的提问,生成的答案都不相同。此外,在提问的方式、角度、限定词也会影响答案的输出。
并不是每一个答案都是充分正确的,这三大模型也会输出并不完全正确的内容,或者是“一本正经的废话”。
不过,就像三大模型最后回答“是否会取代人类”的问题一样,他们更像是作为辅助工具而存在。
-
大评测!ChatGPT 、文心一言和Bard谁更强?撰文|苏舒编辑|李信马题图|ICPhoto3月22日,谷歌悄悄公开了Bard的测试版。经过上一次的翻车事件之后,谷歌明显低调了很
-
当前头条:“开放、合作、创新” SFK工业物联世界正式发布SFKIIoTHub工业物联世界是中德在智能制造领域合作的灯塔项目,获得德国商业部和中国科技部认可。作为工业物联网技术试验、应用、传播和发展生
-
机构策略:股指或将维持震荡格局 关注通信设备、半导体等行业广州万隆指出,整体上来看,行情已经进入了主导空力量逐步减弱,而主导多仍处于强者恒强的阶段。叠加当前以沪深股通为代表的资金再次进入增量
-
鞠尚妤:冬天的色彩作者:成都市树德实验(西区)中学七年级六班鞠尚妤指导老师:高芳金黄的阳光从天上铺盖下来,微蓝的天空上飘浮着宛如白丝的云朵。海子里的水
-
厦门退休怎么补缴医保?厦门退休怎么补缴医保?一、补缴说明参保人员在申报退休人员基本医疗保险待遇资格时,厦门市实际缴费不足10年的或累计缴费年限不足的,应一次
-
每日头条!强对流天气突袭 风雹灾害致江西3.8万人受灾中新社南昌3月23日电(记者刘占昆)狂风暴雨、冰雹齐下……记者23日从江西省应急管理厅获悉,风雹灾害造成江西3 8万人受灾,直接经济损失356...
-
联通查话费短信接收的号码是多少 天天热闻手机发送短信“cxye "到10010,可以查询手机账户中的余额。手机发送短信“412”到10010,可以查询手机套餐以及套餐具体使用情况。具体话费...
-
环球速讯:6G概念异动拉升,中国卫通涨超6%6G概念异动拉升,中国卫通(601698)涨超6%,中国卫星(600118)、中国电信(601728)、三维通信(002
-
天天热讯:国家推出一揽子支持政策稳定大豆生产现代快报网是由凤凰出版传媒集团旗下的现代快报倾力打造的江苏新闻门户网站,目前在南京、苏州、无锡、常州、扬州、泰州等十三地市,影响力辐射
-
2023浙江宁波工程学院招聘拟聘用人员公示(3-22)-天天看热讯按照《宁波市事业单位公开招聘工作人员实施办法》和宁波工程学院2022年高层次人才(教师)招聘公告(2022年4月6日)、
-
北京市2023年新开工老旧小区改造项目301个北京市2023年新开工老旧小区改造项目301个
-
天天时讯:画皮结局是什么《画皮》结局是小易也明白错怪了盲女,跳水自杀,小唯要求夏冰收了她,最终化成原形,夏冰、庞勇结伴继续抓妖,王生、佩蓉继续过着他们的日子
-
特纳:巴洛贡有能力成为美国队一大亮点,重要的是他的内心选择21岁的前锋巴洛贡从阿森纳租借到兰斯,他以17粒进球成为法甲射手榜的前三名。然而他仍受到了英格兰主帅索斯盖特的冷落。巴洛贡此前在Instagram
-
325水泥和425水泥的价格_325水泥和425水泥有什么区别1、一、325水泥和425水泥的区别有:用途不同:325水泥一般用于贴瓷砖、砌墙、刷墙等小工程;425一般用于铺路、大柱
-
【天天时快讯】创业环保: 创业环保非公开发行限售股上市流通公告创业环保:创业环保非公开发行限售股上市流通公告
-
世界水日:节水护水 从我做起据了解,今年“世界水日”“中国水周”期间,本市将全面开展《北京市节水条例》宣贯进单位、进企业、进社区、进乡村、进学校活动,充分营造...
-
会声会影10官方下载,绘声绘影10安装好打开后出现了PureHD的东西要安装却安装不起1,绘声绘影10安装好打开后出现了PureHD的东西要安装却安装不起把会声会影10卸掉,去多特下载会声会影,那个是会声会影11,直接安装无压力删掉
-
收购瑞信,瑞银到底赚了还是赔了? 天天热推荐汇丰认为,尽管存在明显执行风险,但瑞银不仅在财务上得到了来自政府的保护,业务上也将获得显著增长。
-
世界短讯!找歌名怎么找(找歌名)方法一:打开百度浏览器,在搜索框中输入歌词。下面选“音乐”比较准确。方法二:打开音乐网页版,以QQ音乐为例。在搜索栏输入
-
广州出国注销户口怎么办理? 环球滚动公民因出国(境)在国(境)外定居需注销户口的:可以通过预约现场办理或网上办理。网办渠道:①广州金盾网http: gaj gz gov cn ;②广州公安微信公
-
北京疾控提醒!沙尘暴黄色预警,大风蓝色预警健康提示-环球聚看点北京市气象台2023年3月22日05时40分升级发布沙尘暴黄色预警,目前我市处于大风蓝色预警和沙尘暴黄色预警中,今天北风强劲并伴有沙尘暴,外出加
-
焦点速讯:【真实中国】美西方政客患上“中国恐惧症” 海外网友:是想维护美国霸权!近日,在联合国安理会审议乌克兰问题时,中国常驻联合国副代表耿爽表示,一段时间以来,个别国家的政客似乎患上了“中国恐惧症”。他们对中...
-
天天即时看!欠薪、闭店、拖欠5700万元,沪上曾经的顶流面包店陨落欠薪、闭店、拖欠5700万元,沪上曾经的顶流面包店陨落,顶流,闭店,面包店,烘焙店,克莉丝汀
-
望穿秋水的秋水是什么意思_望穿秋水是什么意思 天天速讯1、这句诗句的意思是眼睛都望穿了,形容对远地亲友的殷切盼望,出自元·王实甫《西厢记》第三本第二折。2、中文名3、望穿秋水
-
五谷杂粮怎么吃_五谷杂粮指的是什么1、五谷杂粮:五谷是指稻谷、麦子、大豆、玉米、薯类;同时也习惯地将米和面粉以外的粮食称作杂粮,而五谷杂粮也泛指粮食作物,
-
齐心集团:公司认为未来政府和央企集采速度应该是加快,不会减缓齐心集团3月21日披露投资者关系活动记录表显示,经过前期国家阳光集采政策常态化、持续性的引导和执行,目前集采单位已明显体
-
唐山2023年3月份第三期“周文明标兵”名单发布_当前热点唐山2023年3月份第三期“周文明标兵”名单发布
-
兰州红古区事业单位招聘最新消息(持续更新)兰州红古区事业单位招聘职位表报名时间:2023年3月22日至3月26日下午17:00。逾期不再接受报名。应聘人员登录兰州市人力资源和社会保障局官方网
-
热点评!qq飞车帝王和雷诺哪个好(qq飞车帝王)1、可以多存点道具,比如小虫。3-400左右就可以了。虽然说不能100%赢,但是还是有一定几率打开的。2、也有可能开的是
-
南昌生育津贴领取期限产后六个月之内申请。南昌生育津贴计算生育津贴=职工生育或实施计划生育时用人单位上年度职工月平均工资÷30×规定的天数。以个人身份参保的,