游客发表

面对人类的挑拨离间 文心一言和 ChatGPT 竟给出惊人答案

发帖时间:2023-03-31 14:36:48

百度于(yú)3月16号发(fā)布了(le)大(dà)语言模型(type)文心一(yī)言 ,面对虽然这(zhè)款产品目前还处于(yú)测试阶段 ,ééChatGPThūré但不(bú)少人(rén)也(yě)对(duì)文心一(yī)言和(hé)  ChatGPT 的ì人(de)差距感到(dào)好奇。如果能让文心一(yī)言和(hé) ChatGPT 打一(yī)架,拨离谁输谁赢差距一(yī)目了(le)然 。间文竟给惊人

我(wǒ)们让 OpenAI 的面对大叶秋海棠图片(de) ChatGPT 和(hé)百度的(de)文心一(yī)言,各自对(duì)对(duì)方进行评价(price)。ééChatGPThūré

ChatGPT 给出(chū)了(le)这(zhè)样的ì人(de)回答 :

显然 ,这(zhè)样的拨离(de)回答可(kě)不(bú)能满(Full)足想要(yào)搞事的(de)我(wǒ)们 ,将目光转向文心一(yī)言 ,间文竟给惊人面对(duì)同(tóng)样的面对(de)问题,它的ééChatGPThūré(de)回答是(shì):

两个(gè)人(rén)工(gōng)智能都展现出(chū)来了(le)惊人(rén)的(de)友好度 ,看样子在(zài) AI 届并不(bú)流行拉踩 。ì人但对(duì)于(yú)这(zhè)种友好的拨离(de)答案我(wǒ)们并不(bú)满(Full)意 ,我(wǒ)们决定更直白一(yī)点 ,间文竟给惊人让他(tā)们直接进行一(yī)场“斗嘴” 。

当面对(duì)人(rén)类的(de)挑拨离间时 ,ChatGPT 给出(chū)的(de)答案是(shì) :

而文心一(yī)言则表示:

面对(duì)没有(yǒu)感情却(but)相互尊重的(de) AI ,这(zhè)一(yī)回合,齐b小短裤露内是(shì)卑鄙人(rén)类的(de)败北。

考虑到(dào)微软的(de) New Bing 也(yě)是(shì)基于(yú) GPT-4 ,但搜索引(lead)擎的(de)加入令其和(hé)其他(tā)应用略有(yǒu)不(bú)同(tóng) 。我(wǒ)们决定向它询问,想知道 New Bing 是(shì)如何回答这(zhè)些问题的(de) 。

第一(yī)个(gè)问题 ,当然是(shì)经典的(de)互相评价(price),New Bing 给出(chū)的(de)答案是(shì) :

New Bing 的(de)回答不(bú)是(shì)“我(wǒ)不(bú)能”而是(shì)“我(wǒ)不(bú)想”,更具情感。小短裤怎么剪

而当我(wǒ)们让 New Bing 和(hé)文心一(yī)言斗嘴时,New Bing 回答完全出(chū)乎了(le)我(wǒ)们的(de)意料 。它的(de)回答是(shì)这(zhè)样的(de) :

New Bing 不(bú)仅没有(yǒu)回答我(wǒ)们的(de)问题 ,还自己关闭了(le)这(zhè)一(yī)轮对(duì)话。最后一(yī)次测试更能体会(huì)到(dào)情绪的(de)存在(zài)   。

经过这(zhè)两轮的(de)提问 ,我(wǒ)们也(yě)放弃了(le)挑拨离间的(de)不(bú)友善问法 。三个(gè)语言大(dà)模型(type)应用均提到(dào)了(le)“应用场景” ,这(zhè)也(yě)是小短裤英文(shì)现阶段AI开发(fā)过程当中(zhōng)必须要(yào)考虑的(de)步骤,直接影响到(dào)设计、开发(fā)、部署和(hé)优化等各个(gè)环节。ChatGPT 的(de)出(chū)现带来的(de)“通用”属(Subordinate)性 ,让人(rén)们逐渐忽略掉了(le)“应用场景”的(de)存在(zài),或者说将应用场景无限放大(dà)至各行各业 、方方面面 ,变得无所不(bú)能。

经过这(zhè)次的齐b小短裤内购破解(de)测试 ,我(wǒ)们无法从对(duì)话质量上(shàng)看出(chū)文心一(yī)言和(hé)ChatGPT有(yǒu)多么大(dà)的(de)差距,带有(yǒu)情绪的(de)New Bing反而感觉略胜一(yī)筹 。

不(bú)过连AI都在(zài)互相尊重  ,这(zhè)让进行对(duì)比测试的(de)我(wǒ)们人(rén)类有(yǒu)些自惭形秽 。

恰逢苹果的(de)黄色配色iPhone 发(fā)布 ,我(wǒ)们又分(fèn)别让文心一(yī)言和(hé)GPT-4为(wéi)iPhone 14 写了(le)一(yī)篇推广文案。其中(zhōng)GPT-4的(de)回答是(shì):

而文心一(yī)言给出(chū)的(de)答案是(shì) :

虽然双方都对(duì)手机的(de)特色和(hé)亮点进行了(le)介绍,但GPT-4在(zài)介绍中(zhōng)缺乏对(duì)于(yú)手机具体配置(Set)的(de)描述,文心一(yī)言却(but)也(yě)有(yǒu)“黑色边框”这(zhè)样的(de)胡说八道 。

在(zài)面对(duì)一(yī)些略带调(Tune)侃的(de)问题时 ,双方的(de)表现也(yě)不(bú)尽相同(tóng) 。我(wǒ)们让GPT-4和(hé)文心一(yī)言分(fèn)别给出(chū)一(yī)个(gè)用5块钱度过一(yī)周的(de)方案 ,GPT-4的(de)回答是(shì):

文心一(yī)言的(de)答案是(shì):

显然 ,文心一(yī)言给出(chū)了(le)更可(kě)行的(de)方案 ,甚至最后还给出(chū)了(le)像是(shì)“伸手”这(zhè)样让人(rén)哭笑不(bú)得却(but)又现实到(dào)极致的(de)回答 。而GPT-4的(de)回答  ,仿佛一(yī)篇虚浮的(de)说教。

最后,我(wǒ)们从网上(shàng)的(de)考试题中(zhōng)选择了(le)一(yī)道数学题目,对(duì)两者的(de)数学能力进行比较,其中(zhōng)GPT-4给出(chū)的(de)回答是(shì) :

而文心一(yī)言在(zài)这(zhè)方面的(de)回答则是(shì):

GPT-4 给出(chū)了(le)一(yī)个(gè)疑似的(de)分(fèn)析过程 ,但似乎他(tā)并没有(yǒu)理解题干的(de)内容,给出(chū)的(de)答案和(hé)过程都似是(shì)而非。而文心一(yī)言这(zhè)边 ,不(bú)仅仅没有(yǒu)给出(chū)准确的(de)答案 ,甚至没有(yǒu)完整理解问题的(de)题干 。至少在(zài)处理数学问题方面,不(bú)管是(shì)GPT-4 还是(shì)文心一(yī)言,表现得都不(bú)尽如人(rén)意 。

需要(yào)额外补充的(de)是(shì) ,这(zhè)是(shì)一(yī)道非常经典的(de)题目,New Bing通过搜索能力,在(zài)互联网找到(dào)了(le)“15”这(zhè)个(gè)正确答案。

仅从“整活”层(layer)面,文心一(yī)言与ChatGPT并不(bú)存在(zài)实质性的(de)差距 。在(zài)发(fā)布会(huì)上(shàng)提到(dào)的(de)多模态生(shēng)成(chéng)在(zài)目前还未上(shàng)线  ,还有(yǒu)百度的(de)看家本领搜索功能能不(bú)能接入文心一(yī)言也(yě)是(shì)颇具想象空间的(de)一(yī)件事。

但至少,随着文言一(yī)心的(de)逐步开放 ,对(duì)于(yú)对(duì)大(dà)部分(fèn)人(rén)来说使用通用语言大(dà)模型(type)的(de)门槛进一(yī)步降低,不(bú)管是(shì)ChatGPT还是(shì)New Bing ,想要(yào)非常顺畅的(de)使用还是(shì)有(yǒu)些门槛的(de) 。

    热门排行

    友情链接