面对人类的挑拨 文心一言和ChatGPT竟给出惊人答案

首页 > 科技

面对人类的挑拨 文心一言和ChatGPT竟给出惊人答案

来源:龙猫 发布时间:2023-03-18 17:51

百度于3月16号发布了大语言模型文心一言,固然这款产品目前还处于测试阶段,但不少人也对文心一言和  ChatGPT 的差距感到好奇。假如能让文心一言和 ChatGPT 打一架,谁输谁赢差距一目了然。

我们让 OpenAI 的 ChatGPT 和百度的文心一言,各自对对方进行评价。

ChatGPT 给出了这样的回答:

显然,这样的回答可不能满意想要搞事的我们,将目光转向文心一言,面对同样的题目,它的回答是:

两个人工智能都展现出来了惊人的友好度,看样子在 AI 届并不流行拉踩。但对于这种友好的谜底我们并不满足,我们决定更直白一点,让他们直接进行一场“斗嘴”。

当面对人类的搬弄是非时,ChatGPT 给出的谜底是:

而文心一言则表示:

面对没有感情却相互尊重的 AI,这一回合,是卑鄙人类的败北。

考虑到微软的 New Bing 也是基于 GPT-4,但搜索引擎的加入令其和其他应用略有不同。我们决定向它询问,想知道 New Bing 是如何回答这些题目的。

第一个题目,当然是经典的互相评价,New Bing 给出的谜底是:

New Bing 的回答不是“我不能”而是“我不想”,更具情感。

而当我们让 New Bing 和文心一言斗嘴时,New Bing 回答完全出乎了我们的意料。它的回答是这样的:

New Bing 不仅没有回答我们的题目,还自己封闭了这一轮对话。最后一次测试更能体会到情绪的存在。

经由这两轮的提问,我们也抛却了搬弄是非的不友善问法。三个语言大模型应用均提到了“应用场景”,这也是现阶段AI开发过程当中必需要考虑的步骤,直接影响到设计、开发、部署和优化等各个环节。ChatGPT 的泛起带来的“通用”属性,让人们逐渐忽略掉了“应用场景”的存在,或者说将应用场景无穷放大至各行各业、方方面面,变得无所不能。

经由这次的测试,我们无法从对话质量上看出文心一言和ChatGPT有多么大的差距,带有情绪的New Bing反而感觉略胜一筹。

不外连AI都在互相尊重,这让进行对比测试的我们人类有些自惭形秽。

恰逢苹果的黄色配色iPhone 发布,我们又分别让文心一言和GPT-4为iPhone 14 写了一篇推广案牍。其中GPT-4的回答是:

而文心一言给出的谜底是:

固然双方都对手机的特色和亮点进行了先容,但GPT-4在先容中缺乏对于手机详细配置的描述,文心一言却也有“玄色边框”这样的胡说八道。

在面对一些略带调侃的题目时,双方的表现也不尽相同。我们让GPT-4和文心一言分别给出一个用5块钱渡过一周的方案,GPT-4的回答是:

文心一言的谜底是:

上一篇:哪里借款安全... 下一篇:两女子眼睛里...
猜你喜欢
热门阅读
同类推荐