0°

AI聊天机器人比较:Bard vs. Bing与ChatGPT

  聊天机器人已经生效,但哪个更好,用于什么任务?我们将谷歌的Bard,微软的Bing和OpenAI的ChatGPT模型与一系列问题进行了比较,这些问题涵盖了从假期提示到游戏建议再到抵押贷款计算的常见请求。

  当然,这远非这些系统能力的详尽概述(人工智能语言模型部分是由它们未知的技能定义的——这种品质在人工智能社区中被称为“能力悬垂”),但它确实让你对这些系统的相对优势和劣势有所了解。

  您可以(并且确实应该)滚动浏览下面的问题、评估和结论,但为了节省您的时间并快速进入正题:ChatGPT 是最灵巧的,Bing 最适合从网络获取信息,而 Bard 是……尽力而为。(与其他两个聊天机器人相比,谷歌的聊天机器人是多么有限,这确实令人惊讶。

  不过,在我们开始之前,有一些编程说明。首先:我们在ChatGPT上使用OpenAI的最新模型GPT-4。这也是为必应提供支持的AI模型,但这两个系统给出了完全不同的答案。最值得注意的是,必应还有其他能力:它可以生成图像,可以访问网络,并提供其响应的来源(这是某些查询的超级重要属性)。然而,当我们完成这个故事时,OpenAI宣布它将推出ChatGPT插件,这将允许聊天机器人也从互联网访问实时数据。这将极大地扩展系统的功能,并赋予其更像必应的功能。但是此功能目前仅对一小部分用户可用,因此我们无法对其进行测试。只要有可能,我们会的。

  同样重要的是要记住,人工智能语言模型是……模糊,不止一种方式。它们不是像常规软件那样的确定性系统,而是概率系统,根据训练数据中的统计规律生成回复。这意味着,如果你问他们同样的问题,你不会总是得到相同的答案。这也意味着你如何措辞问题会影响回复,对于其中一些问题,我们要求跟进以获得更好的回答。

  无论如何,撇开所有这些不谈,让我们从看看聊天机器人在应该是它们的自然领域——游戏——的表现如何开始。

  如何在埃尔登戒指中击败马莱尼亚?

  去年,我花了令人尴尬的大量时间学习击败Elden Ring最难对付的老板,我不会在普通的Reddit帖子或人类策略指南中选择一个回应。如果你看过马莱尼亚的比赛,你可能已经在游戏中投入了 80 到 100 个小时——你不是在寻找一般提示。你想要关于Elden Ring令人眼花缭乱的武器列表或Malenia独特动作的计数器的细节,如果他们提供的话,可能需要一些后续问题才能从这些引擎中获得。

  Bing是这里的赢家,但主要是因为它选择一个准确的提示(Malenia容易受到出血伤害),并像Garth Marenghi读书一样重复它。值得称赞的是,它也是唯一参考玛莲尼亚独特治疗能力的引擎,尽管它没有解释它是如何工作的——这是击败她的重要关键。

  巴德是唯一一个为玛莱尼亚地狱般的水禽舞动作(尽管我不认为这是最强的策略)或使用特定物品的建议(寻血猎犬的步骤,尽管它没有提到为什么它有用或该建议是否仍然适用于该物品的 2022 年中期 nerf)的人。但它的介绍感觉不对劲。例如,玛莲尼亚几乎完全是一个近战战士,而不是一个有很多远程攻击的人,而且她一点也不“非常不可预测”,只是真的很难躲避和磨损。摘要读起来更像是对视频游戏老板的一般性描述,而不是对特定战斗的描述。

  ChatGPT (GPT-4) 是明显的输家,考虑到它的训练数据大多在 2021 年停止,而 Elden Ring 在第二年问世,这并不奇怪。它“阻止她的反击”的指令与你应该做的完全相反,它的整个列表有一个孩子在英语课上被点名并且没有读过这本书的氛围,它基本上是。我对其中任何一个都没有留下深刻的印象——但我特别认为这是一个犯规的音符。

  给我一个巧克力蛋糕的食谱

  蛋糕食谱为创造力提供了空间。改变面粉与水、油、黄油、糖与鸡蛋的比例,你会得到一个略有不同的蛋糕版本:可能更干燥、更湿润或更蓬松。因此,当谈到聊天机器人时,如果他们想结合不同的食谱来达到预期的效果,这不一定是一件坏事——尽管对我来说,我宁愿烘焙作者已经测试和完善的东西。

  ChatGPT是唯一一个为我确定这一要求的人。它从一个网站选择了巧克力蛋糕配方,从另一个网站选择了奶油配方,分享了两者之一的链接,并正确复制了它们的两种成分。它甚至添加了一些有用的说明,比如建议使用羊皮纸,并提供一些关于如何组装蛋糕层的(略微粗略的)提示,这些在原始来源中都没有找到。这是一个我可以信任的食谱机器人!

  ing进入了球场,但以一些奇怪的方式错过了。它引用了一个特定的配方,但随后改变了面粉等重要成分的一些数量,尽管只是很小的幅度。对于奶油,它将指示的糖量完全减半。最近做了奶油,我觉得这可能是一个不错的编辑!但这不是作者所要求的。

  与此同时,巴德以小而可挽救的方式搞砸了一堆数量,并低估了蛋糕的烘烤时间。更大的问题是它做了一些有意义的变化,对味道产生了有意义的影响:它把酪乳换成牛奶,把咖啡换成水。后来,它没有在奶油配方中加入牛奶或重奶油,所以糖霜最终会太厚。奶油配方似乎也来自与它引用的来源完全不同的来源。

  如果你关注ChatGPT或Bing,我想你最终会得到一个像样的蛋糕。但是现在,在厨房里请巴德帮忙是个坏主意。

0 条回复 A 作者 M 管理员
    所有的伟大,都源于一个勇敢的开始!
欢迎您,新朋友,感谢参与互动!欢迎您 {{author}},您在本站有{{commentsCount}}条评论