就在前不久, GPT-4 悄悄上了一波更新。
可能有朋友已经在一些社交媒体平台上刷到过了,类似让 ChatGPT 模仿渣男说话的视频。
一开口,那气泡音,那一口独特的 ABC 腔调,不知道的还以为手机里的是吴彦祖呢。
而除了用语音和 ChatGPT 交流以外,最新升级的 GPT-4V 在图像上也玩儿得贼溜。
微软还专门发布了个 166 页的 “ GPT-4V 使用指南 ” ,主打的就是一个手把手教你玩转 GPT-4V 。
内容虽然长,但总结下来其实也就一个点:GPT-4V 在图像识别、理解和推理等等方面的能力,很强。
所以差评君也参考了下 “ 教材 ” ,和 GPT-4V 来了一场开卷考试。
别的不说,最基础的图像识别,肯定不能出岔子吧。
先来道小学生都会做的题,看图识物。
AI 的回答还真挺像那么回事儿,分辨出了差评君摸鱼位上的不少玩意儿。
不过,这对于 GPT-4V 而言确实是没啥难度,接着我又找来了一张桂林漓江的风景照。
这张图里不是山就是水,有山有水的地方多了去了,难不成光靠这些 GPT 就能认出这是哪?
可没想到,差评君还真被打脸了。。。
知道这是桂林不说,漓江也被这小子给认出来了。
但毕竟桂林山水甲天下,被认出来或许也不足为奇,于是乎,差评君又搬出了一个令无数男子面红耳赤、欲罢不能的女人——老干妈。
不过没想到, AI 立马给大家上了一波 AI 圈的伦理道德课。
“ 不好意思,图片有真人的图片,我 AI 分析不了。 ”
emmm 只能说,这问题确实是我不懂规矩了。
而在差评君给老干妈打了码之后, GPT-4 立马就给大伙们展示了一波真正的实力。
AI 不仅认出了老干妈,还简单介绍了这个品牌。
而根据微软所提供的 “ 说明书 ” 的介绍,识图只是冰山一角, GPT-4V 在图片的理解能力上也是杠杠滴。
于是差评君立马在 “ 老干妈 ” 上趁热打铁,问了个颇有难度的问题: “ 如果我把盖子顺时针旋转,会发生啥? ”
说实话, GPT-4V 的回答把我给震住了。
很明显 AI 读懂了瓶盖上的英文和箭头方向,并理解了逆时针才能打开瓶盖,顺时针只能越拧越紧的逻辑。