百度明天要发布中国版的Chat GPT文心一言,但大洋彼岸的Chat GPT又放大招了,Chat GPT4要来了。试用过的猎豹移动董事长兼Ceo傅盛感慨,Chat GPT4能力太恐怖了,不仅能看懂文字,还能读懂图,考试超过90%的人类,每个人都要拥抱这次技术浪潮。
相关讨论很快就冲上了微博热搜第一,在境外社交媒体甚至更热,几乎全世界的人都在讨论。
ChatGPT4能看图会作文,考试超过90%人类
离发布仅仅四个多月,在ChatGPT展现了惊人的实力之后,OpenAI又扔下了一颗核弹:GPT-4发布了。
在博文中,OpenAI写道:我们创建了GPT-4,这是 OpenAI 努力扩展深度学习的最新里程碑。GPT-4 是一个大型多模态模型(接受图像和文本输入,提供文本输出),虽然在许多现实世界场景中的能力不如人类,但在各种专业和学术基准上表现出人类水平。
OpenAI的总裁和联合创始人Greg Brockman展示了GPT-4的真正实力——总结文章、写代码、报税、写诗……GPT-3.5做不到的,GPT-4轻松拿下。
对于学霸来说,真正的对手来了,这次不是人类,而是机器人。
OpenAI让GPT-4在参加了许多项人类的通用考试,结果证明,它在许多测试和基准测试中的表现比前一代确实大大提高:根据他们的测试结果,GPT-4的SAT分数增加了150分,现在能拿到1600分中的1410分;
它能通过模拟律师考试,分数在应试者的前10%左右,相比之下,GPT-3.5的得分在倒数 10% 左右;
ChatGPT4考试成绩超过九成人类
在SAT阅读考试中和SAT数学考试中,GPT-4的成绩都能达到领先的排名……
此外,GPT-4还有了一个质的飞跃——可以开始处理图像。
ChatGPT4能读懂图了
经常使用ChatGPT的人肯定知道,它只能处理文本,但GPT-4开始接受图像作为输入介质。
在OpenAI提供的一个示例中,GPT-4准确地回答了几个网络meme为什么搞笑的问题。
GPT4可以识别出来这是个VGA接口以及这图为啥好笑(GPT4:这张图片中的幽默来自将过时的大型VGA连接器插入小型现代智能手机充电端口的荒谬做法。)
不过,目前图像输入的权限尚未公开,所以目前还没看到更多例子来证明GPT-4在图像方面的处理能力。
此外,GPT-4已经开始具备一点点的幽默感。它已经可以讲出一些模式化的、质量不咋样的冷笑话——但是,至少它已经开始理解“幽默”这一人类特质。
OpenAI的总裁和联合创始人Greg Brockman,就亲自展示了GPT-4的真正实力——总结文章、写代码、报税、写诗……GPT-3.5做不到的,GPT-4轻松拿下。
在演示中,Brockman就使用使使用“系统”框,让GPT-4相继成为“ChatGPT”、“AI编程助手”、“TaxGPT”,来解决不同的问题。
ChatGPT模式下,GPT-4可以处理超过2.5万字的文本,可以轻松地总结一篇超长文章的核心内容,比如把OpenAI今天发布的这篇讲述GPT-4的雄文总结要点。
甚至还可以像在演示中的那样,以各种奇怪的形式来提炼它——比如,以全是“G字母开头”的单词来总结。
或者要它把这些内容要点写成一首诗。
在“AI编程助手”模式下,还可以让它轻松写代码,生成一个网站,或者更复杂的,写一个基于Discord的机器人,如果出现错误,比如要调用比较新的API而出错,甚至也不需要向它解释,而是把错误代码复制进去,它就会自动纠错,生成新的代码。
或者要它变身成TaxGPT,要它基于税务法则,来计算出一对夫妻要缴纳多少税,而且还要把计算理由一步步写出来,让人们可以检阅。
傅盛试用之后感慨:它太牛了,是整个世界的生产力变革
“chatGPT4非常非常的恐怖,是整个世界生产力的变革,一个技术浪潮的来临,先拥抱它!”猎豹移动董事长兼CEO傅盛在试用过之后感慨,每个人都要关心新的AI,新的ChatGPT。
猎豹移动CEO傅盛感慨chatgpt4太恐怖了
尽管GPT-4在推出后的短短几个小时里凭借它的强大实力引爆了科技圈,它的开发者也指出其中的一些局限。比如尽管在答案的准确程度上有了明显提升,它有时依旧会“捏造事实”,因此在使用时需要人为进行事实的验证。
虽然GPT-4这波能力大升级,但之前ChatGPT会出现幻觉、胡说八道的毛病还是没能完全改掉。从前面的官方示例也可以看出,要想最大程度发挥GPT-4的能力,最好还是用上思维链路提示(Chain-of-thought Prompt)。操作起来也非常简单,只需在提问的时候额外提醒AI给出步骤,就能大大提高推理和计算的准确率。
当然,除了表现方面,还有一个明显的不同是,ChatGPT-4比以前的版本“更大”,这意味着它已经接受了更多数据的训练,因此运行起来也更加昂贵。OpenAI只表示它使用了微软Azure来训练模型,但没有公布有关具体模型大小或用于训练它的硬件的详细信息。
这也意味使用它的成本越来越高。与ChatGPT不同的是,这个新模型目前还不能免费公开测试,虽然它鼓励开发者申请试用,但是将需要上等待名单。
新模型将提供给ChatGPT的付费用户ChatGPT Plus(每月20美元),也将作为API的一部分提供,允许开发者付费将AI集成到他们的应用程序中。OpenAI表示,多家公司已经将GPT-4集成到他们的产品中,包Duolingo、Stripe和Khan Academy等。