当地时间3月14日,OpenAI公开发布大型多模态模型GPT-4,与ChatGPT所用的模型相比,GPT-4不仅能够处理图像内容,且回复的准确性有所提高。目前,GPT-4没有免费版本,仅向ChatGPT Plus的付费订阅用户及企业和开发者开放。
一个能够理解照片的人工智能
据OpenAI官方介绍,GPT-4支持输入的内容不再仅限于文字,而且支持图像内容的输入,成为一个能够理解照片的人工智能。
比如输入一张图片,然后提问“我可以用这些食材做什么?”GPT-4给出的回答也是开放性的:你可以用这些食材做什么,有很多选择!一些可能性包括:煎饼或华夫饼;法式吐司;煎蛋饼;奶油布丁;蛋糕或纸杯蛋糕;松饼或面包;饼干。
GPT-4最后还表示:“这些只是几个例子,但可能性是无穷的!”
值得一提的是,除了普通图片,GPT-4还能处理更复杂的图像信息,包括表格、考试题目截图、论文截图、漫画等,例如根据专业论文直接给出论文摘要和要点。
OpenAI称,公司花费6个月的时间,利用对抗性测试程序和ChatGPT的经验教训迭代调整GPT-4,从而在真实性、可操纵性和拒绝超出设定范围方面取得了有史以来最好的结果,“至少对我们而言,GPT-4训练运行前所未有地稳定,成为首个能够提前准确预测其训练性能的大型模型。”
未来,也许ChatGPT不仅仅是支持图像的输入,可能支持视频的输出。
“它并不完美,但你也一样”
OpenAI官方表示,GPT-4由于其广泛的通用知识和解决问题的能力,可以更准确地解决难题。
GPT-4比以往任何时候都更具创造力和协作性。它可以生成、编辑和迭代用户的创意和技术写作任务,例如创作歌曲、编写剧本或学习用户的写作风格。
GPT-4在高级推理能力上超越ChatGPT。在律师模拟考试中,ChatGPT背后的GPT-3.5排名在倒数10%左右,而GPT-4考到了前10%左右。
此外,GPT-4的长度限制提升到32K tokens,即能处理超过25000个单词的文本,并且可以使用长格式内容创建、扩展对话、文档搜索和分析等。
OpenAI还贴心地发布了GPT-4开发者视频,手把手教你生成代码、检查错误信息、报税。OpenAI联合创始人兼总裁布罗克曼(Greg Brockman)还说了句有点扎心的话:“它并不完美,但你也一样。”
目前仅向ChatGPT Plus付费用户开放
与免费的ChatGPT不同,GPT-4目前仅向ChatGPT Plus的付费用户开放,它也将作为API(应用程序编程接口)提供给企业及开发者,开发者需进入等候名单上,将该模型集成到他们的应用程序中。
OpenAI开源了Evals框架,以自动评估AI模型性能,允许用户报告模型中的缺点,帮助其改进。OpenAI工程师在介绍说,“GPT-4 是世界第一款高体验,强能力的先进AI系统,我们希望很快把它推向所有人。”
不过,GPT-4仍然不是完全可靠的,比如会对事实产生“幻觉”,并出现推理错误。OpenAI提醒,在使用语言模型的输出时,特别是在高风险的情况下,应该非常小心谨慎。
“为了明确这些风险的具体情况,我们聘请了50多位来自人工智能对接风险、网络安全、生物风险、信任和安全以及国际安全等领域的专家对该模型进行对抗性测试。”
OpenAI表示,这些领域专家的反馈和数据为缓解和改进模型提供了依据,比如他们已经收集了额外的数据,以提高GPT-4拒绝有关如何合成危险化学品的请求的能力。