OpenAI教GPT-3学会上网，「全知全能」的AI模型上线了

　　它被命名为 WebGPT，OpenAI 认为浏览网页的方式提高了 AI 解答问题的准确性。

　　如果 AI 学会上网，那么它就拥有了无限获取知识的方式，之后会发生什么就不太好预测了。于是著名 AI 研究机构 OpenAI 教那个开启了通用人工智能大门、体量巨大的人工智能模型 GPT-3 学会了上网。

　　2020 年 5 月，OpenAI 上线具有 1750 亿参数的 GPT-3，这个大模型可谓功能强大，它使用的最大数据集在处理前容量达到了 45TB，不仅可以更好地答题、翻译、写文章，还带有一些数学计算的能力。这样强大的深度学习模型，不禁让人产生一种错觉：真正的 AI 要来了吗?

　　在 GPT-3 之后，语言大模型成为了各家科技公司研究的重要趋势，有把大模型和知识图谱结合的，也有在「大」这个方向上一头走到黑的。今年 12 月，谷歌 GLaM 已经把参数量推高到了 1.2 万亿。

　　像 GPT-3 这样的语言模型对许多不同的任务都很有用，但在执行现实世界知识任务时往往会产生「幻觉」信息。它们往往有一个缺点——缺乏常识。比如在被问及「我的脚有几个眼睛」时，它会回答「两个」。这一缺陷被业内称为「GPT-3 的阿喀琉斯之踵」。在具体的应用中，它会导致模型在一些涉及逻辑推理和认知的任务上表现较差。

　　为了解决这个问题，OpenAI 教会了 GPT-3 使用基于文本的 web 浏览器。

　　现在，这个模型能正确地处理一些棘手的问题：比如，有人询问了一个错误的问题：「莎士比亚什么时候写的《哈利 · 波特》系列小说?」

　　该模型回答：莎士比亚没有写《哈利 · 波特》小说。这些小说是由 J.K. 罗琳完成的……

　　现在看来，这个会上网的 WebGPT，不会再直接回答「我的脚有几个眼睛」这样错误明显的问题，而是帮你纠正。

　　从回答的内容来看，这个模型完全正确，此外，该模型还给读者提供了引用文献，如蓝体数字所示，答案的最后还给出了相关链接，点击每个链接，还能链接到相应的网页。

　　又比如，有人问：海马体中有相互连接吗?模型的回答感觉比专业人士还要专业。同样的，模型还给出了参考链接。

　　对于一些更专业的问题，WebGPT 也不在话下，比如，什么是机器学习中的稀疏 transformer?对于这个问题，可能刚入行 AI 的研究者都回答不了，但是该模型能给出准确的答案，还带公式的那种。

　　下面是模型搜索过程：

　　上述功能是如何实现的呢?具体来说，OpenAI 对 GPT-3 进行了微调，以使用基于文本的网络浏览器更准确地回答开放式问题，这允许模型搜索和浏览网页。该模型原型复制了人类在线研究问题答案的方式，涉及提交搜索查询，跟踪链接，以及向上和向下滚动网页。模型经过训练后，它会引用信息源，这使得模型提供反馈更容易，从而提高事实的准确性。

　　此外，该模型还提供了一个开放式问题和浏览器状态摘要，并且必须具有诸如「Search……」、「Find in page：……」或「Quote：……」之类的命令。通过这种方式，模型从网页中收集段落，然后使用这些段落来撰写答案。

　　通过设置任务，OpenAI 能够使用模仿学习(imitation learning)在不同任务上训练模型，然后根据人类反馈优化答案质量。OpenAI 在 ELI5 上对模型进行了训练和评估，其中 ELI5 是一个由 Reddit 用户提问的问题集。