“人机交互是强烈影响全球商业版图的技术领域,每一代交互方式都产生了全球巨头……下一步可能就是ChatGPT操作系统了,这个影响就太大了。”
本周是人工智能带给世界变革的一周。当地时间3月14日,ChatGPT的开发机构OpenAI正式发布其具有里程碑意义的多模态大模型GPT-4。当天,谷歌宣布将生成式AI装进其Workspace“全家桶”。16日,微软宣布将GPT-4融入旗下一系列办公软件工具,称“人类与电脑的交互方式迈入了新阶段”。
对于GPT-4的公布和微软的大动作,澎湃科技(www.thepaper.cn)采访了业内多位专家。法国里昂商学院人工智能管理学院(AIM)院长、全球商业智能中心(BIC)主任龚业明表示,比较遗憾的是GPT-4的技术报告没有透露过多技术细节,这为模型的保密设置了一个负面的先例。而微软的办公软件融入GPT-4会引发企业办公领域的实质性革命。“下一步可能就是ChatGPT操作系统了。”他说,“亚洲企业当年没有抓住图形用户界面的操作系统Windows,这次可能又痛失机会。而且微软还是和OpenAI关系最紧密的企业。”
AIGC(人工智能生成内容)领域企业“比邻星球”的创始人兼董事长段志云认为,从安全角度考虑,如果有一个AI能把互联网上的所有信息都搜集到一起,然后再去处理,实际上会有一个很大的信息安全隐患,所以国内一定会推自主可控的AI能力。
澎湃科技:GPT-4的更新哪些是情理之外,哪些是情理之中?
陈逸君(上海人工智能研究院研究员):我读了OpenAI发布的长达98页的技术报告。GPT-4发布速度之快在我的意料之外,但它的性能升级方向却在情理之中。
GPT-4最重要的升级当然是对多模态的支持,这极大扩展了AI的应用场景和可能性。人们可以把一些简单的想法和创意用草图或者简单图文的形式告诉AI,让它去创作音乐、歌词和绘画等。多模态的组合完全是1加1大于2的效应,在GPT-4的辅助下,人们的工作效率会极大提高。
此外,相比ChatGPT,GPT-4回答问题的正确性和对细节的把握都得到了提高,这种提升也大幅改善了用户体验。OpenAI在报告中把这种提升归功于“更多的数据和计算”,从GPT的迭代技术路线来看,这是可以预见的改进。
龚业明(法国里昂商学院人工智能管理学院院长、全球商业智能中心主任):应该说GPT-4的更新非常符合我的期望。市场反应也比较良好。GPT-4的局限性与早期的GPT模型相似:它可靠性不高(所谓“幻觉”问题),上下文窗口有限。但这也是完全符合期望的,我没有期望OpenAI会在短期内解决问题。
比较遗憾的是最近发布的关于GPT-4的技术报告没有透露过多技术细节,如模型大小、参数、训练数据或训练方法,所有这些都很难审查或复制。同时,可能存在版权问题,存在关于数据质量的问题,这为模型的保密设置了一个负面的先例。而早期的GPT模型,相关技术信息已经发布。
澎湃科技:之前微软德国公司的CTO安德烈亚斯·布劳恩透露,“我们将在下周推出GPT-4,它将是一个多模态模型,会提供完全不同的可能性——例如视频。”为何在GPT-4的发布时似乎没有提及视频?
段志云(比邻星球创始人兼董事长):视频还是会更复杂一点。现在的技术路线下,视频其实就是很多张图,单张图的生成或读取已经完全没有障碍了,但视频信息量要大得多,比图片更接近真实环境,这是个计算量的问题。
澎湃科技:对OpenAI有什么看法?
孔蓉(天风全球前瞻产业研究院联席院长):它的组织文化有一个对于未来世界的愿景,不只是短期盈利为目标,而是有很强的一个关于如何改变世界的目标。在这样一个大的愿景之下,拢聚了一群想要改变世界的人,然后才是创造这个产品。我觉得这是需要关注的,国内可能原有的环境是相对比较希望快速出结果。但其实有一些公司更关注的是人类未来的机会和发展,从人类福祉的角度思考,才做出一个产品。
澎湃科技:那么国内是什么情况?
段志云:首先我觉得不能预期太高,毕竟是在比较有限的时间之内尽可能把效果做好。第二,也不用太悲观,因为比赛才刚刚开始,相当于OpenAI刚刚探索出了正确的方向,迈出了那一步,只是发令枪打响刚刚开始跑。它的确有优势,尤其在欧美市场上有非常明显的优势。但再跑一段时间,在应用和商业模式都越来越丰富之后,其实还是充满可能性的。
澎湃科技:在GPT-4的中文表现如此好,同时中文语料库质量可能不那么令人满意的情况下,是否还有必要做中文大模型?
段志云:我认为有必要。首先从安全角度考虑,如果有一个AI能把互联网上的所有信息都搜集到一起,然后再去处理,实际上会有一个很大的信息安全隐患,所以国内一定会推这样自主可控的AI能力。而且从GPT-3开始就不开源了,也就是说对所有的使用者来讲,甚至使用的国家来讲,它就完全是个黑盒,所以你其实不知道背后有什么没有什么。从这个层面上,我们肯定得有国内这种自主可控的模型。哪怕可能会落后一点,但也得迎头赶上。
其次,我觉得盲目去跟OpenAI对标没有意义,毕竟他们是先行者。中文的好处是全世界的使用规模不小,如果能在中文里有差异化优势也是不错的。语料库的问题,其实是中文互联网上容易被查询到的信息可能质量不够高,但不代表没有这样的数据。这其实是个信息孤岛的问题,大家慢慢都意识到这些数据的重要性之后,可能很多分割的数据库就会开放。有了这件事情,我觉得会鼓励全行业把数据做更多互通。
澎湃科技:怎么看GPT-4对这个领域可能产生的影响?
龚业明:最直接的影响是对人机交互的影响。从第一代交互方式命令行界面(Command-Line Interface),到第二代交互方式图形用户界面(Graphic User Interface),到ChatGPT代表的第三代交互方式自然用户界面(Natural User Interface)。人机交互是强烈影响全球商业版图的技术领域,每一代交互方式都产生了全球巨头。
微软正在将OpenAI的大语言模型整合到其Microsoft 365产品中,这是对产业影响特别大的一件事,引发企业办公领域的实质性革命,对服务业有巨大影响。下一步可能就是ChatGPT操作系统了,这个影响就太大了。亚洲企业当年没有抓住图形用户界面的操作系统Windows,这次可能又痛失机会。而且微软还是和OpenAI最紧密的企业。
其他国家和美国在信息产业的差距可能进一步拉大。ChatGPT的护城河很高,和芯片制造有类似之处,你知道原理没有条件也制造不出来。