就像是一只鲶鱼,ChatGPT正推动全球AI产业化进程全面提速。
ChatGPT可被广泛应用于多领域,AIGC是其中一个被看好的方向。中信证券研究院日前发表报告认为,ChatGPT中短期内产业化的方向,主要为文字模态的AIGC应用、代码开发相关、图像生成领域、智能客服四大板块。其中,AICG属于有望率先落地的情况。
在近日举办的第十二届中国数字出版博览会上,中文在线集团董事长兼总裁童之磊,澜舟科技创始人兼CEO、世界级AI科学家周明博士,清华大学新闻与传播学院教授、元宇宙文化实验室主任沈阳,围绕“AIGC未来内容范式革命”主题进行相关讨论。
去年9月,在ChatGPT还未风行之前,中文在线与澜舟科技在AIGC领域展开了合作,主要在如何再内容创作中有效发挥生成式人工智能(Generative AI)作用,以及基于预训练模型技术的文学创作辅助算法领域进行探索。
这一次,双方将AIGC技术扩展至了漫画、动画、视频等IP衍生业务领域的新型内容生产方式上,并将共建AIGC技术在文学创作领域的辅助技术,进行商业化尝试。
不只是聊天工具,ChatGPT是“下一代AI操作系统”
ChatGPT作为AIGC的一种产品形态,“聊天”功能只是表象。
童之磊认为,ChatGPT核心是一套人工智能自然语言处理(NLP)系统,它所呈现出来的自然语言交互能力,其本质是“下一代人工智能的操作系统”。
实际上,ChatGPT从模型角度来讲并没有革命性、超越性变化,但确实它的一些模式上有很大突破。
就像键盘之于个人电脑,触屏之于智能手机,自然语言交互对于进入人工智能时代至关重要。由于目前计算机系统与人类之间的交互,只能通过代码等“非自然语言”,所以让机器能够理解人类的自然语言,是人工智能领域的重要研究课题之一。
ChatGPT在全球范围内引起轰动,表面上看是因为它能跟人“聊天”,能够根据聊天对象提出的要求,进行文字翻译、文案撰写、代码撰写等工作。
但是,真正让一众互联网巨头纷纷入局的理由,是它能够通过学习和理解人类语言来进行对话,它是一个“以自然语言为界面”的机器人。人工智能的自然语言操作系统已初见雏形,人工智能驱动的产业变革,也即将拉开新一轮的序幕。
周明表示,ChatGPT这件事给团队带来很大的启发。一是,它交互非常流畅,对用户意图理解非常精准;二是,它有一定的推理能力,回答有层次感,有一定的分析,有一定的事实性。ChatGPT的出现,使我们看到了人工智能的曙光,尤其是自然语言处理作为人工智能皇冠上的明珠,它会引领下一代人工智能的发展,这个信号越来越强烈了。
在追赶ChatGPT的方向上,沈阳、周明和童之磊有同样的看法。他们认为,中国需要更懂中文、更懂中国、更懂中国人的ChatGPT。
沈阳认为,以ChatGPT为代表的AIGC正在彻底改变世界。在正在到来的人工智能产业革命中,无论是出于宏观的AI信息安全的需要,还是基于中文操作系统下中国人工智能产业发展的考虑,中国都需要自己的ChatGPT。
除了大国竞争层面“AI数据安全”的考量,中文的人工智能自然语言操作系统本身就有很强的独特性。
从技术角度,ChatGPT缘于美国公司OpenAI,训练文本以英语为主,缺乏中文优质内容数据学习素材。此外,想做出精确表达中文情绪与意义的AIGC,还需要深谙中文的人工标注员,对模型做高度的针对性训练。中国公司在这一点上有得天独厚的优势。
周明告诉钛媒体APP,ChatGPT的出现,对我们中文处理以及中国带来很多挑战。最大的挑战是,我们从技术上大概落后2-3年,从数据上也有一些缺失。
此外,童之磊则对钛媒体APP表示,虽然ChatGPT非常火,但是它有一个问题是,它需要消耗大量的算力,这是通用型操作系统必然造成的,当它想解决所有问题的时候,它一定要求这个模型非常复杂,它训练一次成本也会非常高。
中国的科技公司要如何赶超ChatGPT?
周明认为,需要做“中国特色的下一代人工智能之路”,但难题是,中国在算力方面没有优势,数据方面,通用数据方面优势不明显。
中国的一大优势是人才,但是我们缺乏的是科技界创新的领军人才。如果我们把众多的编程人才、研究人才,引入或者自我培养发现一些领军人才结合起来,是有可能在这个领域先追赶,然后再实现超越。
他分析,目前国内的“速胜论”和“悲观论”都不可取,从中文垂直领域切入最有可能实现反超。在与ChatGPT竞争的过程中,在垂直领域、专业赛道进行布局,先在一个领域做出成功案例,再复制到其他行业,应该是一个更理性的选择。
AIGC如何变革内容创作新范式?
正如印刷机之于报业,声光技术之于电影,每一次技术的变革,都助推内容产业进入一个新的时代。
童之磊认为,内容产业的下一个变革机会一定是AI。ChatGPT里程碑式的技术突破,将会大大推动人工智能在内容领域的全面变革。
在接受钛媒体APP采访时,童之磊表示,AIGC有三大要素:数据、预训练模型、商业化产品。数据是后两者的源头,高质量的训练数据决定了AIGC的质量,以及,未来是否能通过用户买单的商业化产品,让人工智能成为可持续发展的技术路线。
在他看来,AI训练的核心资源是数据,AIGC想要取得优秀的生成效果,离不开大量高质量数据的训练,拥有并后续能够持续获得优质中文数据的公司,将在AIGC浪潮下获得先发优势。
童之磊对AIGC在内容行业发展有两层构想:“辅助阶段”和“创新阶段”。
通过对专用模型的训练和迭代,构建起针对文学生产领域的专业AI技术模型,辅助创作文学作品,加快创作者的效率。在AI模型的持续进化下,将进一步激发中文在线的内容创作和生产、以及用户产品应用的创新,颠覆现有的内容生产模式,重塑数字内容生产和用户交互方式,带来内容体验生态的全面进化。
周明透露,他们正在构建一个专门用于网文写作的平台,虽然不一定取名ChatGPT。这个平台将具备了两个方面的能力。
首先是写作的生产过程中助要素的助力能力,包括助写、渲染、续写、语法检查,甚至是出海方向上的网文翻译。目前,这一系列工具已经基本齐备,还在基于新的技术,以及新的数据把它功能进一步完善。
此外,是用户意图的理解,然后产生新的分发机制。ChatGPT是一个大型的通用的人工智能模型,未来,会有Chat引擎加上若干个功能引擎,基于操作系统的形式调动不同的引擎,用户的使用需求加减各种能力。这将是他们的产品会和ChatGPT不一样的地方。