日前,Hugging Face 创始人 Clem Delangue 参与了一场访谈,过程中谈到了以下几个关键问题:
Hugging Face 的创始故事
大模型 AI 未来会如何迭代?
大公司闭源会对开源社区产生影响吗?
驱动大模型进步的核心是什么?
通用大模型和专用小模型有优劣之分吗?
现阶段如何进行更具竞争力的 AI 创业?
Hugging Face 是全球最大的 AI 开源社区,被称为 AI 领域的 GitHub,成立于 2016 年,团队近 170 人,总部位于纽约。
目前平台上有超过 20000 个开源数据集,超过 10 万个 demo,一万多家公司使用平台上开源的 AI 技术。Hugging Face 的官方介绍是:构建未来的 AI 社区。
Clem Delangue 是 Hugging Face 的 CEO&联合创始人。最早 2010 年在 eBay 工作 8 个月,第一次创业经历是 2011 年在 Moodstocks——为计算机视觉构建机器学习。该公司被谷歌收购。2013 年到了美国纽约负责建立 mention 营销和增长部门。2016 年创立 Hugging Face。从事人工智能工作约 15 年。
01
Hugging Face 的创业起源
Elad Gil:先告诉我们一下 Hugging Face 的起源,以及你是如何开始参与其中的,它最初是什么样的,是如何变成今天的样子?
Clem Delangue :正如你所说,我其实从事 AI 相关的工作很长时间了。在今天它变得如此热门和流行之前,Hugging Face 的三位创始人聚集在一起,是为了构建技术的一种新范式,我们对此感到非常兴奋。当我们成立公司时,我们想要做一些科学上有挑战性的事情,因为我们的一位联合创始人 Thomas 有相关技术背景,但同时也要有趣。
我们一开始制作了一个 AI 虚拟宠物,类似于娱乐版 ChatGPT。
当时有 Siri 和 Alexa,但我们认为仅关注生产力是非常无聊的,这个项目我们做了将近三年。我们在这个想法上筹集了第一笔种子轮融资,不少用户真的很喜欢它。他们跟这个宠物进行了数十亿次的聊天,但这种情况是自然而然地发生的,我可以稍后再讲这个故事。
我们从那个项目转变为现在的状态,也就是最受欢迎的开源 AI 平台。
Elad Gil:你最初是怎么对 AI 产生兴趣的?人工智能这些年也经历了不同的流行潮流,AlexNet 的卷积神经网络模型激发了很多新的,比如 CNN(卷积神经网络)和 RNN(循环神经网络)等,你是在 15 年前从事这个领域,你在那之前就开始感兴趣还是?
Clem Delangue :当时我们甚至还没有称之为人工智能或机器学习。
我工作的第一家创业公司叫做 Mood Stocks,我们在设备上为计算机视觉进行机器学习。构建了一种技术,用手机对物体拍照并识别它。对我来说,意识到人工智能如何真正释放新的能力,是当我遇到这个创业公司的创始人。
那时我在 eBay 工作,他们告诉我说,你们收购的这家名为 Red Laser 的公司,用于识别条形码并拉起 Ebay 页面,你们太弱了,应该使用机器学习。不要识别条形码,实际上可以识别物体本身。
我当时觉得他们疯了,这是不可能的。你不能用传统的软件做到这一点,而他们实际上正在使用某种形式的机器学习来做到这一点。所以那时我意识到,哇,可以用这种新技术做很多新的事情。这实际上把我带到了今天的位置。
Elad Gil:所以你开始了 Hugging Face 的创业,你们想做一个 AI 虚拟宠物。我觉得很有趣的是,以前你说人工智能时人们会嗤之以鼻地说,不,那是机器学习。现在随着一些系统能够做到的事情,术语又回到了人工智能。那是什么让你们决定朝着与当时的设想完全不同的方向去做 Hugging Face 呢?
Clem Delangue :这是一个很自然而然发生的事情。Stripe 的创始人 Patrick Collison 曾说重要的不只是创建公司,而是有一些改变公司轨迹的创业时刻。
对我们来说,这要归功于我们的联合创始人之一 Thomas Wolf,他在某个周五晚上突然提到了谷歌推出的 BERT 模型,基于 TenserFlow 让它的表现不是太好,Thomas 想把它移植到 PyTorch 上试试。
我们跟他说你自己玩得开心就行。
周一他跟我们说他做好了,并且在 Github 上发布了这个项目,我们发了一条推文,还得到了 1000 个赞。
当时我们就是无名小卒。我们很困惑,人们为什么会喜欢这个这么小众和技术向,一条关于 PyTorch 移植的 BERT 的推特。肯定是有一些原因的。
我们决定继续尝试,尝试往 Github 上加了一些其他的模型。慢慢的社区开始基本成型,人们开始给我们的 Github 的仓库提 bug 和修复漏洞,添加其他模型,比如第一个 GPT 的模型。接下来模型添加的速度越来越快,最终,我们拥有了最受欢迎的 AI GitHub 仓库,这就是我们从最初的想法到现在的转变的原因。
Elad Gil:你能为大家描述一下 Hugging Face 今天是什么,它如何使用,产品和平台以及生态系统的重要性吗?
Clem Delangue :很高兴我们现在是大家最常用的开源 AI 平台,你可以把它想象成一种 AI 的 GitHub。
就像 GitHub 是一个公司托管代码、协作代码、共享代码、测试代码的平台一样。我们也是一样,但是是针对机器学习的。在 Hugging Face 平台上托管了 100 多万个仓库,其中大多数是开源的模型。所以你可能听说过 stable diffusion、T5、BERT、Whisper 等。平台上有超过 20000 个开放数据集可供使用。还有 demo,平台上托管了超过 100000 个 demo。超过 15000 家公司正在使用该平台将 AI 引入其功能、产品或工作流中。
Elad Gil:在我们征集到的很多问题里,大家问的最多的问题是 Hugging Face 的未来发展方向。因为考虑到 Hugging Face 目前如此引人瞩目的成绩,有很多方向可以选择:B 端定制、B 端托管、工具类或者其他类型的产品,目前你们主要在做哪些方向的产品?
Clem Delangue :我们目前正在追求两个主要方向。第一,我们看到人工智能正在从一些狭窄的技术,解决一些问题,转向成为构建所有技术的默认范式。
对于我们来说,这意味着从目前平台上正在使用的文本、音频、文生图模型,正在扩展到每个领域。
例如,上周我们开始看到第一个开源的文本到视频的模型,我们也开始在平台上看到很多时间序列模型,例如用于金融预测、用于预估城市交通状况等。还看到越来越多的生物化学模型。因此,确保我们支持这些广泛的 AI 用例是第一步。
第二步,是让每个人都更容易地构建 AI,包括软件工程师。
在过去,我们的平台更多地是为机器学习工程师和那些真正训练模型、优化模型、评估模型的人设计的。但是,我们现在看到,尤其是随着 AI API 的出现,每个人都想做 AI,甚至是复杂的软件工程师、产品经理、基础架构工程师。因此,我们的重点之一以是降低使用我们平台的门槛。因为最终,我们认为每个公司或每个团队都应该能够使用开源来训练自己的模型。
今天每个人都在谈论 ChatGPT、GPT-4。但我认为,在几个月或几年后,每个公司都将建立自己的 GPT-4,并以同样的方式训练它们自己的 GPT-4。如果每家公司都有自己的代码库,代码库的数量与公司数量一样多。
我们认为,明天每家公司都将拥有自己的模型、自己的机器学习能力,而不是将其外包给其他人,而是真正拥有这些能力,以使他们能够区分自己,迎合他们特定的受众或特定的用例。
02
AI 今天的进步
要归功于开源
Elad Gil:每次平台迭代,你都会发现有三四件事情发生了变化。编写系统的输入和输出方式在某些方面发生了变化,或者至少你处理的数据类型发生了变化,用户可访问性和界面 UI 发生了变化。如何从移动设备与桌面设备进行交互是不同的。这种转变的规模和影响是巨大的。如果我们将人工智能视为一个新的平台,你如何看待你提到的每个人都将拥有他们自己的 GPT-4。
似乎编程本身的性质在某些时候可能会发生变化,我们可以把整个问题放在一边,不讨论我们是否也创造了一个数字物种,也许我们在最后讨论这个问题。
但是 Hugging Face 在这个巨大的平台转换中扮演什么角色?
Clem Delangue :是的,我们看问题的方式是,我们非常喜欢 Andrej Karparthy 的软件 1.0 的比喻,这是我们过去 15 年来构建技术的方式和方法。
现在人工智能是软件 2.0 时代。
这是一种新的方法,一种新的构建所有技术的方法。这是一个新的范式,构建所有技术的新范式。如果你考虑这一点,就需要更好的工具,更适应的工具来做到这一点。你需要更好的社区,需要团队合作的方式,整个生态系统需要合作的方式。
这就是我们想要提供的,一种新的工具,一种新的协作平台,以更好地构建人工智能。我们也试图建立一个我们为止兴奋的未来。我认为很多人现在对人工智能感到害怕,对它的潜力和风险感到担忧,我们所思考的问题是,如果你能建立一个每个人都能理解和构建人工智能的未来,就能消除很多这些的风险。
例如,你减少了带有偏见的系统的可能性。你为监管机构提供工具来实际制定保障措施,并为公司提供能力,使他们使用和提供给用户和客户的系统与他们的价值观保持一致。最终,你希望 Stripe 能够说,这是我们的价值观,所以这就是我们如何基于这些价值观构建人工智能的方法。所以这也是我们正在努力做的重要事情。我们有时说我们的使命是民主化的机器学习,我们正在为此而努力,因为我们认为这对世界很重要。