专家表示,随着生成式人工智能技术需求的增长,芯片短缺并不是开发定制芯片的主要原因。
据报道,随着生成式 AI需求的增长,微软、谷歌和 AWS 等云服务提供商以及OpenAI 等大型语言模型 (LLM)提供商都在考虑为 AI 工作负载开发自己的定制芯片。
由于芯片短缺,其中一些公司(尤其是 OpenAI 和微软)一直在努力开发自己的定制芯片来处理生成式人工智能工作负载,这一猜测在过去几周占据了头条新闻。
据传 OpenAI 正在寻求收购一家公司来推进其芯片设计计划,而据报道微软正在与 AMD 合作生产一款代号为 Athena 的定制芯片。
谷歌和 AWS 都已经以张量处理单元 (TPU) 的形式开发了自己的人工智能工作负载芯片,以及 AWS 的 Trainium 和 Inferentia 芯片。
但是什么因素促使这些公司制造自己的芯片呢?分析师和专家认为,答案在于处理生成式人工智能查询的成本和当前可用芯片(主要是图形处理单元(GPU))的效率。Nvidia的A100和H100 GPU目前在AI芯片市场占据主导地位。
IDC 研究经理尼娜·特纳 (Nina Turner) 表示:“GPU 可能不是生成人工智能工作负载最高效的处理器,而定制芯片可能有助于其实现目标。”
TechInsights 副主席 Dan Hutcheson 指出,GPU 是通用设备,在矩阵求逆(人工智能的基本数学)方面非常高效。
“它们的运行成本非常昂贵。我认为这些公司正在寻求一种针对其工作负载进行优化的硅处理器架构,这将解决成本问题,”哈奇森说。
特纳表示,使用定制芯片可以让微软和 OpenAI 等公司减少功耗并改善计算互连或内存访问,从而降低查询成本。
根据研究公司 SemiAnalysis 的报告, OpenAI 每天花费约 694,444 美元或每次查询 36 美分来运营 ChatGPT 。
“人工智能工作负载并不完全需要 GPU,”Turner 说,并补充说,尽管 GPU 非常适合并行处理,但还有其他架构和加速器更适合此类基于人工智能的操作。
特纳说,定制芯片的其他优势包括控制对芯片的访问以及专门为法学硕士设计元素以提高查询速度。
开发定制芯片并不容易
一些分析师还将设计定制芯片的举措比作苹果为其设备生产芯片的战略。Forrester 研究总监格伦·奥唐纳 (Glenn O’Donnell) 表示,就像苹果公司为了提高设备性能而从通用处理器转向定制芯片一样,生成式人工智能服务提供商也在寻求专业化他们的芯片架构。
“尽管 Nvidia 的 GPU 目前非常受欢迎,但它们也是通用设备。如果你真的想让事情变得尖叫,你需要一个针对特定功能(例如图像处理或专门的生成人工智能)进行优化的芯片,”奥唐纳解释说,并补充说定制芯片可能是这种情况的答案。
然而,专家表示,开发定制芯片对于任何公司来说可能都不是一件容易的事。
Gaurav Gupta 表示:“投资高、设计和开发生命周期长、供应链问题复杂、人才稀缺、数量不足以证明支出合理以及缺乏对整个流程的了解等挑战,都是开发定制芯片的障碍。” Gartner 副总裁兼分析师。
奥唐纳表示,对于任何刚刚从头开始启动这一过程的公司来说,可能至少需要两年到两年半的时间,并补充说芯片设计人才的稀缺是造成延误的一个主要因素。
大型科技公司收购初创公司以开发自己的定制芯片或与在该领域拥有专业知识的公司合作的例子支持了奥唐纳的观点。AWS 于 2015 年收购了以色列初创公司 Annapurna Labs,为其产品开发定制芯片。另一方面,谷歌与博通合作生产其人工智能芯片。
芯片短缺可能不是 OpenAI 或微软的主要问题
据报道,虽然 OpenAI 正在寻求收购一家初创公司来制造支持其人工智能工作负载的定制芯片,但专家认为该计划可能与芯片短缺无关,而更多的是为了支持法学硕士的推理工作负载,因为微软不断在应用程序中添加人工智能功能并为客户签约其生成式人工智能服务
“显而易见的一点是,他们有一些没有人满足的要求,我认为这可能是一个推理部分,比大型 GPU,甚至顶级 Sapphire Rapids CPU 更便宜,而且运行起来更便宜,而不会让他们受制于任何一个AWS 或 Google,”Omdia 首席分析师 Alexander Harrowell 表示。他补充说,他的观点是基于首席执行官 Sam Altman 的评论,即 GPT-4 不太可能进一步扩展,而是需要增强。与推理模型相比,扩展 LLM 需要更多的计算能力。推理是使用经过训练的法学硕士生成更准确的预测或结果的过程。
此外,分析师表示,收购一家大型芯片设计公司对于 OpenAI 来说可能不是一个明智的决定,因为设计芯片并为生产做好准备大约需要花费约 1 亿美元。
“虽然 OpenAI 可以尝试从市场上筹集资金,但今年早些时候与微软的交易基本上导致以 100 亿美元的价格出售了一半以上公司的期权,其中一些未具体说明的比例是非现金 Azure 积分——而不是一家现金周转的公司的举动,”哈罗威尔说。
特纳表示,相反,ChatGPT制造商可以考虑收购拥有人工智能加速器的初创公司,并补充说此举在经济上更为明智。
Harrowell 表示,为了支持推理工作负载,潜在的收购目标可能是 Groq、Esperanto Technologies、Tenstorrent 和 Neureality 等硅谷公司,并补充说,如果 OpenAI 愿意放弃 Nvidia GPU 并转而使用 SambaNova,SambaNova 也可能是一个可能的收购目标。通过纯云方法在本地进行。