ChatGPT爆火迄今,英伟达被公认为本次全球AI淘金浪潮的最大“卖铲人”,也是各大媒体和社交平台上讨论度最高的一家AI芯片公司。不过,随着AI热潮持续升温,越来越多厂商也开始在AI芯片领域发力:前有英特尔、AMD等半导体巨头公布新一轮的AI芯片研发计划,后有OpenAI、微软等下游客户推动自研芯片,以打破英伟达的垄断。
微软自研
当地时间11月15日,微软在西雅图举行的Ignite开发者大会上,推出两款定制芯片,以应对不断增加的大模型训练成本挑战,并试图降低提供AI服务的成本。微软表示,新发布的芯片不会出售,仅供支持自己的产品,并作为微软云Azure云计算服务的一部分。
微软最新推出的两款芯片分别为用于加速AI计算任务的Maia芯片,以及采用Arm CPU架构的Cobalt芯片。Maia芯片旨在运行大型语言模型。微软云和人工智能部门执行副总裁Scott Guthrie表示,希望通过优化这款AI芯片来提供更快、成本更低、质量更高的解决方案。据悉,这两款芯片都将于2024年上市。
微软没有透露这些芯片相对于传统芯片具体有多少能力提升的技术细节。但微软Azure硬件系统和基础设施副总裁Rani Borkar表示,两款芯片均采用台积电5纳米制造技术制造。此外,Maia芯片的构建方式与英伟达使用的网络连接技术也有所不同,Maia芯片与标准以太网电缆连接在一起。
事实上,微软推定制芯片早有征兆。2010年时,微软便希望能自研AI硬件。据The information报道,微软至少从2019年开始,便在研发代号为“Athena(雅典娜)”的新AI芯片组,目的是为ChatGPT等大语言模型的训练及推理提供英伟达芯片之外的替代方案。另据Tom’s Hardware消息,Athena使用的是台积电5nm工艺,专为大语言模型训练设计。
曾有知情人士透露,在开发Athena期间,微软为了满足OpenAI的需求,已经向英伟达订购了至少数十万块GPU。而进入9月,随着ChatGPT热潮趋于平缓,不断有市场消息传出微软开始下调英伟达H100显卡的订单量。在微软10月的财报电话会上,“削减成本”一事也被反复强调。
不过,微软推出自研AI芯片并不是希望取代英伟达等厂商。微软表示,明年将为Azure客户提供云服务,这些服务就是运行在英伟达和AMD的最新旗舰芯片上。微软正在AMD的最新旗舰芯片上测试OpenAI最先进的模型GPT-4。
纷纷入局
在芯片供不应求和AI应用需求激增的背景下,微软对定制芯片计划的迅速推进,被外界普遍解读为拥有资源的云计算巨头的不二选择。彭博报告显示,随着OpenAI的ChatGPT等服务的涌入,在未来十年内,生成式人工智能市场有望从2022年的400亿美元激增至1.3万亿美元。
在此之前,亚马逊和谷歌等科技巨头也已经使用了自研芯片,并部分向客户提供。另一个芯片大厂AMD也在不久前推出了最新加速卡Instinct MI300X。在发布会现场,PPT上专门打出一行字——大语言模型专用,这被业界视为直接向英伟达宣战。
据悉,MI300X的高带宽内存(HBM)密度最高可达英伟达H100的2.4倍,高带宽内存带宽最高可达H100的1.6倍,显然MI300X能运行比H100更大的AI模型。
而紧随微软之后,韩国无线运营商SK电信周四在首尔举办科技峰会SK Tech Summit 2023。在这场峰会上,SK集团下属的半导体初创公司Sapeon Inc.宣布,该公司推出了其最新的人工智能芯片X330。
资料显示,Sapeon公司总部位于美国加州圣克拉拉。据报道,韩国巨头企业SK电信、SK海力士、SK Square等是该公司的股东。2020年,SK电信首次开发了Sapeon X220,这是韩国国内首款用于提供高速低功耗AI服务所需的数据中心的芯片。两年后,SK电信将Sapeon业务分拆出来,使其成为总部位于加州的一个独立实体企业,以加速人工智能芯片的商业化。
该公司在声明中表示,X330芯片的计算性能是上一代X220的4倍,能效是其2倍多。Sapeon计划先为主要客户进行测试,并在2024年上半年开始批量生产该芯片。
地位仍在
对于行业来说,越来越多的供应自然是好事,因为AI芯片的缺货已经持续了一段时间。许多行业人士预计,AI芯片短缺至少会持续到明年。“目前英伟达订单能见度已至2024年,高端芯片非常紧缺。以现在的排产进度,就连A800/H800都要到今年底或明年才能交货。短期内,从其受追捧程度来看,唯一影响英伟达高端GPU销量的或许只有台积电的产能。”有芯片从业人士对北京商报记者表示。
更有创始人和投资者表示,即使AI芯片有着落的公司,他们仍然需要等待数周才能使用到。一位AI初创公司的CEO说:“即使你已经预付了费用,也不意味着GPU会在第二天或下周送到你那里,你只能等。”
“英伟达不会永远在大规模训练和推理芯片市场占据垄断地位。”这是特斯拉CEO马斯克对社交问答网站和在线知识市场Quora的首席执行官Adam D'Angelo一条推文的回应,后者写道:“人工智能热潮被低估的一个原因是GPU/TPU短缺,这种短缺导致了产品推出和模型培训的各种限制,但这些都不明显。相反,我们看到的是英伟达的股价飙升。一旦供给满足需求,事情就会加速发展。”
不过,摆脱对英伟达的依赖似乎不是那么容易。除了定制芯片的真实水平需要做进一步考察,微软在会上发布的其他系列更新仍少不了英伟达的身影。比如微软宣布,其Azure将为客户企业提供英伟达新的生成式人工智能模型器。在创道咨询合伙人步日欣看来,这意味着二者之间的合作关系还将扩大,也表明微软并不想完全破坏与英伟达之间的默契。
曾有人坦言,英伟达与其他芯片厂商的差距,是院士与高中生的差别。就如同英伟达CEO黄仁勋所言,英伟达“一直在奔跑”,想要超越巨人的其他芯片厂商只能奋力狂奔。据Khaveen Investments测算,英伟达数据中心GPU 2022年市占率高达88%,AMD和英特尔瓜分剩下的部分。
全联并购公会信用管理委员会专家安光勇也指出,这些企业的发展情况各有差异,但总体来说它们的市场份额还无法撼动英伟达的主导地位。痛点方面,包括芯片制造成本、芯片能效比、产品性能和稳定性等方面的挑战。
北京商报记者 方彬楠 赵天舒