AIGC熱潮正在拉動(dòng)算力中心基礎(chǔ)設(shè)施的支出

如果說(shuō)有哪種事物絲毫不受通脹態(tài)勢(shì)的抑制,甚至在一定程度上加劇了全球經(jīng)濟(jì)的通脹壓力,那必然就是生成式AI。從我們目前掌握的關(guān)于全球服務(wù)器和存儲(chǔ)支出的有限數(shù)據(jù)來(lái)看,AI基礎(chǔ)設(shè)施支出似乎已經(jīng)成為服務(wù)器和存儲(chǔ)領(lǐng)域的收入支柱。相比之下,面向其他類型工作負(fù)載的數(shù)據(jù)中心設(shè)備基礎(chǔ)支出則每況愈下,目前的銷售態(tài)勢(shì)甚至不及今年年初。
坦白講,核心服務(wù)器與存儲(chǔ)市場(chǎng)正在陷入衰退。這是因?yàn)槠髽I(yè)暫停行動(dòng),超大規(guī)?;A(chǔ)設(shè)施運(yùn)營(yíng)商仍在“消化”去年年底已經(jīng)采購(gòu)的基礎(chǔ)設(shè)施。行業(yè)內(nèi)唯一仍然保持旺盛活力的,就只有AI系統(tǒng)以及伴隨而來(lái)的爆發(fā)式需求增長(zhǎng)。
事實(shí)上,傳統(tǒng)HPC仿真與建模社區(qū)一直都?jí)粝胱尅案咝阅苡?jì)算”迎來(lái)這樣的爆發(fā)式增長(zhǎng),但卻從來(lái)未能如愿。其實(shí)這頗有幾分遺憾,因?yàn)槿藗兤毡檎J(rèn)為,HPC在幫助我們創(chuàng)造新成果或修復(fù)舊方案時(shí)的貢獻(xiàn)要高于生成式AI。更不要說(shuō)生成式AI中還潛藏著一種巨大隱患——直接在“適當(dāng)?shù)臅r(shí)候”消滅無(wú)數(shù)工作崗位。正因如此,亞馬遜公司首席執(zhí)行官Andy Jassy在討論全球經(jīng)濟(jì)的長(zhǎng)期趨勢(shì)時(shí),才總把這種威脅掛在嘴邊。
有點(diǎn)跑題了,但大家要記住上述前提條件,咱們繼續(xù)對(duì)數(shù)據(jù)中心基礎(chǔ)設(shè)施市場(chǎng)展開(kāi)分析。
大學(xué)物理教授曾經(jīng)教導(dǎo)我們,在開(kāi)始解決問(wèn)題之前要先對(duì)答案做個(gè)粗略的估計(jì),并在處理過(guò)程中不斷糾正錯(cuò)誤。因此讓我們從今年夏初的傳聞?wù)f起,即英偉達(dá)在整個(gè)2023年內(nèi)只能生產(chǎn)約50萬(wàn)個(gè)“Hopper”H100 GPU。
假設(shè)英偉達(dá)的合作渠道商制定的H100 GPU平均售價(jià)為3萬(wàn)美元,那么單憑H100銷量就能支撐起150億美元的收入。IDC等公司也是據(jù)此計(jì)算季度收入數(shù)字的。但如果假設(shè)隨著2023年的推進(jìn),這50萬(wàn)個(gè)H100 GPU在各季度的分布并不均衡(例如第一季度生產(chǎn)18%,第二季度生產(chǎn)22%,第三季度為27%,第四季度為33%),那么在合理的增長(zhǎng)猜測(cè)之下,H100 GPU單在2023年第二季度就能帶來(lái)33億美元銷售額。而如今的普通數(shù)據(jù)中心系統(tǒng)往往要搭載8個(gè)這樣的GPU,同時(shí)匹配與英偉達(dá)DGX H100類似的內(nèi)存、閃存和網(wǎng)絡(luò)接口。由此可知,這些基于H100的GPU型系統(tǒng)將帶來(lái)約52億美元的總銷售額。再加上英偉達(dá)其他加速器和可以進(jìn)行大規(guī)模矩陣數(shù)學(xué)計(jì)算的在售加速器,也許其單憑AI熱潮就能斬獲約70億美元的收入數(shù)字。
下圖所示,為我們整理的粗略估算表,僅供大家參考:

根據(jù)IDC公布的歷史數(shù)據(jù),在這波生成式AI浪潮之前,服務(wù)器的平均售價(jià)為7000美元——數(shù)字來(lái)自機(jī)器學(xué)習(xí)占據(jù)AI主流,大規(guī)模HPC系統(tǒng)保持穩(wěn)定,IBM剛剛對(duì)大型機(jī)/Power Systems進(jìn)行升級(jí)的2021年。(這也是IDC最后一次向公眾發(fā)布季度服務(wù)器跟蹤報(bào)告。)
而在對(duì)IDC剛剛發(fā)布的2023年第二季度數(shù)據(jù)中心基礎(chǔ)設(shè)施支出數(shù)據(jù)進(jìn)行切片剖析之后,我們認(rèn)為390億美元支出總額中的很大一部分都來(lái)自AI系統(tǒng)。如果按照我們前面提出的70億美元預(yù)估數(shù)字來(lái)計(jì)算,那么用于支撐其他類型工作負(fù)載的全部基礎(chǔ)設(shè)施該季度支出將為320億美元。而且可以看到,2023年第二季度服務(wù)器與存儲(chǔ)基礎(chǔ)設(shè)施的整體支出僅增長(zhǎng)了1.3%,要比IDC今年4月報(bào)告的第一季度8.2%的增幅要低得多。當(dāng)然,第一季度與第二季度間出現(xiàn)連續(xù)增長(zhǎng)絕對(duì)是件好事,從第一季度的358億美元起步,現(xiàn)在我們正逐步向著2022年第三季度的407億美元回歸,也期待這波生成式AI的革命能拉動(dòng)市場(chǎng)重回2022年第四季度的428億美元支出峰值。
以下是IDC在2021年推出的數(shù)據(jù)中心服務(wù)器存儲(chǔ)模型的匯總數(shù)據(jù),其中消除了服務(wù)器與存儲(chǔ)銷售額之間被重復(fù)計(jì)入的部分。對(duì)于超大規(guī)?;A(chǔ)設(shè)施運(yùn)營(yíng)商和云服務(wù)商來(lái)說(shuō),所謂存儲(chǔ)已經(jīng)不再是純粹的存儲(chǔ),而是大容量磁盤(pán)/閃存加上較弱CPU的組合。在這種情況下,我們?cè)撊绾蝿澐郑闶欠?wù)器還是存儲(chǔ)?IDC認(rèn)為全都算,也就是說(shuō)除非能搞清楚IDC在計(jì)算中使用的原始數(shù)據(jù),否則我們根本沒(méi)法搞清二者的確切數(shù)字。
下表所示,為2020年第一季度至2023年第二季度期間用IDC新方法統(tǒng)計(jì)得出的云與非云基礎(chǔ)設(shè)施支出數(shù)據(jù):

表中紅色粗體的部分,是我們?yōu)榱颂钛a(bǔ)數(shù)據(jù)空白而添加的估計(jì)值。
因?yàn)樯蟼€(gè)禮拜2023年的第三季度才剛剛過(guò)去,所以目前還沒(méi)有可用的數(shù)據(jù)。加上IDC也需要一段時(shí)間來(lái)核對(duì)上市企業(yè)的所有財(cái)務(wù)數(shù)據(jù),包括構(gòu)建數(shù)據(jù)中心支出模型,所以我們可能要到2024年1月才能看到今年第三季度的統(tǒng)計(jì)結(jié)果。
在今年第二季度,超大規(guī)?;A(chǔ)設(shè)施運(yùn)營(yíng)商和云服務(wù)商在共享云基礎(chǔ)設(shè)施(同時(shí)涵蓋服務(wù)器和存儲(chǔ),但不包括網(wǎng)絡(luò))上的支出增長(zhǎng)了13.7%,達(dá)到179億美元;但在專用云基礎(chǔ)設(shè)施方面的支出(也就是成規(guī)模的企業(yè)數(shù)據(jù)中心或者主機(jī)跨站托管設(shè)施)同比下降超5%,來(lái)到67億美元。第一季度,專用云支出同樣下降1.5%,總額為58億美元。連續(xù)兩個(gè)季度下降,當(dāng)然可以理解為衰退。

非云基礎(chǔ)設(shè)施(例如大型x86、Power或大型機(jī)系統(tǒng),及其支持關(guān)系數(shù)據(jù)庫(kù)與ERP、供應(yīng)鏈管理、倉(cāng)庫(kù)管理和客戶關(guān)系管理應(yīng)用程序所使用的SAN存儲(chǔ))的支出下降了8.3%,來(lái)到144億美元。同樣的,這部分非云細(xì)分市場(chǎng)較2023年第一季度的138億美元實(shí)現(xiàn)了環(huán)比增長(zhǎng),但非云基礎(chǔ)設(shè)施的整體支出第一季度下降了0.9%、第二季度繼續(xù)下降8.3%,連續(xù)兩個(gè)季度的縮水同樣代表需求衰退。
目前的情況是,GPU供不應(yīng)求的客觀現(xiàn)實(shí)導(dǎo)致生成式AI領(lǐng)域最具實(shí)力的三位參與者——微軟、谷歌和亞馬遜云科技,正在從英偉達(dá)處獲得優(yōu)先配額,這反過(guò)來(lái)又加快了云服務(wù)商對(duì)外租賃基礎(chǔ)設(shè)施的腳步。畢竟只要有短缺,這種“二道販子”式的行為就不可能斷絕。但根據(jù)報(bào)道,英偉達(dá)方面有望在2024年將H100 GPU的生產(chǎn)能力提升至150萬(wàn)至200萬(wàn)個(gè),屆時(shí)產(chǎn)品稀缺性或?qū)⒂兴徑?、價(jià)格隨之下降,服務(wù)器市場(chǎng)也將重新歸于正常。類似的情況在2018年和2019年的服務(wù)器內(nèi)存領(lǐng)域也曾出現(xiàn),當(dāng)時(shí)DRAM價(jià)格曾經(jīng)暴漲一倍,同樣拉高了服務(wù)器的平均售價(jià)。

關(guān)鍵在于,如果大家需要2萬(wàn)到2.5萬(wàn)個(gè)GPU來(lái)訓(xùn)練最先進(jìn)的生成式AI模型,那么50萬(wàn)個(gè)H100 GPU就只能構(gòu)建20到25個(gè)大規(guī)模集群。目前全球也只有20到25家機(jī)構(gòu)愿意承受這么高的建設(shè)成本。再考慮到模型的實(shí)際訓(xùn)練往往需要幾個(gè)月時(shí)間,包括篩選數(shù)萬(wàn)億個(gè)參數(shù)并消化同等規(guī)模的數(shù)據(jù)token,也許整個(gè)基礎(chǔ)設(shè)施將由數(shù)百個(gè)組織或部門(mén)進(jìn)行共享。也就是說(shuō),即使2024年英偉達(dá)能夠把H100 GPU的產(chǎn)量推向最樂(lè)觀的200萬(wàn),還是不一定能滿足生成式AI的旺盛需求。
如果真是這樣,那么GPU的售價(jià)將繼續(xù)居高不下,導(dǎo)致AI系統(tǒng)的成本也將保持高位。
更令我們擔(dān)心的是,第二季度服務(wù)器和存儲(chǔ)出貨量下降了23.2%——我們不清楚實(shí)際出貨的機(jī)器數(shù)量,因?yàn)镮DC沒(méi)有發(fā)布這項(xiàng)數(shù)據(jù)。而且2023年第一季度,服務(wù)器與存儲(chǔ)出貨量已經(jīng)縮水了11.4%。連續(xù)兩個(gè)季度的萎縮,自然就是需求衰退的標(biāo)志。

展望今年下半年,IDC預(yù)計(jì)云基礎(chǔ)設(shè)施的支出將增長(zhǎng)10.6%,來(lái)到1014億美元;高于三個(gè)月前提出的全球7.3%的增長(zhǎng)預(yù)期。2023年全年,共享云部分的銷售額預(yù)計(jì)將增長(zhǎng)13.5%,達(dá)到720億美元;專用云部分將增長(zhǎng)4.1%,來(lái)到294億美元。非云服務(wù)器和存儲(chǔ)支出則將會(huì)下降7.9%,來(lái)到585億美元。我們認(rèn)為云領(lǐng)域的所有增長(zhǎng)都將由AI服務(wù)器所驅(qū)動(dòng),而AI服務(wù)器又以英偉達(dá)GPU及其競(jìng)爭(zhēng)對(duì)手的其他AI引擎為底層驅(qū)力。
從長(zhǎng)期來(lái)看,預(yù)計(jì)2022年至2027年(含)間云基礎(chǔ)設(shè)施支出將保持11.3%的年均復(fù)合增長(zhǎng)率(CAGR),到2027年年底時(shí)將達(dá)到1567億美元,占服務(wù)器與存儲(chǔ)總支出的69.4%。到2027年,共享云規(guī)模將達(dá)到1097億美元,年均復(fù)合增長(zhǎng)率為11.6%;專用云規(guī)模將達(dá)到470億美元,年均復(fù)合增長(zhǎng)率為10.7%。而且不管大家是否相信,IDC預(yù)計(jì)非云服務(wù)器和存儲(chǔ)支出也將增長(zhǎng)至691億美元,在2022年至2027年之間實(shí)現(xiàn)1.7%的處均復(fù)合增長(zhǎng)率。