在傳出法國將對英偉達(dá)發(fā)起反壟斷調(diào)查后不久,又有新的不好消息傳出。
據(jù)彭博社引述歐盟競爭事務(wù)負(fù)責(zé)人瑪格麗特·維斯塔格 (Margrethe Vestager) 的警告稱,英偉達(dá)公司的 AI 芯片供應(yīng)存在“巨大瓶頸”,但表示監(jiān)管機(jī)構(gòu)仍在考慮如何解決這個問題。
“我們一直在向他們詢問問題,但這還只是初步問題,”她在新加坡之行中告訴彭博社。到目前為止,這“還不具備監(jiān)管行動的條件”。
自從英偉達(dá)成為人工智能支出熱潮的最大受益者以來,監(jiān)管機(jī)構(gòu)就一直關(guān)注著它。它的圖形處理單元(簡稱 GPU)因其能夠處理開發(fā) AI 模型所需的大量信息的能力而受到數(shù)據(jù)中心運(yùn)營商的青睞。
芯片已成為科技界最熱門的商品之一,云計(jì)算提供商相互競爭以獲取這些芯片。據(jù)估計(jì),Nvidia 的 H100 處理器需求旺盛,已幫助他們獲得 80% 以上的市場份額,領(lǐng)先于競爭對手英特爾公司和超微半導(dǎo)體公司。
盡管供應(yīng)緊張,但 Vestager 表示,人工智能芯片供應(yīng)的二級市場可能有助于激發(fā)創(chuàng)新和公平競爭。
但她表示,占主導(dǎo)地位的公司未來可能會面臨某些行為限制。
“如果你在市場上擁有這種主導(dǎo)地位,那么有些事情你不能做,而小公司可以做,”她說?!暗酥?,只要你做你的生意并尊重這一點(diǎn),你就很好?!?/span>
6000億美元的“大難題”
盡管高科技巨頭在人工智能基礎(chǔ)設(shè)施方面投入了大量資金,但人工智能帶來的收入增長尚未實(shí)現(xiàn),這表明生態(tài)系統(tǒng)的最終用戶價(jià)值存在巨大差距。事實(shí)上, 紅杉資本分析師戴維·卡恩( David Cahn)認(rèn)為,人工智能公司每年必須賺取約 6000 億美元才能支付其人工智能基礎(chǔ)設(shè)施(例如數(shù)據(jù)中心)的費(fèi)用。
去年,Nvidia 的數(shù)據(jù)中心硬件收入達(dá)到 475 億美元(其中大部分硬件是用于 AI 和 HPC 應(yīng)用的計(jì)算 GPU)。AWS、Google、Meta、Microsoft等公司在 2023 年為 OpenAI 的 ChatGPT 等應(yīng)用在其 AI 基礎(chǔ)設(shè)施上投入了巨額資金。然而,他們能賺回這筆投資嗎?David Cahn 認(rèn)為,這可能意味著我們正在目睹金融泡沫的增長。
按照David Cahn的算法,6000億美元這個數(shù)字,可以通過一些簡單的數(shù)學(xué)運(yùn)算來得出。
你所要做的就是將 Nvidia 的運(yùn)行率收入預(yù)測乘以 2 倍,以反映 AI 數(shù)據(jù)中心的總成本(GPU 占總擁有成本的一半,另一半包括能源、建筑物、備用發(fā)電機(jī)等)。然后你再乘以 2 倍,以反映 GPU 最終用戶的 50% 毛利率(例如,從 Azure 或 AWS 或 GCP 購買 AI 計(jì)算的初創(chuàng)公司或企業(yè),他們也需要賺錢)。
我們看看,自 2023 年 9 月(在當(dāng)時(shí),他認(rèn)為人工智能是2000億美元難題)以來發(fā)生了什么變化?
一、供應(yīng)短缺已經(jīng)消退: 2023 年末是 GPU 供應(yīng)短缺的高峰期。初創(chuàng)公司正在給風(fēng)險(xiǎn)投資公司打電話,給任何愿意與他們交談的人打電話,尋求幫助以獲得 GPU。如今,這種擔(dān)憂幾乎完全消除了。對于我交談過的大多數(shù)人來說,現(xiàn)在以合理的交貨時(shí)間獲得 GPU 相對容易。
二、GPU 庫存不斷增長: Nvidia 在第四季度報(bào)告稱,其數(shù)據(jù)中心收入的一半左右來自大型云提供商。僅微軟一家就可能占Nvidia 第四季度收入的約 22%。超大規(guī)模資本支出正在達(dá)到歷史水平。這些投資是大型科技公司 2024 年第一季度收益的主要主題,首席執(zhí)行官們有效地告訴市場:“無論你喜不喜歡,我們都會投資 GPU?!倍诜e硬件并不是一個新現(xiàn)象,一旦庫存足夠大以至于需求下降,就會成為重置的催化劑。
三、OpenAI 仍然占據(jù)著 AI 收入的最大份額: The Information 最近報(bào)道稱,OpenAI 的收入現(xiàn)在為34 億美元,高于 2023 年底的 16 億美元。雖然我們已經(jīng)看到少數(shù)初創(chuàng)公司的收入規(guī)模達(dá)到不到 1 億美元,但 OpenAI 與其他公司之間的差距仍然很大。除了 ChatGPT,消費(fèi)者今天真正使用了多少 AI 產(chǎn)品?想想你每月花 15.49 美元從 Netflix 或每月花 11.99 美元從 Spotify 獲得多少價(jià)值。從長遠(yuǎn)來看,AI 公司需要為消費(fèi)者提供巨大的價(jià)值,才能繼續(xù)掏錢。
四、1250 億美元的缺口現(xiàn)在變成了 5000 億美元的缺口:在最后的分析中,我慷慨地假設(shè)谷歌、微軟、蘋果和 Meta 每年都能從新的 AI 相關(guān)收入中產(chǎn)生 100 億美元。我還假設(shè)甲骨文、字節(jié)跳動、阿里巴巴、騰訊、X 和特斯拉每年都有 50 億美元的新 AI 收入。即使這仍然是正確的,并且我們在名單上再添加幾家公司,1250 億美元的缺口現(xiàn)在也會變成 5000 億美元的缺口。
這還沒完——B100 即將問世: 今年早些時(shí)候,Nvidia 宣布推出 B100 芯片,其性能提升了 2.5 倍,而成本僅增加了 25%。我預(yù)計(jì)這將導(dǎo)致 NVDA 芯片需求的最終激增。與 H100 相比,B100 的成本與性能相比有了顯著的改善,而且由于每個人都想在今年晚些時(shí)候買到 B100,因此很可能再次出現(xiàn)供應(yīng)短缺。
在之前提出關(guān)于GPU的問題時(shí),David Cahn收到的最主要反駁之一是“GPU 資本支出就像修建鐵路”,最終火車會開過來,目的地也會到來——新的農(nóng)業(yè)出口、游樂園、購物中心等。
David Cahn表示,其實(shí)他也同意這一點(diǎn),但他認(rèn)為這個論調(diào)忽略了幾點(diǎn):
一、缺乏定價(jià)權(quán):在物理基礎(chǔ)設(shè)施建設(shè)的情況下,您正在建設(shè)的基礎(chǔ)設(shè)施具有一些內(nèi)在價(jià)值。如果您擁有舊金山和洛杉磯之間的軌道,那么您可能擁有某種壟斷定價(jià)權(quán),因?yàn)?A 地和 B 地之間只能鋪設(shè)這么多軌道。在 GPU 數(shù)據(jù)中心的情況下,定價(jià)權(quán)要小得多。GPU 計(jì)算正日益成為一種按小時(shí)計(jì)量的商品。與成為寡頭壟斷的 CPU 云不同,構(gòu)建專用 AI 云的新進(jìn)入者繼續(xù)涌入市場。在沒有壟斷或寡頭壟斷的情況下,高固定成本 + 低邊際成本的企業(yè)幾乎總是會看到價(jià)格競爭到邊際成本(例如航空公司)。
二、投資浪費(fèi):即使是鐵路行業(yè),以及許多新技術(shù)行業(yè),投機(jī)性投資狂潮也常常導(dǎo)致高額的資本浪費(fèi)。《The Engines that Moves Markets 》是一本關(guān)于技術(shù)投資的最佳教科書,其主要觀點(diǎn)(確實(shí),重點(diǎn)關(guān)注鐵路行業(yè))是,許多人在投機(jī)性技術(shù)浪潮中損失慘重。挑選贏家很難,但挑選輸家(就鐵路行業(yè)而言,運(yùn)河)要容易得多。
三、折舊:從技術(shù)發(fā)展史中我們得知,半導(dǎo)體趨于越來越好。Nvidia 將繼續(xù)生產(chǎn)更好的下一代芯片,如 B100。這將導(dǎo)致上一代芯片的折舊速度加快。由于市場低估了 B100 和下一代芯片的改進(jìn)速度,因此它高估了今天購買的 H100 在 3-4 年后的價(jià)值。同樣,物理基礎(chǔ)設(shè)施不存在這種相似性,它不遵循任何“摩爾定律”類型的曲線,因此成本與性能的關(guān)系不斷改善。
四、贏家與輸家:我認(rèn)為我們需要仔細(xì)研究贏家和輸家——在基礎(chǔ)設(shè)施建設(shè)過剩的時(shí)期,總會有贏家。人工智能很可能是下一波變革性技術(shù)浪潮,GPU 計(jì)算價(jià)格的下降實(shí)際上也有利于長期創(chuàng)新,也有利于初創(chuàng)企業(yè)。如果David Cahn的預(yù)測成真,它將主要對投資者造成傷害。創(chuàng)始人和公司建設(shè)者將繼續(xù)在人工智能領(lǐng)域發(fā)展——他們將更有可能取得成功,因?yàn)樗麄儗⑹芤嬗谳^低的成本和在這一試驗(yàn)期間積累的經(jīng)驗(yàn)。
五、人工智能將創(chuàng)造巨大的經(jīng)濟(jì)價(jià)值。專注于為最終用戶提供價(jià)值的公司創(chuàng)建者將獲得豐厚的回報(bào)。我們正在經(jīng)歷一場可能定義一代人的技術(shù)浪潮。像 Nvidia 這樣的公司在推動這一轉(zhuǎn)變方面發(fā)揮了重要作用,值得稱贊,并且很可能在未來很長一段時(shí)間內(nèi)在生態(tài)系統(tǒng)中發(fā)揮關(guān)鍵作用。
不過David Cahn也重申,投機(jī)狂潮是技術(shù)的一部分,所以沒什么好害怕的。那些在這一刻保持頭腦清醒的人有機(jī)會創(chuàng)建極其重要的公司。但我們必須確保不要相信現(xiàn)在已經(jīng)從硅谷蔓延到全國乃至全世界的妄想。這種妄想認(rèn)為我們都會快速致富,因?yàn)?AGI 明天就會到來,我們都需要儲存唯一有價(jià)值的資源,那就是 GPU。
“事實(shí)上,前面的道路將是漫長的。它會有起有落。但幾乎可以肯定,它是值得的?!盌avid Cahn強(qiáng)調(diào)。
潛在的挑戰(zhàn)者
雖然這是一個談了很多次,但似乎也有了結(jié)果的論調(diào)。如Futurum Group 首席執(zhí)行官丹尼爾·紐曼所說,“目前,世界上沒有英偉達(dá)的天敵?!?/span>
原因如下:Nvidia 的圖形處理單元 (GPU) 最初于 1999 年為 PC 視頻游戲中的超快 3D 圖形而創(chuàng)建,后來被證明非常適合訓(xùn)練大規(guī)模生成式 AI 模型,來自 OpenAI、Google、Meta、Anthropic 和 Cohere 等公司推動的模型的規(guī)模越來越大,進(jìn)而需要使用大量 AI 芯片來做訓(xùn)練。多年來,Nvidia 的 GPU 一直被認(rèn)為是最強(qiáng)大的,也是最搶手的。
這些成本當(dāng)然不菲:訓(xùn)練頂級生成式 AI 模型需要數(shù)萬個最高端的 GPU,每個 GPU 的價(jià)格為 3 萬至 4 萬美元。例如,埃隆·馬斯克 (Elon Musk)最近表示,他的公司 xAI 的 Grok 3 模型需要在 10 萬個 Nvidia 頂級 GPU 上進(jìn)行訓(xùn)練才能成為“特別的東西”,這將為 Nvidia 帶來超過 30 億美元的芯片收入。
然而,Nvidia 的成功不僅僅是芯片的產(chǎn)物,還有讓芯片變得易于使用的軟件。Nvidia 的軟件生態(tài)系統(tǒng)已經(jīng)成為大量專注于 AI 的開發(fā)人員的首選,他們幾乎沒有動力去轉(zhuǎn)換。在上周的年度股東大會上,Nvidia 首席執(zhí)行官黃仁勛稱該公司的軟件平臺 CUDA(計(jì)算統(tǒng)一設(shè)備架構(gòu))是一個“良性循環(huán)”。隨著用戶的增多,Nvidia 有能力投入更多資金升級該生態(tài)系統(tǒng),從而吸引更多用戶。
相比之下,Nvidia 的半導(dǎo)體競爭對手AMD控制著全球 GPU 市場約 12% 的份額,該公司確實(shí)擁有具有競爭力的 GPU,并且正在改進(jìn)其軟件,紐曼說。但是,雖然它可以為不想被 Nvidia 束縛的公司提供另一種選擇,但它沒有現(xiàn)有的開發(fā)者用戶群,這些開發(fā)者認(rèn)為 CUDA 易于使用。
此外,雖然亞馬遜的 AWS、微軟Azure 和谷歌云等大型云服務(wù)提供商都生產(chǎn)自己的專有芯片,但他們并不打算取代 Nvidia。相反,他們希望有多種 AI 芯片可供選擇,以優(yōu)化自己的數(shù)據(jù)中心基礎(chǔ)設(shè)施,降低價(jià)格,并向最廣泛的潛在客戶群銷售他們的云服務(wù)。
J. Gold Associates 分析師杰克·戈?duì)柕?(Jack Gold) 解釋說:“Nvidia 擁有早期發(fā)展勢頭,當(dāng)你建立一個快速增長的市場時(shí),其他人很難趕上。”他表示 Nvidia 在創(chuàng)建其他人所沒有的獨(dú)特生態(tài)系統(tǒng)方面做得很好。
Wedbush 股票研究高級副總裁 Matt Bryson 補(bǔ)充說,要取代 Nvidia 用于訓(xùn)練大規(guī)模 AI 模型的芯片將特別困難,他解釋說,目前計(jì)算能力的大部分支出都流向了這一領(lǐng)域?!拔艺J(rèn)為這種動態(tài)在未來一段時(shí)間內(nèi)不會發(fā)生變化,”他說。
然而,越來越多的人工智能芯片初創(chuàng)公司,包括 Cerebras、SambaNova、Groq 以及最新的 Etched和 Axelera ,都看到了從英偉達(dá)人工智能芯片業(yè)務(wù)中分一杯羹的機(jī)會。他們專注于滿足人工智能公司的特殊需求,尤其是所謂的“推理”,即通過已經(jīng)訓(xùn)練過的人工智能模型運(yùn)行數(shù)據(jù),讓模型輸出信息(例如,ChatGPT 的每個答案都需要推理)。
例如,就在上周,Etched籌集了1.2 億美元,用于開發(fā)一種專門用于運(yùn)行 transformer 模型的專用芯片Sohu,Transformer 模型是 OpenAI 的 ChatGPT、谷歌的 Gemini 和 Anthropic 的 Claude 使用的一種 AI 模型架構(gòu)。據(jù)介紹,該芯片將由臺積電采用其 4nm 工藝生產(chǎn),該公司表示還已從“頂級供應(yīng)商”那里獲得高帶寬內(nèi)存和服務(wù)器供應(yīng),但沒有透露這些公司的名字。Etched 還聲稱,Sohu 的速度比 Nvidia 即將推出的 Blackwell GPU“快一個數(shù)量級,而且更便宜”,八芯片 Sohu 服務(wù)器每秒可處理超過 500,000 個 Llama 70B token。該公司通過推斷已發(fā)布的 Nvidia H100 服務(wù)器 MLperf 基準(zhǔn)測試數(shù)據(jù)做出了這一判斷,該基準(zhǔn)測試顯示,八 GPU 服務(wù)器每秒可處理 23,000 個 Llama 70B token。Etched 首席執(zhí)行官 Uberti在接受采訪時(shí)表示,一臺Sohu服務(wù)器將取代 160 塊 H100 GPU。
荷蘭初創(chuàng)公司 Axelera AI 正在開發(fā)用于人工智能應(yīng)用的芯片,該公司上周宣稱也已獲得6800萬美元美元融資,該公司正在籌集資金以支持其雄心勃勃的增長計(jì)劃。這家總部位于埃因霍溫的公司旨在成為歐洲版的 Nvidia,提供據(jù)稱比競爭對手節(jié)能 10 倍、價(jià)格便宜 5 倍的 AI 芯片。Axelera 創(chuàng)新的核心是 Thetis Core 芯片,它在一個周期內(nèi)可以執(zhí)行驚人的 260,000 次計(jì)算,而普通計(jì)算機(jī)只能執(zhí)行 16 次或 32 次計(jì)算。這種能力使其非常適合 AI 神經(jīng)網(wǎng)絡(luò)計(jì)算,主要是矢量矩陣乘法。他們的芯片提供了高性能和可用性,而成本僅為現(xiàn)有市場解決方案的一小部分。這可以使 AI 普及,讓更廣泛的應(yīng)用程序和用戶能夠使用它。
與此同時(shí),據(jù)報(bào)道,專注于以閃電般的速度運(yùn)行模型的 Groq 正在以25 億美元的估值籌集新資金,而 Cerebras據(jù)稱在發(fā)布其最新芯片僅幾個月后就秘密提交了首次公開募股申請,該公司聲稱該芯片可以訓(xùn)練比 GPT-4 或 Gemini 大 10 倍的 AI 模型。
所有這些初創(chuàng)公司一開始都可能專注于一個小市場,比如為某些任務(wù)提供更高效、更快或更便宜的芯片。他們也可能更專注于特定行業(yè)的專用芯片或個人電腦和智能手機(jī)等人工智能設(shè)備?!白詈玫牟呗允情_拓一個小眾市場,而不是試圖征服世界,而這正是他們大多數(shù)人正在嘗試做的,”Tirias Research 首席分析師 Jim McGregor 說。
因此,也許更切題的問題是:這些初創(chuàng)公司與云提供商以及 AMD 和英特爾等半導(dǎo)體巨頭一起能夠占領(lǐng)多少市場份額?這還有待觀察,尤其是因?yàn)檫\(yùn)行 AI 模型或推理的芯片市場仍然很新。
文章來源:半導(dǎo)體行業(yè)觀察
聯(lián)系人:袁經(jīng)理
手機(jī):051683539599
電話:051683539599
地址: 徐高新康寧路1號高科金匯大廈A座14樓