隨著技術(shù)的發(fā)展,數(shù)據(jù)量的爆炸性增長,到2025年,全球生成和消耗的數(shù)據(jù)總量預(yù)計將超過180ZB。而計算機的核心部件——中央處理器(CPU)分析數(shù)據(jù)的能力卻有點力不從心,導(dǎo)致數(shù)據(jù)處理緩慢且低效。傳統(tǒng)的CPU為了滿足多任務(wù)處理、高效能和節(jié)能要求,變得越來越復(fù)雜。在這個高速發(fā)展的時代,我們不能再依賴單一的CPU來完成所有的工作。為此,各種特定的處理單元(PU)如雨后春筍般涌現(xiàn),其目標(biāo)就是“瓜分”CPU的任務(wù),人多力量大,各司其職,優(yōu)化計算效率。
GPU在AI時代崛起
CPU是計算機的“大腦”,執(zhí)行一般計算任務(wù),而GPU則幫助CPU執(zhí)行圖形和人工智能等更復(fù)雜的任務(wù)。
GPU(圖形處理單元)最初是為了滿足圖形渲染的需求而發(fā)展起來的,在GPU芯片市場中,英偉達(dá)控制著全球大約80%的市場。其GPU芯片主要是用于游戲市場,但現(xiàn)在它的作用已經(jīng)遠(yuǎn)不止于此。由于其并行處理的能力,一路高歌猛進(jìn)的GPU,就像一個無畏的少年,展現(xiàn)出了無限的可能。GPU已經(jīng)被廣泛應(yīng)用于深度學(xué)習(xí)、科學(xué)計算等多個領(lǐng)域。這種計算能力不僅可以加速圖形處理,還能在其他任務(wù)上分擔(dān)CPU的負(fù)擔(dān),如數(shù)據(jù)分析、機器學(xué)習(xí)等。
圖形處理單元,GPU,最初是為了滿足對圖形渲染的迫切需求而發(fā)展起來的,而現(xiàn)在它的功能已經(jīng)遠(yuǎn)超這個范圍,成為推動現(xiàn)代計算的核心力量之一。得益于其并行處理的卓越能力,GPU,就像一個無畏的少年,一路在游戲、挖礦、AI等領(lǐng)域高歌猛進(jìn),展現(xiàn)出了無限的可能。今天,GPU已經(jīng)廣泛滲透到深度學(xué)習(xí)、科學(xué)計算等關(guān)鍵領(lǐng)域,成為這些領(lǐng)域不可或缺的一部分。
尤其是在當(dāng)今的人工智能的時代,生成式AI的廣泛和深入應(yīng)用標(biāo)志著一場技術(shù)革命的到來。在這個背景下,圖形處理單元(GPU)的重要性逐漸超越了中央處理單元(CPU),站上了歷史的舞臺中心。
首先是,作為世界上最大的GPU供應(yīng)商,其英偉達(dá)大約占據(jù)全球80%的GPU市場份額。2023年6月13日,英偉達(dá)的市值首次突破了萬億美元大關(guān),使其成為美國第五大市值公司,僅次于蘋果、微軟、Alphabet和亞馬遜。這一里程碑式的事件突顯了GPU行業(yè)的健康和增長動力,同時也預(yù)示著它在未來將繼續(xù)發(fā)揮重要作用。
英偉達(dá)目前的市值仍然在1萬億美元以上
接下來是數(shù)據(jù)中心業(yè)務(wù)大反轉(zhuǎn)。在過去幾年中英偉達(dá)的重心開始轉(zhuǎn)向了數(shù)據(jù)中心市場。2023年第二季度的營收數(shù)據(jù)顯示了一個非常引人注目的現(xiàn)象。在2023年之前,數(shù)據(jù)中心的CPU市場份額一直顯著高于GPU。事實上,即便是在2023年第一季度,Nvidia在數(shù)據(jù)中心業(yè)務(wù)的收入(42億美元)仍然未能超過Intel和AMD的總和。但到了第二季度,局面發(fā)生了翻天覆地的變化,在數(shù)據(jù)中心業(yè)務(wù)上,兩大CPU巨頭英特爾和AMD的營收分別為40億美元和30億美元。而與之形成鮮明對比的是,英偉達(dá)的數(shù)據(jù)中心業(yè)務(wù)營收超過了100億美元,這一數(shù)字甚至超過了英特爾和AMD的營收之和。這一數(shù)據(jù)充分顯示了GPU的地位在迅速上升,并在某些領(lǐng)域已經(jīng)超越了CPU。
GPU現(xiàn)在在現(xiàn)代超級計算中占據(jù)了中心地位,它被廣泛用于各種任務(wù)的加速,從網(wǎng)絡(luò)到游戲,從加密到人工智能等各個領(lǐng)域。隨著越來越多的計算任務(wù)轉(zhuǎn)移到GPU上,我們可以預(yù)見到,GPU將在未來幾十年內(nèi)繼續(xù)是計算和人工智能領(lǐng)域的主要工具。
為數(shù)據(jù)處理而生的DPU
有了專門處理圖形的GPU之后,還不夠。在數(shù)字化時代,需要有針對數(shù)據(jù)處理而生的處理器,于是數(shù)據(jù)處理單元(DPU)應(yīng)運而生,DPU也被稱為是數(shù)據(jù)中心的第三大計算支柱。DPU 與 CPU 和 GPU 配合使用,可增強計算能力并處理日益復(fù)雜的現(xiàn)代數(shù)據(jù)工作負(fù)載。
CPU、GPU和DPU的對比(來源:datacenterknowledge)
DPU是專門設(shè)計用來處理大量的數(shù)據(jù)和信息。它可以有效地處理和分析數(shù)據(jù),提高數(shù)據(jù)中心和云計算平臺的性能。根據(jù)英偉達(dá)的說法,DPU應(yīng)該能完成以下三大項任務(wù):
卸載:從服務(wù)器CPU接管基礎(chǔ)設(shè)施任務(wù),以便更多的CPU能力可用于運行應(yīng)用程序。
加速:使用DPU芯片中的硬件加速,比CPU更快地運行基礎(chǔ)設(shè)施功能。
隔離:將關(guān)鍵數(shù)據(jù)平面和控制平面功能移至DPU上的單獨域,既可以減輕服務(wù)器CPU 的工作,又可以在CPU或其軟件受到損害時保護(hù)功能。
迄今為止,許多 DPU 開發(fā)都是針對超大規(guī)模的。展望未來,DPU 在數(shù)據(jù)中心和企業(yè)網(wǎng)絡(luò)其他地方的使用預(yù)計將會增長。一種可能實現(xiàn)的方式是將 DPU 技術(shù)與網(wǎng)絡(luò)交換機相融合——AMD Pensando 將這種技術(shù)組合稱為“智能交換機”?!拔覀冋J(rèn)為智能交換機是企業(yè)吸收 DPU 技術(shù)的最簡單方法,因為它可以讓他們淘汰舊設(shè)備,并為他們的網(wǎng)絡(luò)帶來重要的技術(shù)和規(guī)模,” AMD Pensando 網(wǎng)絡(luò)技術(shù)和解決方案小組首席商務(wù)官 Soni Jiangdani 表示。
由于人工智能、機器學(xué)習(xí)、深度學(xué)習(xí)、物聯(lián)網(wǎng)、5G 和復(fù)雜云架構(gòu)需求的增長,DPU市場穩(wěn)步增長。隨著對數(shù)據(jù)密集型應(yīng)用程序的需求不斷增加,計算架構(gòu)將不斷發(fā)展,從而需要更快、更高效、更安全的數(shù)據(jù)處理。DPU市場市場上涌現(xiàn)了不少芯片玩家,主要供應(yīng)商包括國外的英偉達(dá)、Marvell、Fungible(被微軟收購)、Broadcom、Intel、Resnics和AMD Pensando,國內(nèi)還有中科馭數(shù)、芯啟源云豹智能、云脈芯連等等。
根據(jù)Allied Market Research 的一份報告,預(yù)計到 2031 年,全球數(shù)據(jù)處理單元市場將達(dá)到 55 億美元,2022 年至 2031 年的復(fù)合年增長率為 26.9%。因此,DPU 可能會從今天的可選組件轉(zhuǎn)變?yōu)橄乱淮嬎愕谋匾袠I(yè)標(biāo)準(zhǔn)。
爆炸性增長的視頻,需要VPU
隨著視頻內(nèi)容的普及和人工智能技術(shù)的飛速發(fā)展,視頻處理單元(VPU,Video Processing Unit)成為了當(dāng)前科技領(lǐng)域的一顆新星。多年來,英特爾的CPU+軟件的視頻解碼/編碼方案一直主導(dǎo)著流媒體市場,但是隨著視頻流媒體對高質(zhì)量視頻的需求不斷增長,CPU將不再具有經(jīng)濟(jì)價值,而且會消耗太多的能耗和空間。于是,VPU這種專門用來處理視頻的芯片開始興起,他們旨在釋放CPU的龐大勞動力。
VPU(視頻處理單元)是專門設(shè)計用來處理視頻任務(wù)的,它可以高效地處理視頻編碼和解碼、圖像處理和機器視覺等任務(wù)。通過將這些任務(wù)從CPU或GPU上卸載,VPU可以提高系統(tǒng)的總體效率和性能,同時也減輕了CPU或GPU的負(fù)擔(dān),使它們可以專注于其他任務(wù)。而且這樣的VPU通常還具有高性能、低功耗和低延時等多個優(yōu)勢,據(jù)SemiAnalysis對VPU芯片廠商镕銘微電子(NETINT)的分析,相比于CPU和GPU,VPU的密度和功耗是CPU和GPU無法比擬的,VPU的出現(xiàn)可以說是為視頻行業(yè)應(yīng)用帶來了前所未有的加速計算能力。
VPU與GPU和CPU的對比(圖源:Semianalysis)
當(dāng)下4K、8K等高清視頻技術(shù)的廣泛應(yīng)用,使得視頻處理的計算負(fù)擔(dān)持續(xù)上升,這使得高效能的VPU成為行業(yè)發(fā)展的必備工具。目前包括谷歌、Meta、字節(jié)跳動和騰訊等互聯(lián)網(wǎng)巨頭均已經(jīng)瞄上這顆芯片。與此同時,AMD在今年4月,發(fā)布了一款用于數(shù)據(jù)中心的新型專用媒體加速器和視頻編碼卡——Alveo MA35D,英特爾則是將VPU集成到其14代酷睿Meteor lake處理器中。除了云和數(shù)據(jù)中心之外,終端也已成為視頻及游戲的主要載體,手機廠商愈發(fā)追求視頻或影像質(zhì)量。對此,vivo/小米以視頻芯片為自研切入點,如Pixelworks/逐點半導(dǎo)體這樣的第三方視頻芯片供應(yīng)商也開始迎來發(fā)展契機。
未來,視頻處理芯片市場預(yù)計將繼續(xù)增長,特別是在邊緣計算、物聯(lián)網(wǎng) (IoT) 和5G通信領(lǐng)域。高效和低功耗的視頻處理芯片將成為這些應(yīng)用領(lǐng)域的關(guān)鍵組件。
更多新的“PU”正在路上
一家成立于2018年的以色列的初創(chuàng)芯片企業(yè)NeuroBlade,開發(fā)了一種專用處理器架構(gòu),他們將之稱為是SPU(SQL處理單元)。該公司的目標(biāo)是成為“數(shù)據(jù)分析領(lǐng)域的 Nvidia”。SPU主要是用來加速SQL指令處理,該公司CEO表示,通過使用專門設(shè)計的處理器加速SQL處理,可以實現(xiàn)端到端SQL分析加速。在部署方面,該芯片通過主機服務(wù)器的PCIe總線插入,能夠透明地接管SQL相關(guān)處理,而無需修改主機應(yīng)用程序軟件。
NeuroBlade SPU芯片和卡
SPU支持常見的列式文件格式。當(dāng)一個查詢請求從查詢引擎發(fā)送時(也就是從數(shù)據(jù)庫管理系統(tǒng)中發(fā)出查詢請求),SPU可以直接訪問和處理存儲在本地存儲設(shè)備上的數(shù)據(jù)文件。在處理完數(shù)據(jù)文件后,SPU會將處理結(jié)果以原生查詢引擎布局的形式發(fā)送回查詢引擎。
SPU的工作原理
NeuroBlade公司正在與多個大型超大規(guī)模提供商進(jìn)行談判,并已與一家公司贏得了數(shù)千張SPU卡的合同。如NeuroBlade還與戴爾公司合作,在PowerEdge服務(wù)器中分銷SPU卡產(chǎn)品。據(jù)他們稱,超大規(guī)模企業(yè)使用這一SQL處理單元 (SPU) 來卸載運行分析工作負(fù)載的x86 CPU,可以獲得100倍或更多的工作加速,每年可以節(jié)省數(shù)百萬美元。在NeuroBlade的客戶中,還有存儲類客戶,鎧俠已經(jīng)在其CM7系列企業(yè)NVMe SSD中成功配置了其 NeuroBlade硬件增強型查詢系統(tǒng) (HEQS),據(jù)他們稱,可以使客戶能夠充分發(fā)揮高性能 SSD 吞吐量的潛力,從而將查詢性能提高高達(dá)100倍。
結(jié)論
一款“全能”型的CPU似乎已經(jīng)不能滿足所有的計算需求。隨著計算需求的多樣化和技術(shù)的發(fā)展,多種PU的出現(xiàn),如GPU、DPU、SPU和VPU,正是對這種趨勢的回應(yīng)。它們從各自擅長的領(lǐng)域,優(yōu)化特定的計算任務(wù),為CPU“分憂解難”,提高整體的計算效率和性能。
雖然多種PU的出現(xiàn)已經(jīng)開始瓜分CPU的任務(wù),但CPU仍然是計算的中心。不過,多種PU的融合和發(fā)展無疑會進(jìn)一步推動計算技術(shù)的不斷進(jìn)步和優(yōu)化,幫助實現(xiàn)更高效,更快速的計算,滿足日益增長的數(shù)據(jù)和計算需求。
在未來,我們可以期待更多種類的處理器出現(xiàn),它們將更加專業(yè)和高效地處理各種不同類型的計算任務(wù),為各個行業(yè)和領(lǐng)域帶來更大的便利和推動力。
文章來源:半導(dǎo)體行業(yè)觀察
聯(lián)系人:袁經(jīng)理
手機:051683539599
電話:051683539599
地址: 徐高新康寧路1號高科金匯大廈A座14樓