“我們需要更大的GPU?!?span style="display:none">mkL驛資訊
當(dāng)?shù)貢r(shí)間3月18日,黃仁勛在英偉達(dá)2024 GTC大會(huì)上,宣布了英偉達(dá)新一代加速計(jì)算平臺(tái)NVIDIA Blackwell,以及基于Blackwell GPU架構(gòu)的雙芯片GPU B200和超級(jí)芯片GB200。
Blackwell架構(gòu)單GPU AI性能達(dá)到 20 PFLOPS,性能比上一代提高了5倍,而成本和能耗下降降低25倍。黃仁勛以訓(xùn)練1.8萬(wàn)億參數(shù)的GPT模型為例(可能GPT-4的參數(shù)量)。同樣以90天為訓(xùn)練周期,上一代Hopper架構(gòu)的GPU至少要用8000個(gè),功耗15MW,而使用Blackwell架構(gòu)的GPU,只需要2000顆,功耗約4 MW。
作為全球加速計(jì)算市場(chǎng)的“老大”,英偉達(dá)今天的一切成功都建立在GPU上。
不過(guò),從黃仁勛在GTC大會(huì)上的主題演講來(lái)看,英偉達(dá)似乎并不希望外界只看到他們的GPU。在黃仁勛2個(gè)小時(shí)的主題演講中,雖然Blackwell平臺(tái)的發(fā)布是絕對(duì)主角,但他也把超過(guò)一半的演講時(shí)間放在了GPU“周?chē)钡募夹g(shù)上,包括:芯片設(shè)計(jì)、生產(chǎn)技術(shù),生成式AI模型訓(xùn)練,數(shù)字孿生,以及具身智能等。
一直以來(lái),英偉達(dá)都在強(qiáng)調(diào)自己是“人工智能時(shí)代領(lǐng)先的計(jì)算公司”,而不只是一家芯片或是硬件公司。在GTC上宣布的軟件技術(shù)、AI訓(xùn)練技術(shù)、機(jī)器人技術(shù)等,也無(wú)不透露著“源于GPU,高于GPU”的味道。
軟件是GPU的護(hù)城河
加速計(jì)算市場(chǎng)上并不乏性能與英偉達(dá)接近的GPU產(chǎn)品,然而英偉達(dá)真正的護(hù)城河其實(shí)來(lái)自GPU軟件開(kāi)發(fā)工具。
在Blackwell之外,英偉達(dá)公布了一系列與AI、GPU、機(jī)器人相關(guān)的創(chuàng)新軟件應(yīng)用,包括:
AI 模型和工作流微服務(wù)產(chǎn)品NVIDIA NIM(NVIDIA AI Microservices);企業(yè)級(jí)的 AI 軟件平臺(tái)NVIDIA AI Enterprise 5.0;用于機(jī)器人開(kāi)發(fā)的仿真環(huán)境NVIDIA Isaac Sim;GPU 加速、性能優(yōu)化的輕量級(jí)應(yīng)用NVIDIA Isaac Lab;用于計(jì)算編排服務(wù)的工具NVIDIA OSMO;用于藥物研發(fā)的微服務(wù)NVIDIA BioNeMo;用于基因組學(xué)分析的軟件套件NVIDIA Parabricks;用于視頻分析和智能視頻管理的軟件平臺(tái)NVIDIA Metropolis等。
其中,NVIDIA NIM(NVIDIA AI Microservices)最為突出。
NIM是一系列集成AI模型和工作流的微服務(wù),專為企業(yè)和開(kāi)發(fā)者提供在生物、化學(xué)、影像及醫(yī)療數(shù)據(jù)領(lǐng)域構(gòu)建和部署AI應(yīng)用的高效、靈活方式。NIM的關(guān)鍵優(yōu)勢(shì)是其符合行業(yè)標(biāo)準(zhǔn)的API,便于開(kāi)發(fā)者創(chuàng)建云原生應(yīng)用。
目前,NIM 微服務(wù)以及開(kāi)始在醫(yī)療影像領(lǐng)域推廣。通過(guò)利用 NVIDIA 的 AI 技術(shù),NIM 微服務(wù)可以幫助醫(yī)療專業(yè)人員更快速、更準(zhǔn)確地分析和解釋醫(yī)療影像數(shù)據(jù),從而提高診斷的質(zhì)量和效率。此外,NIM 微服務(wù)還可以用于藥物研發(fā),通過(guò)生成式化學(xué)模型和蛋白質(zhì)結(jié)構(gòu)預(yù)測(cè)模型,加速新藥的發(fā)現(xiàn)和開(kāi)發(fā)過(guò)程。
事實(shí)上,軟件應(yīng)用生態(tài)除了在AI等開(kāi)發(fā)端支撐英偉達(dá)的GPU業(yè)務(wù),在未來(lái)也有可能為英偉達(dá)走出一條新的增長(zhǎng)曲線。
SaaS行業(yè)是公認(rèn)的毛利更高、賺錢(qián)快,且軟件、應(yīng)用研發(fā)資產(chǎn)輕,不會(huì)像硬件生產(chǎn)那樣受到供應(yīng)鏈的制約,也沒(méi)有生產(chǎn)、庫(kù)存壓力。
雖然英偉達(dá)的GPU借著AI的東風(fēng)也能賺得盆滿缽滿,但增長(zhǎng)速度相比不如爆發(fā)增長(zhǎng)的OpenAI。而且如果只做GPU和算力生意,未來(lái)的發(fā)展空間,也難免會(huì)受到制造業(yè)自身增長(zhǎng)緩慢屬性的影響。
已經(jīng)壟斷了GPU生意的英偉達(dá),自然不希望像AMD、Intel、高通那樣,“躬耕”于芯片行業(yè)卷生卷死。對(duì)于英偉達(dá)來(lái)說(shuō),基于AI大模型、軟件等向上再邁一層,不僅能鞏固自己當(dāng)下的行業(yè)地位,也能拓寬未來(lái)的賽道。
算力怪獸的關(guān)注點(diǎn)在通信
專為AI而生的Blackwell可以處理萬(wàn)億參數(shù)規(guī)模的大語(yǔ)言模型(LLM)。每塊GPU擁有2080億個(gè)晶體管,采用專門(mén)定制的雙倍光刻極限尺寸4納米TSMC工藝制造,通過(guò) 10 TB/s的片間互聯(lián),將GPU裸片連接成一塊統(tǒng)一的GPU。
與Blackwell平臺(tái)一同推出的還有采用雙芯片設(shè)計(jì)的新一代GPU B200,單GPU AI性能達(dá)到20 PFLOPS。B200配備192GB內(nèi)存。以及基于B200的超級(jí)芯片GB200 ,通過(guò)900GB/s超低功耗的片間互聯(lián),將兩個(gè) NVIDIA B200 Tensor Core GPU 與 NVIDIA Grace CPU 相連。
雖然Blackwell的性能提升巨大,但今天的超大規(guī)模AI模型多數(shù)都需要多GPU并聯(lián)計(jì)算。由此,GPU的連接性能,才真正體現(xiàn)了GPU在AI大模型訓(xùn)練和應(yīng)用過(guò)程中的價(jià)值。
第五代NVIDIA NVLink提供1.8TB/s 雙向吞吐量,可以使576塊GPU之間實(shí)現(xiàn)無(wú)縫高速通信,滿足更為復(fù)雜的大語(yǔ)言模型訓(xùn)練需求。
在云端模型部署方面,英偉達(dá)還推出了NVIDIA Quantum-X800 InfiniBand 和 Spectrum-X800 以太網(wǎng)網(wǎng)絡(luò)平臺(tái),提供了高達(dá)800Gb/s 的端到端吞吐量,大幅提高了AI和HPC分布式計(jì)算的可用性。
此外,英偉達(dá)還推出了6G研究云平臺(tái),以推動(dòng)AI在無(wú)線接入網(wǎng)絡(luò) (RAN) 技術(shù)的應(yīng)用。保證了端側(cè)設(shè)備到云基礎(chǔ)設(shè)施之間的鏈接,從而推動(dòng)自動(dòng)駕駛汽車(chē)、智能空間和沉浸式教育體驗(yàn)的發(fā)展。
與Blackwell架構(gòu)一同宣布的,還有英偉達(dá)與主流服務(wù)器、云計(jì)算廠商的合作。AWS、戴爾、谷歌、Meta、微軟、OpenAI、甲骨文、特斯拉和XAI等預(yù)計(jì)都會(huì)在未來(lái)將加速計(jì)算服務(wù)器更新到Blackwell架構(gòu)。
促進(jìn)落地是英偉達(dá)的當(dāng)務(wù)之急
在GPU硬件方面,英偉達(dá)在全球GPU市場(chǎng)中持續(xù)保持領(lǐng)先。Blackwell的性能比2年前的Hopper架構(gòu)提升了5倍,比8年前的Pascal架構(gòu)提升了1000倍。
黃仁勛在演講中自豪地說(shuō):“摩爾定律是每10年提升100倍性能,過(guò)去8年里,我們提升了1000倍,我們還少用了2年?!?span style="display:none">mkL驛資訊
Blackwell一出,業(yè)界一片歡騰,很多人直呼:新摩爾定律誕生了。
相對(duì)于英偉達(dá)的用戶,華爾街對(duì)英偉達(dá)的看法相對(duì)冷靜。
剛剛過(guò)去的3月前幾周,英偉達(dá)遭市場(chǎng)逼空,3月8日股價(jià)下跌5.55%。雖然華爾街對(duì)英偉達(dá)本屆GTC表現(xiàn)樂(lè)觀,市場(chǎng)普遍預(yù)測(cè)此次大會(huì)將幫助英偉達(dá)股票結(jié)束近期震蕩走勢(shì)。但是黃仁勛的主題演講結(jié)束后,英偉達(dá)夜盤(pán)表現(xiàn)不佳,次日開(kāi)盤(pán)股價(jià)亦未見(jiàn)起色。
這主要是因?yàn)镚TC上公布重磅新品,對(duì)于市場(chǎng)來(lái)說(shuō)基本都在預(yù)期之內(nèi)。其實(shí)對(duì)于英偉達(dá)來(lái)說(shuō),不管是8年前的Pascal還是今天的Blackwell。1-2年一次的GPU架構(gòu)的升級(jí)早已經(jīng)是順理成章的技術(shù)迭代,時(shí)至2024年,推出Blackwell在英偉達(dá)來(lái)說(shuō)是一個(gè)“漸進(jìn)式創(chuàng)新”的必然結(jié)果。
另一方面,對(duì)于如今的市場(chǎng)來(lái)說(shuō),隨著GPU技術(shù)的迭代,算力快速增長(zhǎng)很可能會(huì)大幅壓縮英偉達(dá)的增長(zhǎng)空間。
方舟投資首席執(zhí)行官、知名投資人“木頭姐”凱西·伍德(Cathie Wood)在3月7日致股東的一封信中對(duì)英偉達(dá)未來(lái)可能面臨的競(jìng)爭(zhēng)壓力發(fā)出警告,并將其與思科在1997至2000年期間股價(jià)經(jīng)歷的“拋物線”進(jìn)行比較。
伍德認(rèn)為,如果AI公司、軟件公司在應(yīng)用層面一直見(jiàn)不到收益的話,很可能會(huì)停止增加在GPU建設(shè)方面的投入。
只是循序漸進(jìn)地提升GPU性能,顯然不能保證英偉達(dá)業(yè)務(wù)的長(zhǎng)期增長(zhǎng)。英偉達(dá)需要給客戶提供更多圍繞GPU構(gòu)建業(yè)務(wù)能力的工具。英偉達(dá)大概也早就認(rèn)識(shí)到了這一點(diǎn)。
在傳統(tǒng)的GPU圖形渲染方面,英偉達(dá)重點(diǎn)向客戶推廣工業(yè)數(shù)字孿生應(yīng)用和工作流創(chuàng)建平臺(tái)Omniverse。本次GTC,也宣布了最新的NVIDIA Omniverse Cloud API,用以幫助開(kāi)發(fā)者將 Omniverse 技術(shù)集成到他們的設(shè)計(jì)和仿真工具中。
英偉達(dá)還宣布了與西門(mén)子、達(dá)索系統(tǒng)、Ansys、楷登軟件、新思科技等主流工業(yè)軟件廠商的進(jìn)一步合作。
在AI方面,本次GTC上英偉達(dá)公布了一款人形機(jī)器人基礎(chǔ)模型NVIDIA Project GR00T??梢灾С滞ㄟ^(guò)語(yǔ)言、視頻和人類演示來(lái)學(xué)習(xí)動(dòng)作和技能,為機(jī)器人技術(shù)的 AI 應(yīng)用提供了新的可能。Project GR00T與前段時(shí)間Figure推出的使用OpenAI大腦控制的機(jī)器人有些異曲同工。Project GR00T是一個(gè)多模態(tài)的人形機(jī)器人通用基礎(chǔ)模型,可以使機(jī)器人通過(guò)觀察人類行為來(lái)模仿動(dòng)作,從而快速學(xué)習(xí)協(xié)調(diào)、靈活性等技能。
除此之外,英偉達(dá)一直著力打造的機(jī)器人開(kāi)發(fā)和仿真環(huán)境Isaac平臺(tái)此次也升級(jí)加入了生成式 AI 基礎(chǔ)模型和仿真工具,以及針對(duì)機(jī)器人學(xué)習(xí)和操作的優(yōu)化工具。
本文鏈接:http://www.guofajx.com/news-87160.html英偉達(dá)的GPU已經(jīng)講不出“花兒”了