八戒八戒午夜视频_国产欧美一区二区三区不卡_乡村大坑的性事小说_女人脱裤子让男生桶爽在线观看

對(duì)話徐直軍:華為最大的殺招,不是AI芯片

徐直軍終于把他這六年最想說的話說了出來。

2025年華為全聯(lián)接大會(huì),會(huì)場(chǎng)的燈光一點(diǎn)點(diǎn)暗下去,大屏幕上浮現(xiàn)出“昇騰”字樣的那一瞬間,沒有想象中的轟然與熱烈,有人屏住了呼吸,有人眼眶泛紅,大家都知道,昇騰有一天會(huì)公開回歸,但真正回歸的那一刻,感慨的情緒壓過了興奮。

華為公布了未來數(shù)年完整的AI芯片路線圖——這一刻,距離2018年發(fā)布昇騰310芯片,2019年發(fā)布昇騰910芯片,已經(jīng)過去了兩千多個(gè)日與夜。

這時(shí)間說長不長,說短也不短,卻足夠讓一家企業(yè)經(jīng)歷生死沉浮。2019年的那個(gè)春天,美國的制裁讓供應(yīng)鏈幾乎在一夜之間緊繃到極限。華為一度樂觀地認(rèn)為,這種影響不會(huì)持續(xù)太久,2019年的華為全聯(lián)接大會(huì)上,華為按照既定節(jié)奏推進(jìn)昇騰910的商用發(fā)布,依舊一副云淡風(fēng)輕的模樣。

但壓力已經(jīng)遍布每一處角落。徐直軍回憶道,“按照當(dāng)時(shí)昇騰910芯片的備貨量,不敢賣給互聯(lián)網(wǎng)領(lǐng)域客戶,只賣國計(jì)民生領(lǐng)域的客戶?!敝撇孟耋E然降臨的暴風(fēng)雨,打斷了華為原本昂揚(yáng)的節(jié)奏。從榮光到孤立,從掌聲到質(zhì)疑,華為的芯片之路幾乎被外界判了“死刑”。

度過有史以來最大的難關(guān),需要付出什么代價(jià),除了華為自己,無人知曉。外界看到的華為,可能是Mate 60“爭氣機(jī)”,可能是鴻蒙操作系統(tǒng),也可能是MetaERP、高斯數(shù)據(jù)庫以及一系列確保自身生產(chǎn)經(jīng)營的中間件。

但更多華為人在蟄伏,海思、云計(jì)算、數(shù)據(jù)中心、光通信等華為大大小小的團(tuán)隊(duì),都迫不及待要加入一線,AI算力,這是華為未來真正的戰(zhàn)場(chǎng)。

今年3月份,華為正式推出了Atlas 900超節(jié)點(diǎn),可以理解為華為AI戰(zhàn)略的預(yù)告,滿配支持384卡。384顆Ascend 910C芯片,能夠像一臺(tái)計(jì)算機(jī)一樣工作,最大算力可達(dá)300 PFLOPS。到目前為止,Atlas 900依然是全球算力最大的超節(jié)點(diǎn),CloudMatrix384超節(jié)點(diǎn),是華為云基于Atlas 900超節(jié)點(diǎn)構(gòu)建的云服務(wù)實(shí)例,也被廣泛應(yīng)用于大模型的訓(xùn)推。

海外知名分析機(jī)構(gòu)SemiAnalysis,當(dāng)時(shí)以“Huawei AI CloudMatrix 384–China’s Answer to Nvidia GB200 NVL72”為題分析并得出結(jié)論,華為的芯片技術(shù)落后一代,但其自主研發(fā)的云端超級(jí)算力解決方案CloudMatrix 384卻可領(lǐng)先于英偉達(dá)和AMD當(dāng)前市售產(chǎn)品一代,直接對(duì)標(biāo)英偉達(dá)GB200 NVL72系統(tǒng),在多項(xiàng)關(guān)鍵指標(biāo)上展現(xiàn)出超越英偉達(dá)機(jī)架級(jí)解決方案的技術(shù)優(yōu)勢(shì)。

“以前英特爾允許我們使用CPU芯片互聯(lián)協(xié)議,后來也被禁止了,我們從光器件、光模塊、互聯(lián)協(xié)議、互聯(lián)芯片,全部靠重新定義、設(shè)計(jì)才能實(shí)現(xiàn),有海外企業(yè)一直想把超節(jié)點(diǎn)搞一套出去,研究我們?yōu)槭裁茨芨愠龀?jié)點(diǎn)”徐直軍說。相比于芯片本身,海外更關(guān)注超節(jié)點(diǎn),因?yàn)槟壳昂M饽茏龀龈玫男酒?,但做不出如華為一般的超節(jié)點(diǎn)。

2025年華為全聯(lián)接大會(huì),時(shí)隔多年之后,華為輪值董事長徐直軍再次與多家媒體對(duì)話——芯片不是華為AI算力的全部,“超節(jié)點(diǎn)+集群”算力解決方案是華為在AI領(lǐng)域的核心戰(zhàn)略,靈衢互聯(lián)協(xié)議是開創(chuàng)新計(jì)算架構(gòu)的新范式。

芯片很重要,也沒那么重要

“算力的基礎(chǔ)是芯片,昇騰芯片是華為AI算力戰(zhàn)略的基礎(chǔ)?!毙熘避姳硎荆?028年,華為開發(fā)和規(guī)劃了三個(gè)系列,分別是Ascend 950系列,Ascend 950PR和Ascend 950DT,以及Ascend 960、Ascend 970系列,更多具體芯片還在規(guī)劃中。

華為將以幾乎一年一代算力翻倍的速度,同時(shí)圍繞更易用,更多數(shù)據(jù)格式、更高帶寬等方向持續(xù)演進(jìn),持續(xù)滿足AI算力不斷增長的需求。

相比Ascend 910B/910C,從Ascend 950開始的主要變化包括:

引入SIMD/SIMT新同構(gòu),提升編程易用性;

支持更加豐富的數(shù)據(jù)格式,包括FP32/HF32/FP16/BF16/FP8/MXFP8/HiF8/MXFP4/HiF4等;

支持更大的互聯(lián)帶寬,其中950系列為2TB/s,970系列提升到4TB/s;

支持更大的算力,F(xiàn)P8算力從950系列的1 PFLOPS提升到960的2 PFLOPS、970的4 PFLOPS;FP4算力從950的2 PFLOPS提升到960的4 PFLOPS、970的8 PFLOPS;

自研HBM,內(nèi)存容量逐漸加倍,而內(nèi)存訪問帶寬將翻兩番。

芯片本身之外,生態(tài)是開發(fā)者關(guān)注的焦點(diǎn)問題,徐直軍表示,“國內(nèi)AI企業(yè)用昇騰訓(xùn)練大模型,主要是看他們用不用,就像談戀愛,不談的話,你怎么知道對(duì)方的優(yōu)缺點(diǎn),合適不合適,你要談一下,要用一下。在用的過程中有問題解決問題,A能用,為什么B不能用,就是你用不用的問題?!?/p>

“當(dāng)然,我們的生態(tài)和整個(gè)工具鏈肯定比英偉達(dá)有差距,原來工程師在英偉達(dá)應(yīng)用很熟練,就不愿意轉(zhuǎn)過來,它是工程師的習(xí)慣問題,而不是高層的問題。”他補(bǔ)充。

業(yè)界不少芯片廠商選擇兼容英偉達(dá)CUDA生態(tài),對(duì)現(xiàn)有AI開發(fā)體系友好,但華為有自己的考量。“我們不兼容CUDA生態(tài),一定要搞CANN生態(tài)和MindSpore,也是出于長遠(yuǎn)考慮,如果我們投如此多的錢兼容CUDA生態(tài),而且還是CUDA過去的版本,哪天CUDA生態(tài)兼容不了了怎么辦?堅(jiān)定不移研發(fā)MindSpore,當(dāng)時(shí)很多專家都反對(duì)。現(xiàn)在我們的AI,從達(dá)芬奇到昇騰芯片到一切,所有的軟件、硬件都不依賴于西方生態(tài)和供應(yīng)鏈,長遠(yuǎn)考慮必須要把生態(tài)構(gòu)建起來。”徐直軍坦言。

如果故事只到這里,華為充其量實(shí)現(xiàn)了“活下來”的任務(wù),很好,但對(duì)華為來說遠(yuǎn)不夠好。畢竟在昇騰設(shè)計(jì)之初,就不是為了做一個(gè)備份,昇騰910發(fā)布就沖著最強(qiáng)算力的目標(biāo),在供應(yīng)鏈和制程等芯片制造能力落后的情況下,華為昇騰芯片短期內(nèi)還將處于追趕的狀態(tài)。

然而,很多人沒有意識(shí)到,成就英偉達(dá)的大模型,其實(shí)下一個(gè)成就的就是華為,大模型前期,英偉達(dá)受益于單個(gè)GPU卡的性能和CUDA生態(tài),未來隨著AI的演進(jìn),華為受益的是“超節(jié)點(diǎn)+集群”,后者已經(jīng)在頂級(jí)大模型圈層得到認(rèn)可,而普羅大眾的認(rèn)知不強(qiáng)。

超節(jié)點(diǎn)+集群,讓中國沒有算力之憂

2022年,英偉達(dá)曾發(fā)布DGX H100 NVL256“Ranger”平臺(tái),但最終未投入量產(chǎn)——該方案因成本過高、功耗巨大且可靠性問題(源于超量光收發(fā)器需求及雙層網(wǎng)絡(luò)架構(gòu))而被放棄。在2024年3月,英偉達(dá)轉(zhuǎn)而推出基于Blackwell GPU打造的GB200 NVL72超節(jié)點(diǎn)產(chǎn)品,規(guī)模大幅縮小。

回過頭看,英偉達(dá)的超節(jié)點(diǎn)路標(biāo)已經(jīng)消失不見,英偉達(dá)既證明了超節(jié)點(diǎn)是未來算力的趨勢(shì),也證明了超節(jié)點(diǎn)做起來的難度,華為接過AI算力的下一棒。

本次大會(huì)上,華為發(fā)布了最新超節(jié)點(diǎn)產(chǎn)品Atlas 950 SuperPoD和Atlas 960 SuperPoD超節(jié)點(diǎn),分別支持8192及15488張昇騰卡,在卡規(guī)模、總算力、內(nèi)存容量、互聯(lián)帶寬等關(guān)鍵指標(biāo)上全面領(lǐng)先,在未來多年都將是全球最強(qiáng)算力的超節(jié)點(diǎn)。

基于超節(jié)點(diǎn),華為同時(shí)發(fā)布了全球最強(qiáng)超節(jié)點(diǎn)集群,分別是Atlas 950 SuperCluster和Atlas 960 SuperCluster,算力規(guī)模分別超過50萬卡和達(dá)到百萬卡,是當(dāng)之無愧的全世界最強(qiáng)算力集群。

除了單顆芯片比它(英偉達(dá))的算力小一點(diǎn),功耗大一點(diǎn),其他都是優(yōu)勢(shì)?!?/span>徐直軍如此評(píng)價(jià),“因?yàn)锳I就是并行計(jì)算,所以我們的解決方案就是超節(jié)點(diǎn),超節(jié)點(diǎn)做成一臺(tái)機(jī)器,你用5顆,我可以用10顆,那我們用384/8192/15488顆芯片,這還不是最大的?!?/p>

他進(jìn)一步解釋道,(華為)不同于大模型公司,也不同于應(yīng)用公司,作為ICT基礎(chǔ)設(shè)施和智能終端提供商,華為充分發(fā)揮自身優(yōu)勢(shì),扎扎實(shí)實(shí)把基礎(chǔ)設(shè)施做好,通過基礎(chǔ)設(shè)施掙錢,做超節(jié)點(diǎn)、做集群,公司內(nèi)部已達(dá)成共識(shí),通過昇騰硬件變現(xiàn),取得商業(yè)成功。

超節(jié)點(diǎn)是一條不得已的道路,也是能夠?qū)⑷A為所有能力融為一體,最大程度發(fā)揮華為優(yōu)勢(shì)的道路,更具有決定意義的是,超節(jié)點(diǎn)能夠?qū)⑷A為在單芯片的劣勢(shì)扭轉(zhuǎn)為勝勢(shì),超過英偉達(dá),實(shí)現(xiàn)算力最強(qiáng)。

“什么叫超節(jié)點(diǎn)?盡管物理上是多機(jī)柜、多個(gè)卡(8192個(gè)卡或者是15488個(gè)卡)聯(lián)接成一個(gè)超節(jié)點(diǎn),但是它們能夠像一臺(tái)計(jì)算機(jī)一樣工作、學(xué)習(xí)、思考、推理。集群是把多個(gè)超節(jié)點(diǎn)以網(wǎng)絡(luò)聯(lián)結(jié)在一起,就像云服務(wù)一樣,相當(dāng)于用多個(gè)服務(wù)器一樣,即把多臺(tái)服務(wù)器連接在一起,再以軟件層將它調(diào)度?!毙熘避娬f。

他進(jìn)一步表示,華為的核心戰(zhàn)略就是“超節(jié)點(diǎn)+集群”,只有依靠超節(jié)點(diǎn)和集群,才能規(guī)避中國的芯片制造工藝受限,才能夠?yàn)橹袊腁I算力提供源源不斷的算力支持和供給。

創(chuàng)新有時(shí)是被逼出來的,不是天生想做。我們應(yīng)對(duì)制裁,用非摩爾補(bǔ)摩爾、用數(shù)學(xué)補(bǔ)物理,不是什么偉大的事情。歷史上海思靠芯片領(lǐng)先別人一代,現(xiàn)在芯片落后一代、兩代,未來還不知道落后幾代,只有另尋出路。另一條路就在這里,由于芯片工藝受限,逼著我們創(chuàng)新突破”徐直軍說。

靈衢,以及華為自己的路

在徐直軍大會(huì)演講的最后,并不是以芯片來收尾,“我們希望和產(chǎn)業(yè)界一起,以開創(chuàng)的靈衢超節(jié)點(diǎn)互聯(lián)技術(shù),引領(lǐng)AI基礎(chǔ)設(shè)施新范式;以基于靈衢的超節(jié)點(diǎn)和集群持續(xù)滿足算力快速增長的需求,推動(dòng)人工智能持續(xù)發(fā)展,創(chuàng)造更大的價(jià)值?!?/p>

在業(yè)內(nèi)人士看來,靈衢的革命意義可能不亞于AI基礎(chǔ)設(shè)施的再造,華為超節(jié)點(diǎn)+集群的成功,很大程度就依賴于靈衢。如果說光刻機(jī)是把單芯片的性能持續(xù)放大,那么,靈衢則是將數(shù)以萬計(jì)的芯片聯(lián)接起來。

2021年,華為規(guī)劃了個(gè)公司級(jí)別的戰(zhàn)略項(xiàng)目,其中之一是鴻蒙操作系統(tǒng),另一個(gè)就是靈衢,其戰(zhàn)略意義,可見一斑。

英偉達(dá)或者其他芯片公司的長處在于芯片,超節(jié)點(diǎn)卻不是靠簡單堆芯片就能實(shí)現(xiàn)大算力,就像大模型訓(xùn)練算力,在一定范圍內(nèi),算力隨著芯片數(shù)量的增加線性增長,到了一定瓶頸,芯片增加,邊際效應(yīng)大幅降低。

為大模型而定做的算力集群中,需要大量的數(shù)據(jù)高速傳輸,在人類歷史上沒有過這種,正向打滿然后負(fù)向再打滿的傳輸需求,低時(shí)延、高吞吐的要求都到了嚴(yán)苛級(jí)別,而且未來的算力不僅僅是當(dāng)前大模型需要AI算力之間的高速互聯(lián),同時(shí),AI算力和通用算力之間,通算和通算之間,也存在高速互聯(lián)的需求。

隨著IT產(chǎn)業(yè)的發(fā)展,PCIE、InfiniBand、RoCE等各種協(xié)議并行發(fā)展,英偉達(dá)的NVlink等協(xié)議最大化發(fā)揮了英偉達(dá)GPU的算力,靈衢不止是一個(gè)替代,它是AI算力互聯(lián)標(biāo)準(zhǔn)的重塑,通過靈衢互聯(lián)協(xié)議,能夠把數(shù)萬規(guī)模的計(jì)算卡,聯(lián)接成一個(gè)超節(jié)點(diǎn)。

相較于NVlink協(xié)議的封閉,華為宣布將開放靈衢2.0技術(shù)規(guī)范,投入如此之大的心力,華為為何要將靈衢開放,其實(shí)不難理解,華為的理念是硬件變現(xiàn),靈衢若只是華為一家之言,那就無法形成生態(tài),更多的企業(yè)用靈衢構(gòu)建自己的算力集群,產(chǎn)業(yè)的雪球才能越滾越大。

“我們的路肯定不是英偉達(dá)的路,現(xiàn)在大家都以英偉達(dá)的視角看我們的路,不公平。但我們自己不能‘傻’。我是短期痛苦,長期不痛苦?!毙熘避娬f。

華為在AI算力領(lǐng)域走出來了一條自己的路,這是由很多能力構(gòu)建成的系統(tǒng)。以光通信技術(shù)為例,英偉達(dá)超節(jié)點(diǎn)采用了全銅通信,優(yōu)點(diǎn)是技術(shù)成熟,成本較低,缺點(diǎn)是只能部署2米以內(nèi),否則速度會(huì)大幅衰減,因此可聯(lián)接芯片數(shù)量有限。華為采用了更激進(jìn)的光通信策略,光模塊帶來了高帶寬和高速率的優(yōu)勢(shì),損耗低,適合長距離傳輸,因而可聯(lián)接更多芯片,部署靈活。

但是,在華為之前,沒有一家廠商敢用光模塊來實(shí)現(xiàn)超節(jié)點(diǎn),光模塊故障率高且成本高,方案能不能做成都是未知數(shù),華為憑借著多年積累的通信能力,在光芯片和連接技術(shù)、故障恢復(fù)等方面形成了一套獨(dú)一無二的方案,使得超節(jié)點(diǎn)成為可能。

華為的勝利,是系統(tǒng)的勝利,是所有華為人乃至中國計(jì)算產(chǎn)業(yè)鏈的勝利。徐直軍表示,“用超節(jié)點(diǎn)架構(gòu)以及支持超節(jié)點(diǎn)的靈衢互聯(lián)協(xié)議,打造超節(jié)點(diǎn)和集群,來滿足我國無窮無盡的算力需求,這既是我們對(duì)自己的一個(gè)目標(biāo),又是對(duì)產(chǎn)業(yè)界的承諾,更是對(duì)國家的承諾?!?/span>

“把這條路闖出來,把中國產(chǎn)業(yè)鏈拉動(dòng)起來,這條路就成了路。算不上新范式,是被迫出來的范式,是被逼出來的偉大?!毙熘避娬f,“誰想做別人做過的事情呢?肯定想去開創(chuàng)未來的事情?!?/span>


相關(guān)內(nèi)容