對(duì)話徐直軍：華為最大的殺招，不是AI芯片

鈦媒體

2025-09-22 16:05:04

徐直軍終于把他這六年最想說的話說了出來。

2025年華為全聯(lián)接大會(huì)，會(huì)場(chǎng)的燈光一點(diǎn)點(diǎn)暗下去，大屏幕上浮現(xiàn)出“昇騰”字樣的那一瞬間，沒有想象中的轟然與熱烈，有人屏住了呼吸，有人眼眶泛紅，大家都知道，昇騰有一天會(huì)公開回歸，但真正回歸的那一刻，感慨的情緒壓過了興奮。

華為公布了未來數(shù)年完整的AI芯片路線圖——這一刻，距離2018年發(fā)布昇騰310芯片，2019年發(fā)布昇騰910芯片，已經(jīng)過去了兩千多個(gè)日與夜。

這時(shí)間說長不長，說短也不短，卻足夠讓一家企業(yè)經(jīng)歷生死沉浮。2019年的那個(gè)春天，美國的制裁讓供應(yīng)鏈幾乎在一夜之間緊繃到極限。華為一度樂觀地認(rèn)為，這種影響不會(huì)持續(xù)太久，2019年的華為全聯(lián)接大會(huì)上，華為按照既定節(jié)奏推進(jìn)昇騰910的商用發(fā)布，依舊一副云淡風(fēng)輕的模樣。

但壓力已經(jīng)遍布每一處角落。徐直軍回憶道，“按照當(dāng)時(shí)昇騰910芯片的備貨量，不敢賣給互聯(lián)網(wǎng)領(lǐng)域客戶，只賣國計(jì)民生領(lǐng)域的客戶?！敝撇孟耋E然降臨的暴風(fēng)雨，打斷了華為原本昂揚(yáng)的節(jié)奏。從榮光到孤立，從掌聲到質(zhì)疑，華為的芯片之路幾乎被外界判了“死刑”。

度過有史以來最大的難關(guān)，需要付出什么代價(jià)，除了華為自己，無人知曉。外界看到的華為，可能是Mate 60“爭氣機(jī)”，可能是鴻蒙操作系統(tǒng)，也可能是MetaERP、高斯數(shù)據(jù)庫以及一系列確保自身生產(chǎn)經(jīng)營的中間件。

但更多華為人在蟄伏，海思、云計(jì)算、數(shù)據(jù)中心、光通信等華為大大小小的團(tuán)隊(duì)，都迫不及待要加入一線，AI算力，這是華為未來真正的戰(zhàn)場(chǎng)。

今年3月份，華為正式推出了Atlas 900超節(jié)點(diǎn)，可以理解為華為AI戰(zhàn)略的預(yù)告，滿配支持384卡。384顆Ascend 910C芯片，能夠像一臺(tái)計(jì)算機(jī)一樣工作，最大算力可達(dá)300 PFLOPS。到目前為止，Atlas 900依然是全球算力最大的超節(jié)點(diǎn)，CloudMatrix384超節(jié)點(diǎn)，是華為云基于Atlas 900超節(jié)點(diǎn)構(gòu)建的云服務(wù)實(shí)例，也被廣泛應(yīng)用于大模型的訓(xùn)推。

海外知名分析機(jī)構(gòu)SemiAnalysis，當(dāng)時(shí)以“Huawei AI CloudMatrix 384–China’s Answer to Nvidia GB200 NVL72”為題分析并得出結(jié)論，華為的芯片技術(shù)落后一代，但其自主研發(fā)的云端超級(jí)算力解決方案CloudMatrix 384卻可領(lǐng)先于英偉達(dá)和AMD當(dāng)前市售產(chǎn)品一代，直接對(duì)標(biāo)英偉達(dá)GB200 NVL72系統(tǒng)，在多項(xiàng)關(guān)鍵指標(biāo)上展現(xiàn)出超越英偉達(dá)機(jī)架級(jí)解決方案的技術(shù)優(yōu)勢(shì)。

“以前英特爾允許我們使用CPU芯片互聯(lián)協(xié)議，后來也被禁止了，我們從光器件、光模塊、互聯(lián)協(xié)議、互聯(lián)芯片，全部靠重新定義、設(shè)計(jì)才能實(shí)現(xiàn)，有海外企業(yè)一直想把超節(jié)點(diǎn)搞一套出去，研究我們?yōu)槭裁茨芨愠龀?jié)點(diǎn)”徐直軍說。相比于芯片本身，海外更關(guān)注超節(jié)點(diǎn)，因?yàn)槟壳昂Ｍ饽茏龀龈玫男酒?，但做不出如華為一般的超節(jié)點(diǎn)。

2025年華為全聯(lián)接大會(huì)，時(shí)隔多年之后，華為輪值董事長徐直軍再次與多家媒體對(duì)話——芯片不是華為AI算力的全部，“超節(jié)點(diǎn)+集群”算力解決方案是華為在AI領(lǐng)域的核心戰(zhàn)略，靈衢互聯(lián)協(xié)議是開創(chuàng)新計(jì)算架構(gòu)的新范式。

芯片很重要，也沒那么重要

“算力的基礎(chǔ)是芯片，昇騰芯片是華為AI算力戰(zhàn)略的基礎(chǔ)?！毙熘避姳硎荆?028年，華為開發(fā)和規(guī)劃了三個(gè)系列，分別是Ascend 950系列，Ascend 950PR和Ascend 950DT，以及Ascend 960、Ascend 970系列，更多具體芯片還在規(guī)劃中。

華為將以幾乎一年一代算力翻倍的速度，同時(shí)圍繞更易用，更多數(shù)據(jù)格式、更高帶寬等方向持續(xù)演進(jìn)，持續(xù)滿足AI算力不斷增長的需求。

相比Ascend 910B/910C，從Ascend 950開始的主要變化包括：

引入SIMD/SIMT新同構(gòu)，提升編程易用性；

支持更加豐富的數(shù)據(jù)格式，包括FP32/HF32/FP16/BF16/FP8/MXFP8/HiF8/MXFP4/HiF4等；

支持更大的互聯(lián)帶寬，其中950系列為2TB/s，970系列提升到4TB/s；

支持更大的算力，F(xiàn)P8算力從950系列的1 PFLOPS提升到960的2 PFLOPS、970的4 PFLOPS；FP4算力從950的2 PFLOPS提升到960的4 PFLOPS、970的8 PFLOPS；

自研HBM，內(nèi)存容量逐漸加倍，而內(nèi)存訪問帶寬將翻兩番。

芯片本身之外，生態(tài)是開發(fā)者關(guān)注的焦點(diǎn)問題，徐直軍表示，“國內(nèi)AI企業(yè)用昇騰訓(xùn)練大模型，主要是看他們用不用，就像談戀愛，不談的話，你怎么知道對(duì)方的優(yōu)缺點(diǎn)，合適不合適，你要談一下，要用一下。在用的過程中有問題解決問題，A能用，為什么B不能用，就是你用不用的問題?！?/p>

“當(dāng)然，我們的生態(tài)和整個(gè)工具鏈肯定比英偉達(dá)有差距，原來工程師在英偉達(dá)應(yīng)用很熟練，就不愿意轉(zhuǎn)過來，它是工程師的習(xí)慣問題，而不是高層的問題。”他補(bǔ)充。

業(yè)界不少芯片廠商選擇兼容英偉達(dá)CUDA生態(tài)，對(duì)現(xiàn)有AI開發(fā)體系友好，但華為有自己的考量。“我們不兼容CUDA生態(tài)，一定要搞CANN生態(tài)和MindSpore，也是出于長遠(yuǎn)考慮，如果我們投如此多的錢兼容CUDA生態(tài)，而且還是CUDA過去的版本，哪天CUDA生態(tài)兼容不了了怎么辦？堅(jiān)定不移研發(fā)MindSpore，當(dāng)時(shí)很多專家都反對(duì)。現(xiàn)在我們的AI，從達(dá)芬奇到昇騰芯片到一切，所有的軟件、硬件都不依賴于西方生態(tài)和供應(yīng)鏈，長遠(yuǎn)考慮必須要把生態(tài)構(gòu)建起來。”徐直軍坦言。

如果故事只到這里，華為充其量實(shí)現(xiàn)了“活下來”的任務(wù)，很好，但對(duì)華為來說遠(yuǎn)不夠好。畢竟在昇騰設(shè)計(jì)之初，就不是為了做一個(gè)備份，昇騰910發(fā)布就沖著最強(qiáng)算力的目標(biāo)，在供應(yīng)鏈和制程等芯片制造能力落后的情況下，華為昇騰芯片短期內(nèi)還將處于追趕的狀態(tài)。

然而，很多人沒有意識(shí)到，成就英偉達(dá)的大模型，其實(shí)下一個(gè)成就的就是華為，大模型前期，英偉達(dá)受益于單個(gè)GPU卡的性能和CUDA生態(tài)，未來隨著AI的演進(jìn)，華為受益的是“超節(jié)點(diǎn)+集群”，后者已經(jīng)在頂級(jí)大模型圈層得到認(rèn)可，而普羅大眾的認(rèn)知不強(qiáng)。

超節(jié)點(diǎn)+集群，讓中國沒有算力之憂

2022年，英偉達(dá)曾發(fā)布DGX H100 NVL256“Ranger”平臺(tái)，但最終未投入量產(chǎn)——該方案因成本過高、功耗巨大且可靠性問題（源于超量光收發(fā)器需求及雙層網(wǎng)絡(luò)架構(gòu)）而被放棄。在2024年3月，英偉達(dá)轉(zhuǎn)而推出基于Blackwell GPU打造的GB200 NVL72超節(jié)點(diǎn)產(chǎn)品，規(guī)模大幅縮小。

回過頭看，英偉達(dá)的超節(jié)點(diǎn)路標(biāo)已經(jīng)消失不見，英偉達(dá)既證明了超節(jié)點(diǎn)是未來算力的趨勢(shì)，也證明了超節(jié)點(diǎn)做起來的難度，華為接過AI算力的下一棒。

本次大會(huì)上，華為發(fā)布了最新超節(jié)點(diǎn)產(chǎn)品Atlas 950 SuperPoD和Atlas 960 SuperPoD超節(jié)點(diǎn)，分別支持8192及15488張昇騰卡，在卡規(guī)模、總算力、內(nèi)存容量、互聯(lián)帶寬等關(guān)鍵指標(biāo)上全面領(lǐng)先，在未來多年都將是全球最強(qiáng)算力的超節(jié)點(diǎn)。

基于超節(jié)點(diǎn)，華為同時(shí)發(fā)布了全球最強(qiáng)超節(jié)點(diǎn)集群，分別是Atlas 950 SuperCluster和Atlas 960 SuperCluster，算力規(guī)模分別超過50萬卡和達(dá)到百萬卡，是當(dāng)之無愧的全世界最強(qiáng)算力集群。

“除了單顆芯片比它（英偉達(dá)）的算力小一點(diǎn)，功耗大一點(diǎn)，其他都是優(yōu)勢(shì)?！?/span>徐直軍如此評(píng)價(jià)，“因?yàn)锳I就是并行計(jì)算，所以我們的解決方案就是超節(jié)點(diǎn)，超節(jié)點(diǎn)做成一臺(tái)機(jī)器，你用5顆，我可以用10顆，那我們用384/8192/15488顆芯片，這還不是最大的?！?/p>

他進(jìn)一步解釋道，（華為）不同于大模型公司，也不同于應(yīng)用公司，作為ICT基礎(chǔ)設(shè)施和智能終端提供商，華為充分發(fā)揮自身優(yōu)勢(shì)，扎扎實(shí)實(shí)把基礎(chǔ)設(shè)施做好，通過基礎(chǔ)設(shè)施掙錢，做超節(jié)點(diǎn)、做集群，公司內(nèi)部已達(dá)成共識(shí)，通過昇騰硬件變現(xiàn)，取得商業(yè)成功。

超節(jié)點(diǎn)是一條不得已的道路，也是能夠?qū)⑷A為所有能力融為一體，最大程度發(fā)揮華為優(yōu)勢(shì)的道路，更具有決定意義的是，超節(jié)點(diǎn)能夠?qū)⑷A為在單芯片的劣勢(shì)扭轉(zhuǎn)為勝勢(shì)，超過英偉達(dá)，實(shí)現(xiàn)算力最強(qiáng)。

“什么叫超節(jié)點(diǎn)？盡管物理上是多機(jī)柜、多個(gè)卡（8192個(gè)卡或者是15488個(gè)卡）聯(lián)接成一個(gè)超節(jié)點(diǎn)，但是它們能夠像一臺(tái)計(jì)算機(jī)一樣工作、學(xué)習(xí)、思考、推理。集群是把多個(gè)超節(jié)點(diǎn)以網(wǎng)絡(luò)聯(lián)結(jié)在一起，就像云服務(wù)一樣，相當(dāng)于用多個(gè)服務(wù)器一樣，即把多臺(tái)服務(wù)器連接在一起，再以軟件層將它調(diào)度?！毙熘避娬f。

他進(jìn)一步表示，華為的核心戰(zhàn)略就是“超節(jié)點(diǎn)+集群”，只有依靠超節(jié)點(diǎn)和集群，才能規(guī)避中國的芯片制造工藝受限，才能夠?yàn)橹袊腁I算力提供源源不斷的算力支持和供給。

“創(chuàng)新有時(shí)是被逼出來的，不是天生想做。我們應(yīng)對(duì)制裁，用非摩爾補(bǔ)摩爾、用數(shù)學(xué)補(bǔ)物理，不是什么偉大的事情。歷史上海思靠芯片領(lǐng)先別人一代，現(xiàn)在芯片落后一代、兩代，未來還不知道落后幾代，只有另尋出路。另一條路就在這里，由于芯片工藝受限，逼著我們創(chuàng)新突破。”徐直軍說。

靈衢，以及華為自己的路

在徐直軍大會(huì)演講的最后，并不是以芯片來收尾，“我們希望和產(chǎn)業(yè)界一起，以開創(chuàng)的靈衢超節(jié)點(diǎn)互聯(lián)技術(shù)，引領(lǐng)AI基礎(chǔ)設(shè)施新范式；以基于靈衢的超節(jié)點(diǎn)和集群持續(xù)滿足算力快速增長的需求，推動(dòng)人工智能持續(xù)發(fā)展，創(chuàng)造更大的價(jià)值?！?/p>

在業(yè)內(nèi)人士看來，靈衢的革命意義可能不亞于AI基礎(chǔ)設(shè)施的再造，華為超節(jié)點(diǎn)+集群的成功，很大程度就依賴于靈衢。如果說光刻機(jī)是把單芯片的性能持續(xù)放大，那么，靈衢則是將數(shù)以萬計(jì)的芯片聯(lián)接起來。

2021年，華為規(guī)劃了三個(gè)公司級(jí)別的戰(zhàn)略項(xiàng)目，其中之一是鴻蒙操作系統(tǒng)，另一個(gè)就是靈衢，其戰(zhàn)略意義，可見一斑。

英偉達(dá)或者其他芯片公司的長處在于芯片，超節(jié)點(diǎn)卻不是靠簡單堆芯片就能實(shí)現(xiàn)大算力，就像大模型訓(xùn)練算力，在一定范圍內(nèi)，算力隨著芯片數(shù)量的增加線性增長，到了一定瓶頸，芯片增加，邊際效應(yīng)大幅降低。

為大模型而定做的算力集群中，需要大量的數(shù)據(jù)高速傳輸，在人類歷史上沒有過這種，正向打滿然后負(fù)向再打滿的傳輸需求，低時(shí)延、高吞吐的要求都到了嚴(yán)苛級(jí)別，而且未來的算力不僅僅是當(dāng)前大模型需要AI算力之間的高速互聯(lián)，同時(shí)，AI算力和通用算力之間，通算和通算之間，也存在高速互聯(lián)的需求。

隨著IT產(chǎn)業(yè)的發(fā)展，PCIE、InfiniBand、RoCE等各種協(xié)議并行發(fā)展，英偉達(dá)的NVlink等協(xié)議最大化發(fā)揮了英偉達(dá)GPU的算力，靈衢不止是一個(gè)替代，它是AI算力互聯(lián)標(biāo)準(zhǔn)的重塑，通過靈衢互聯(lián)協(xié)議，能夠把數(shù)萬規(guī)模的計(jì)算卡，聯(lián)接成一個(gè)超節(jié)點(diǎn)。

相較于NVlink協(xié)議的封閉，華為宣布將開放靈衢2.0技術(shù)規(guī)范，投入如此之大的心力，華為為何要將靈衢開放，其實(shí)不難理解，華為的理念是硬件變現(xiàn)，靈衢若只是華為一家之言，那就無法形成生態(tài)，更多的企業(yè)用靈衢構(gòu)建自己的算力集群，產(chǎn)業(yè)的雪球才能越滾越大。

“我們的路肯定不是英偉達(dá)的路，現(xiàn)在大家都以英偉達(dá)的視角看我們的路，不公平。但我們自己不能‘傻’。我是短期痛苦，長期不痛苦?！毙熘避娬f。

華為在AI算力領(lǐng)域走出來了一條自己的路，這是由很多能力構(gòu)建成的系統(tǒng)。以光通信技術(shù)為例，英偉達(dá)超節(jié)點(diǎn)采用了全銅通信，優(yōu)點(diǎn)是技術(shù)成熟，成本較低，缺點(diǎn)是只能部署2米以內(nèi)，否則速度會(huì)大幅衰減，因此可聯(lián)接芯片數(shù)量有限。華為采用了更激進(jìn)的光通信策略，光模塊帶來了高帶寬和高速率的優(yōu)勢(shì)，損耗低，適合長距離傳輸，因而可聯(lián)接更多芯片，部署靈活。

但是，在華為之前，沒有一家廠商敢用光模塊來實(shí)現(xiàn)超節(jié)點(diǎn)，光模塊故障率高且成本高，方案能不能做成都是未知數(shù)，華為憑借著多年積累的通信能力，在光芯片和連接技術(shù)、故障恢復(fù)等方面形成了一套獨(dú)一無二的方案，使得超節(jié)點(diǎn)成為可能。

華為的勝利，是系統(tǒng)的勝利，是所有華為人乃至中國計(jì)算產(chǎn)業(yè)鏈的勝利。徐直軍表示，“用超節(jié)點(diǎn)架構(gòu)以及支持超節(jié)點(diǎn)的靈衢互聯(lián)協(xié)議，打造超節(jié)點(diǎn)和集群，來滿足我國無窮無盡的算力需求，這既是我們對(duì)自己的一個(gè)目標(biāo)，又是對(duì)產(chǎn)業(yè)界的承諾，更是對(duì)國家的承諾?！?/span>

“把這條路闖出來，把中國產(chǎn)業(yè)鏈拉動(dòng)起來，這條路就成了路。算不上新范式，是被迫出來的范式，是被逼出來的偉大?！毙熘避娬f，“誰想做別人做過的事情呢？肯定想去開創(chuàng)未來的事情?！?/span>

上一篇：中國首例介入式腦機(jī)接口成功應(yīng)用，幫助偏癱患者重新行走

下一篇：雷軍談造車和重啟造芯：押上小米十年家底，壓力巨大

八戒八戒午夜视频_国产欧美一区二区三区不卡_乡村大坑的性事小说_女人脱裤子让男生桶爽在线观看