過(guò)去幾天,中美經(jīng)貿(mào)關(guān)系發(fā)生著極速變化。而變化的主基調(diào)是,美國(guó)希望從貿(mào)易戰(zhàn)的短期沖撞,重新回到長(zhǎng)期進(jìn)行,同時(shí)也更加殘酷的科技絞殺上。
5月12日中美雙方發(fā)布聯(lián)合聲明,決定大幅下降關(guān)稅。緊隨其后的5月14日,美國(guó)政府亮出了瞄準(zhǔn)中國(guó)AI的“獠牙”,美國(guó)商務(wù)部工業(yè)與安全局(BIS)突然宣布,即日起在全球范圍內(nèi)禁用中國(guó)先進(jìn)集成電路。
美國(guó)出招絕非無(wú)的放矢,就在一個(gè)月前,華為發(fā)布了CloudMatrix384 超節(jié)點(diǎn),該技術(shù)通過(guò)384張卡構(gòu)建超節(jié)點(diǎn)集群,超級(jí)云服務(wù)器,最高提供300Pflops的算力規(guī)模。這意味著,美國(guó)通過(guò)N卡禁售來(lái)限制中國(guó)AI算力發(fā)展的技術(shù)圍堵,或?qū)⒈粡氐状蚱啤?/p>
從DeepSeek的算法層突破,到CloudMatrix384的算力層突圍,中國(guó)AI正以系統(tǒng)性創(chuàng)新,彌補(bǔ)單芯片制程差距,美國(guó)發(fā)現(xiàn)其“卡脖子”邏輯正在失效。
接下來(lái),美國(guó)必然會(huì)進(jìn)一步打壓中國(guó)AI的任何生存空間,更證明了模型自主與算力自強(qiáng)的重要性。昇騰云算力就是出路,就是防線。
5月16日,華為云AI峰會(huì)中,華為云副總裁黃瑾又進(jìn)一步披露了更多CloudMatrix 384 超節(jié)點(diǎn)的創(chuàng)新技術(shù)細(xì)節(jié)。CloudMatrix 384 超節(jié)點(diǎn)持續(xù)壯大,把“殺不死你的必會(huì)讓你更強(qiáng)大”寫(xiě)進(jìn)現(xiàn)實(shí)。
過(guò)去的8年里,單卡硬件的算力增長(zhǎng)了40倍,但是節(jié)點(diǎn)內(nèi)的總線帶寬只增長(zhǎng)了9倍,跨節(jié)點(diǎn)的網(wǎng)絡(luò)帶寬只增長(zhǎng)了4倍。集群網(wǎng)絡(luò)通信成為當(dāng)前大模型訓(xùn)練和推理的最大挑戰(zhàn),也是科技競(jìng)逐的焦點(diǎn)之一。
514美國(guó)禁令的恐懼根源,或許就在于昇騰的架構(gòu)創(chuàng)新,破解了網(wǎng)絡(luò)帶寬拓展比單卡算力增長(zhǎng)更滯后的技術(shù)難題,使CloudMatrix384 實(shí)現(xiàn)了集群穩(wěn)定性,中國(guó)AI的算力長(zhǎng)城,正在CloudMatrix384的基石上崛起。
具體來(lái)說(shuō),CloudMatrix 384 超節(jié)點(diǎn)實(shí)現(xiàn)了MatrixLink超節(jié)點(diǎn)網(wǎng)絡(luò)服務(wù)。這項(xiàng)技術(shù)能夠通過(guò)擴(kuò)展訓(xùn)練集群實(shí)現(xiàn)大模型的訓(xùn)推性能提升20%,從而在網(wǎng)絡(luò)側(cè)滿足最為苛刻的模型推訓(xùn)需求。
突破了內(nèi)外部通信瓶頸的CloudMatrix 384,實(shí)現(xiàn)了AI算力資源的集約式高效利用,以及超大規(guī)模AI訓(xùn)練集群可云上獲取,支撐昇騰AI云服務(wù)以更高的算力利用率、更高的算力可用度、更高的吞吐率以及更低的成本,為千行百業(yè)智能化提供充沛且普惠的云上AI算力服務(wù),從而為中國(guó)AI算力爭(zhēng)取到了長(zhǎng)足的領(lǐng)先空間與發(fā)展窗口。
更值得一提的是,當(dāng)產(chǎn)業(yè)從萬(wàn)卡向十萬(wàn)卡集群演進(jìn),超節(jié)點(diǎn)修筑AI算力長(zhǎng)城的腳步也并未停下。華為云AI峰會(huì)上,華為云公布了CloudMatrix 384 超節(jié)點(diǎn)的創(chuàng)新技術(shù)優(yōu)勢(shì)。
昇騰云和CloudMatrix 384 超節(jié)點(diǎn),實(shí)現(xiàn)了MoE親和、以網(wǎng)強(qiáng)算、以存強(qiáng)算、長(zhǎng)穩(wěn)可靠、朝推夜訓(xùn)、即開(kāi)即用六大科技創(chuàng)新,這些創(chuàng)新如同“技術(shù)磚石”,穩(wěn)固支撐AI 產(chǎn)業(yè)發(fā)展更進(jìn)一步,成為AI時(shí)代理想的基礎(chǔ)設(shè)施。
為什么這么說(shuō)?這就要提到各行各業(yè)的AI訓(xùn)推需求,要求云上算力,豎起三道重要的防線:
一是算力充沛的性能防線。
正如杰文斯悖論所說(shuō)的,Deepseek雖然降低了單個(gè)模型對(duì)算力的需求,但隨著應(yīng)用AI的用戶越來(lái)越多,算力資源的總需求量非但沒(méi)有減少,反而進(jìn)一步增加了。這一背景下,國(guó)產(chǎn)AI算力面臨雙重困境,一是單卡性能落后英偉達(dá)最新產(chǎn)品,二是多卡集群會(huì)“打群架”,堆卡但不增效。而提升算力集群的資源利用率,需要存儲(chǔ)(存力)、網(wǎng)絡(luò)(運(yùn)力)的共同做功,來(lái)適配最新的計(jì)算架構(gòu)。
簡(jiǎn)單來(lái)說(shuō),在DeepSeek的推動(dòng)下,MoE已經(jīng)成為主流大模型共同追求的實(shí)踐路徑,所謂MoE架構(gòu),就是從GPT4這樣的少量大專(zhuān)家的超大規(guī)模參數(shù)模型,變成了大量小專(zhuān)家的模式,在每張卡上都部署多個(gè)小專(zhuān)家。但傳統(tǒng)架構(gòu)下,MoE模型容易因?yàn)閷?zhuān)家負(fù)載不均、AllToAll通信延遲等,導(dǎo)致算力浪費(fèi),降低資源利用率。
CloudMatrix 384 超節(jié)點(diǎn)的分布式推理平臺(tái)可以說(shuō)是專(zhuān)為MoE大模型而生,具有MoE親和的技術(shù)特性。對(duì)比一卡多專(zhuān)家的“小作坊模式”,超節(jié)點(diǎn)通過(guò)高速互聯(lián)總線,降低跨機(jī)通信損耗,從而實(shí)現(xiàn)一卡一專(zhuān)家高效分布式推理,單卡的MoE計(jì)算和通信效率都大幅提升。通過(guò)聯(lián)接力打破單點(diǎn)算力的性能制約,最大限度地釋放算力共振的能力,也體現(xiàn)了超節(jié)點(diǎn)以網(wǎng)強(qiáng)算的技術(shù)優(yōu)勢(shì)。
除了網(wǎng)絡(luò)通訊,顯存容量不高也會(huì)制約MoE模型的開(kāi)發(fā)。大模型推理的不同階段,對(duì)計(jì)算/訪存的資源需求其實(shí)并不一致,比如prefill階段需要高算力,而decode階段需要高防存,但傳統(tǒng)“存算綁定”的模式不夠靈活,就限制了資源利用和性能吞吐。
解決MoE模型的“存力”難題,華為云首創(chuàng)了EMS彈性內(nèi)存存儲(chǔ),通過(guò)內(nèi)存池化技術(shù),實(shí)現(xiàn)顯存和算力解綁。一方面,用EMS替代NPU中的顯存,可使得首Token時(shí)延降低,最高降幅可達(dá)80%;另一方面,當(dāng)NPU的顯存不足時(shí),EMS獨(dú)立擴(kuò)容,不必再通過(guò)堆NPU以獲得更多內(nèi)存。同時(shí),EMS還支持算力卸載,這也使得系統(tǒng)吞吐量提升100%。
提高運(yùn)力以網(wǎng)強(qiáng)算、提高存力以存強(qiáng)算,合力提高綜合計(jì)算性能,從而為各行各業(yè)應(yīng)用Deepseek等MoE模型,提供澎湃算力,正是CloudMatrix 384 所筑起的性能防線。
二是算力可靠的穩(wěn)定防線。
解決了性能問(wèn)題,接下來(lái)還解決多卡集群“打群架”的可靠性問(wèn)題。千卡乃至萬(wàn)卡級(jí)算力集群的運(yùn)維挑戰(zhàn),已經(jīng)成為算力的關(guān)鍵瓶頸。集群規(guī)模增大,故障頻發(fā),導(dǎo)致訓(xùn)練中斷,模型開(kāi)發(fā)團(tuán)隊(duì)不得不頻繁執(zhí)行檢查點(diǎn)checkpoint保存操作,這不僅延長(zhǎng)了大模型訓(xùn)練周期,還會(huì)導(dǎo)致計(jì)算資源浪費(fèi),開(kāi)發(fā)成本增高。
構(gòu)建高可靠性的智能運(yùn)維體系,已成為云上算力長(zhǎng)城的必要職責(zé)。對(duì)此,華為開(kāi)發(fā)了昇騰云腦運(yùn)維“1-3-10”標(biāo)準(zhǔn),即1分鐘感知、3分鐘定界、10分鐘內(nèi)恢復(fù),從而具備了保障長(zhǎng)穩(wěn)大模型訓(xùn)練的能力。
也意味著,中國(guó)AI有了更具韌性的算力基礎(chǔ)設(shè)施。
三是算力普惠的成本防線。
DeepSeek到來(lái)之后,AI推理側(cè)的任務(wù)激增,而訓(xùn)練側(cè)的算力需求則在下降。對(duì)于云服務(wù)商來(lái)說(shuō),針對(duì)用戶訪問(wèn)的潮汐特征(日間推理峰值遠(yuǎn)遠(yuǎn)大于夜間),做好算力資源的動(dòng)態(tài)平衡,可以進(jìn)一步優(yōu)化資源利用效率,避免算力閑置,這樣能夠?qū)崿F(xiàn)綜合成本最優(yōu),最終讓成本優(yōu)勢(shì)變成價(jià)格優(yōu)勢(shì)、普惠能力,為行業(yè)和用戶提供像“水電”一樣實(shí)時(shí)、普惠、靈活的算力。
目前,華為云已經(jīng)在全國(guó)三大樞紐數(shù)據(jù)中心——烏蘭察布、貴安和蕪湖完成了超節(jié)點(diǎn)規(guī)模布局,支持百TB級(jí)的帶寬互聯(lián),10毫秒時(shí)延圈覆蓋全國(guó)19個(gè)城市群,讓行業(yè)用戶不需要自建數(shù)據(jù)中心,可以像水電氣一樣,第一時(shí)間享受到即開(kāi)即用的AI算力資源。
同時(shí),華為云通過(guò)“訓(xùn)推共池”“靈活調(diào)度”兩大技術(shù),實(shí)現(xiàn)朝推夜訓(xùn),白天進(jìn)行模型推理,晚上閑時(shí)進(jìn)行模型訓(xùn)練,實(shí)現(xiàn)了全國(guó)超節(jié)點(diǎn)算力資源的“錯(cuò)峰用電”,算力資源利用率可提升30%以上。
通過(guò)性能、穩(wěn)定、普惠的三道防線,華為云CloudMatrix 384 超節(jié)點(diǎn)可以更好地守護(hù)各行各業(yè)的智能化需求,成為中國(guó)AI巍然挺立的堅(jiān)實(shí)基礎(chǔ)設(shè)施。
正如長(zhǎng)城的出現(xiàn),守護(hù)了古代中國(guó)的國(guó)土安全。超節(jié)點(diǎn)通過(guò)多項(xiàng)技術(shù)特征的加持,讓以卡為單位的分散式AI算力,走向了集中式AI計(jì)算底座,成為真正意義上的下一代AI基礎(chǔ)設(shè)施,一座堅(jiān)固的云上算力長(zhǎng)城。
更宏觀的角度來(lái)看,超節(jié)點(diǎn)技術(shù)不僅僅是一項(xiàng)工程性創(chuàng)新,它還徹底改變了芯片制造領(lǐng)域的技術(shù)對(duì)壘格局。
英偉達(dá)最新推出了基于第五代NVLink技術(shù)的NVL72,并且將其局限在自身生態(tài)當(dāng)中,客觀上構(gòu)成了對(duì)中國(guó)AI算力的發(fā)展制約。但實(shí)際上,我們真正需要的不是芯片本身,而是算力。通過(guò)重新定義AI基礎(chǔ)設(shè)施,超節(jié)點(diǎn)技術(shù)為AI算力的供給提供了前所未有的澎湃動(dòng)力,進(jìn)而突破了被芯片制程鎖死的AI進(jìn)程。
在當(dāng)前國(guó)際博弈的大背景下,超節(jié)點(diǎn)的出現(xiàn),正是中國(guó)應(yīng)對(duì)挑戰(zhàn)、把握AI機(jī)遇的有力證明。
除了超節(jié)點(diǎn)之外,華為云還在大模型、AI生態(tài)等領(lǐng)域進(jìn)行了持續(xù)升級(jí),持續(xù)迭代的盤(pán)古大模型,已經(jīng)在30多個(gè)行業(yè)、400多個(gè)場(chǎng)景中應(yīng)用,在制造、金融、政務(wù)、醫(yī)療、制藥、汽車(chē)、氣象等七個(gè)行業(yè)保持市場(chǎng)規(guī)模領(lǐng)先。
在算力底座、資源調(diào)度、推理服務(wù)及集群可靠四個(gè)方面,華為云全面升級(jí)昇騰AI云服務(wù),協(xié)助客戶進(jìn)行模型的開(kāi)發(fā)、訓(xùn)練、托管和應(yīng)用。目前,昇騰AI云服務(wù)已適配包含DeepSeek在內(nèi)的160多個(gè)第三方大模型,并面向政府、金融、互聯(lián)網(wǎng)、零售等行業(yè)服務(wù)600多家創(chuàng)新先鋒企業(yè)。
就像美國(guó)的貿(mào)易沖擊,掀不翻中國(guó)經(jīng)濟(jì)的汪洋大海,美國(guó)的一紙禁令,也禁不了昇騰這座云上AI算力長(zhǎng)城。
當(dāng)山姆·奧特曼在國(guó)會(huì)參議院建議要加大AI基礎(chǔ)設(shè)施投入的時(shí)候,昇騰AI云服務(wù)已經(jīng)通過(guò)超節(jié)點(diǎn)的建設(shè),以及更多技術(shù)、產(chǎn)品、資源的匯集,為接下來(lái)的中國(guó)AI應(yīng)用大爆發(fā)做好了準(zhǔn)備——下一代AI基礎(chǔ)設(shè)施,就是中國(guó)AI走向強(qiáng)大的內(nèi)因。
2025年5月16日,被制裁整整六年的華為依舊在茁壯生長(zhǎng),并且在這些年里拿出了MetaERP、數(shù)據(jù)庫(kù)、軟硬件工具鏈等等核心技術(shù)突破。如今超節(jié)點(diǎn)的加入,讓這六年中所有的故事都更加熠熠生輝。
華為的故事在反復(fù)提醒著一件事:我們除了強(qiáng)大,無(wú)路可走。
曾幾何時(shí),先進(jìn)AI算力必然來(lái)自西方,被認(rèn)為是一個(gè)“鐵律”。但CloudMatrix 384 超節(jié)點(diǎn)的突破,不僅證明了中國(guó)可以有自主化的可靠AI算力基礎(chǔ)設(shè)施,更證明了中國(guó)AI算力可以實(shí)現(xiàn)系統(tǒng)性領(lǐng)先,甚至可以改變企業(yè)用戶的AI算力獲取方式,給全球AI一個(gè)更好的算力選擇。
近幾個(gè)月,所有國(guó)際新聞都在提醒我們,只有當(dāng)自身足夠強(qiáng)大,能夠給自己和他人提供選擇,我們才有話語(yǔ)權(quán),才有交流和談判的空間,才能為多元、開(kāi)放與平等添加一份保障。
從這個(gè)意義來(lái)說(shuō),CloudMatrix 384 超節(jié)點(diǎn)就如同AI世界中的長(zhǎng)城。它佇立在那里,確保了全球AI的自由勃發(fā)與平等成長(zhǎng)。
巍巍昆侖,翼翼長(zhǎng)城。一些源于中國(guó)文化的智慧,一些來(lái)自中國(guó)科技的態(tài)度,此刻正無(wú)言流淌在奔騰的AI算力中,相信它們很快會(huì)被世界讀懂。
免責(zé)聲明:此文內(nèi)容為第三方自媒體作者發(fā)布的觀察或評(píng)論性文章,所有文字和圖片版權(quán)歸作者所有,且僅代表作者個(gè)人觀點(diǎn),與極客網(wǎng)無(wú)關(guān)。文章僅供讀者參考,并請(qǐng)自行核實(shí)相關(guān)內(nèi)容。投訴郵箱:editor@fromgeek.com。
- Intel也跪了,與蘋(píng)果爭(zhēng)奪臺(tái)積電2納米產(chǎn)能,將漲價(jià)五成以上
- 華為Pura 80,讓“三我”終相見(jiàn)
- OLED vs MiniLED:誰(shuí)才是家庭觀影的未來(lái)之選?
- 科大訊飛最新發(fā)布!打造下一代智能交互新范式
- 全國(guó)首個(gè)交通基建垂類(lèi)大模型來(lái)了!中關(guān)村科金發(fā)布多項(xiàng)垂類(lèi)大模型領(lǐng)先成果,加速產(chǎn)業(yè)新智能化
- "一目雙鏡"創(chuàng)新登頂王座,華為Pura 80系列無(wú)愧移動(dòng)影像領(lǐng)導(dǎo)者
- 共建數(shù)據(jù)強(qiáng)國(guó):政務(wù)數(shù)據(jù)共享的雙輪革命
- 泡泡瑪特的LABUBU何以火爆?
- 華為再次觸動(dòng)手機(jī)行業(yè),Pura 80系列玩出新高度
- 夸克發(fā)布首個(gè)高考志愿大模型憑什么喊出“讓天下沒(méi)有難報(bào)的志愿”
免責(zé)聲明:本網(wǎng)站內(nèi)容主要來(lái)自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網(wǎng)站出現(xiàn)的信息,均僅供參考。本網(wǎng)站將盡力確保所提供信息的準(zhǔn)確性及可靠性,但不保證有關(guān)資料的準(zhǔn)確性及可靠性,讀者在使用前請(qǐng)進(jìn)一步核實(shí),并對(duì)任何自主決定的行為負(fù)責(zé)。本網(wǎng)站對(duì)有關(guān)資料所引致的錯(cuò)誤、不確或遺漏,概不負(fù)任何法律責(zé)任。任何單位或個(gè)人認(rèn)為本網(wǎng)站中的網(wǎng)頁(yè)或鏈接內(nèi)容可能涉嫌侵犯其知識(shí)產(chǎn)權(quán)或存在不實(shí)內(nèi)容時(shí),應(yīng)及時(shí)向本網(wǎng)站提出書(shū)面權(quán)利通知或不實(shí)情況說(shuō)明,并提供身份證明、權(quán)屬證明及詳細(xì)侵權(quán)或不實(shí)情況證明。本網(wǎng)站在收到上述法律文件后,將會(huì)依法盡快聯(lián)系相關(guān)文章源頭核實(shí),溝通刪除相關(guān)內(nèi)容或斷開(kāi)相關(guān)鏈接。