4月28日消息(趙婷婷)大模型時代,對算力的需求是永無止境的,大規(guī)模智算中心建設如火如荼。然而,“大算力”的釋放與價值實現(xiàn),離不開強大網絡的支撐。網絡不僅是連接算力單元的紐帶,更決定了算力調度、數(shù)據(jù)流通的效率與穩(wěn)定性。構建與算力規(guī)模相匹配的“大網絡”,成為智算中心建設與運營的重要議題。
作為網絡產業(yè)的領軍者,新華三正以其前瞻性的技術布局、多元的創(chuàng)新產品與解決方案,豐厚的實踐經驗,積極推動智算中心“大網絡”的構建與發(fā)展,助力客戶在大模型時代從容應對算力挑戰(zhàn),實現(xiàn)業(yè)務價值的最大化。
新華三集團副總裁、網絡產品線副總裁、交換機產品線總經理李玉濤在接受C114采訪時表示,異構算力體系可以充分發(fā)揮各種計算設備的優(yōu)勢,具備多樣性、靈活性、高效性等特點。新華三聚焦網絡優(yōu)勢,提供強大、靈活、多元且具備高支撐度的異構算力網絡架構,能夠最大程度釋放芯片潛能,并堅持開放合作方向,攜手產業(yè)鏈伙伴共同構建創(chuàng)新、包容的生態(tài)圈。
新華三集團副總裁、網絡產品線副總裁、交換機產品線總經理 李玉濤
擺脫AGI蠻力計算:異構算力網絡成為“必選項”
隨著AI技術特別是大模型技術的突飛猛進,AI的應用范圍正從基礎的文本、語音處理擴展至復雜的視頻處理及其他未知領域,以AI為核心的算力需求激增,多元異構算力增速超過通用算力成為主流。而應對AI算力需求的關鍵在于實現(xiàn)算力、存力和網絡轉發(fā)效率的良好結合,以實現(xiàn)端到端的整體效率。
李玉濤指出,當前智算場景的產品體系內,服務器平臺、GPU、網卡、光模塊、交換機等領域都有大量的廠商參與。網絡作為連接 CPU、xPU、內存、存儲等資源重要基礎設施,貫穿數(shù)據(jù)計算、存儲全流程,是拉通生態(tài)的重要介質。網絡的冗余性、高可靠、以及彈性,可幫助技術不成熟產品消除限制。
李玉濤強調,智算網絡的建設不僅僅是硬件設備的堆砌,“靠蠻力計算是遠遠不夠的,更強調算力效率的提升。”在智算網絡建設中,新華三不僅提供網絡硬件設備,還尤其關注綠色節(jié)能、長期運營成本、網絡接入密度和系統(tǒng)安全性等,旨在構建最佳的、可持續(xù)的網絡環(huán)境。
“面對日益增長的AI算力需求,千卡、萬卡模型已遠遠不夠了,新華三正探討構建支持百萬卡規(guī)模的超大規(guī)模智算網絡。”他指出。與此同時,穩(wěn)定、高可靠性的保障工作同樣重要,基于此考慮,新華三制定了智算網絡異構連通專項測試,可對光模塊、電纜進行高可靠性的測試驗證,解決與網卡互聯(lián)互通的問題,為客戶提供一套經過驗證過的交付方案。
對于異構算力網絡的現(xiàn)狀與發(fā)展策略,李玉濤認為,異構算力網絡尚處于發(fā)展初期。目前國內已有很多生態(tài)出現(xiàn),但大多數(shù)還處于發(fā)展早期,技術成熟度有待提升。面對這一情況,新華三將更多進行“陪伴式成長”,加強與合作伙伴的緊密合作與早期課題探討,助力國內異構算力網絡生態(tài)的加速成熟與壯大,以更好適應新業(yè)務需求和技術環(huán)境。
三維度同時發(fā)力:夯實異構算力網絡基石
李玉濤表示,在通過網絡打通異構算力時,有三個關鍵需求:首先要有多元化產品支撐生態(tài)互聯(lián)互通;其次是需要全場景的網絡調優(yōu)能力,能實現(xiàn)GPU解耦、網卡解耦;再次站在客戶長期使用的視角,異構算網協(xié)同非常關鍵,需基于統(tǒng)一的通信庫實現(xiàn)協(xié)同調度。
多元化產品方面,新華三提供支持200G/400G/800G不同端口密度的盒式產品/框式產品、以及先進架構DDC(Distributed Disaggregated Chassis)產品,提供多種組網架構,滿足不同規(guī)模、不同智算平臺、不同建設環(huán)境的客戶的需要。對于網絡產品,超寬是永遠的話題。李玉濤表示,新華三2023年已經批量出貨支持400G產品,800G將在今年下半年出貨,1.6T及更高速率端口更高性能的產品也在積極推進,助力更高的算力需求。
同時,針對不同智算場景,新華三會提供最適合的負載均衡技術組合,合理調整流量的帶寬利用問題,提升智算中心算力規(guī)模和效率。例如,SprayLink解決鏈路均衡的問題,通過實時監(jiān)控LACP/ECMP中各物理鏈路的帶寬利用率,出口隊列。緩存占用,傳輸時延等精細化數(shù)據(jù),對大象流做到基于Per-Packet方式的動態(tài)負載分擔,將每個數(shù)據(jù)包分配到當時資源最優(yōu)的鏈路上,鏈路寬帶利用率提升至95%。
李玉濤指出,DDC技術經過實測,其性能可超越InfiniBand網絡,有效解決網絡擁塞問題,提高效率;還具備解決異構環(huán)境下生態(tài)合作問題的能力,能有效屏蔽不同廠商設備之間的差異性。其擁有極致性能與高擴展,最大支持32K GPU規(guī)模,較盒式組網方案效率提升20.7%;具有天然開放解耦屬性,實現(xiàn)對GPU、網卡解耦;優(yōu)秀部署體驗與高可靠性,可實現(xiàn)整網多租戶接入/隔離。
異構算網協(xié)同方面,支持異構GPU/網卡的算網路徑協(xié)同能力,具備兩個關鍵能力來支撐實踐。一是可利用負載均衡來提升網絡利用率,二是可通過控制器分析,主動進行選路與規(guī)劃仿真,從上帝視角做整網協(xié)同處理。
李玉濤進一步表示,新華三已經積累了豐厚的實踐經驗,并提供可復制解決方案。以某算力中心建設為例,面對規(guī)模超萬卡、不同GPU廠商提供的資源,新華三全程深度參與項目建設,以及前期的一些戰(zhàn)略經驗和設計標準,例如,將光纖布線控制在100米以內,以進行超低時延實現(xiàn);在解決光模塊抖動閃斷問題時,制定上架前必須要通過全檢原則,以降低后續(xù)運維管理難度等。“新華三是真正投身實踐,通過大規(guī)模項目交付積累經驗,并在此基礎上做其他項目的復制,做好異構算力網絡的落地。”他說道。
開放標準+端到端拉通:共建異構算力網絡新生態(tài)
在異構算力網絡的構建過程中,標準化與產業(yè)生態(tài)是非常重要的。
從大規(guī)模智算中心網絡演進技術路徑來看,業(yè)界普遍認為,增強無損以太網將逐漸成為市場主流選擇,無損以太網通過重構高擴展、高穩(wěn)定、高可靠的以太網堆棧,有望在性價比方面媲美InfiniBand。
李玉濤表示,新華三很早就開始基于AI等關鍵業(yè)務的算力需求,前瞻探索下一代網絡技術和智能算力的業(yè)務布局。在去年,新華三正式加入了超以太網聯(lián)盟(UEC),持續(xù)推進AI時代先進網絡技術的探索研究和應用落地。此外,新華三在去年作為首批合作伙伴聯(lián)合中國移動研究院發(fā)布《全調度以太網技術架構(GSE)白皮書》。“新華三在積極參與UEC和GSE的標準化進程,攜手產業(yè)鏈共建技術生態(tài)。”
計算與網絡融合的技術體系復雜,涵蓋計算網絡化、網絡計算化、算網安全等多個層面,目前仍缺乏統(tǒng)一的標準體系。李玉濤指出,算網聯(lián)動技術是產業(yè)鏈關注的重點和難點,新華三將積極與生態(tài)伙伴組建統(tǒng)一的通信庫,共同定義包括數(shù)據(jù)格式、通信協(xié)議、接口API等規(guī)范,在模型層面能實現(xiàn)相互兼容,減少模型遷移過程中的障礙。不僅如此,新華三還把去年推出的百業(yè)靈犀大模型成功適配于現(xiàn)網中,通過自動化和智能化的AI工具使能,大幅降低網絡運維、排障的復雜度,有力支持整體算力服務的高效運行。
紙上得來終覺淺,絕知此事要躬行。據(jù)李玉濤介紹,為驗證智算中心異構算力組網架構,新華三和多個生態(tài)伙伴積極合作,搭建了一套包括多廠商、多型號在內的GPU集群,以及高性能存儲系統(tǒng)用于模型測試。“通過嚴格適配與驗證,我們可以把參數(shù)調到最優(yōu),無論客戶選擇何種算力卡型,新華三都可以提供高可靠的網絡服務。”
采訪最后,李玉濤強調,生態(tài)的開放共贏是大勢所趨,保持開放性對企業(yè)成功與長遠發(fā)展至關重要。新華三會堅持開放與標準化方向,實現(xiàn)對客戶業(yè)務的端到端拉通,并且引入更多生態(tài)伙伴,共建異構算力網絡開放合作新生態(tài)。
- 華為汪濤:AI全面重構超寬帶網絡,激發(fā)商業(yè)新增長
- 全球首屆新通話×AI挑戰(zhàn)賽揭榜,華為攜產業(yè)伙伴獲得四項大獎
- 谷歌推出AI模式語音交互對話功能;一季度全球智能掃地機器人市場出貨量同比增長11.9%——2025年06月20日
- 中國聯(lián)通攜手華為打造5G-A x AI時代融智新品,正式開啟AI to X新時代
- 華為陳浩:激發(fā)體驗經營心動時刻,加速5G-A商業(yè)成功
- 中國電信聯(lián)合華為發(fā)布“智聚大上行”創(chuàng)新技術,賦能5G-A產業(yè)煥新升級
- 2025年物聯(lián)網將如何加速物流并降低成本
- 智慧農業(yè)的雙軌:線下田地與線上工具的融合挑戰(zhàn)
- 如何優(yōu)化機架氣流以提高冷卻效率
- 以太網如何在人工智能網絡領域超越InfiniBand
免責聲明:本網站內容主要來自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網站出現(xiàn)的信息,均僅供參考。本網站將盡力確保所提供信息的準確性及可靠性,但不保證有關資料的準確性及可靠性,讀者在使用前請進一步核實,并對任何自主決定的行為負責。本網站對有關資料所引致的錯誤、不確或遺漏,概不負任何法律責任。任何單位或個人認為本網站中的網頁或鏈接內容可能涉嫌侵犯其知識產權或存在不實內容時,應及時向本網站提出書面權利通知或不實情況說明,并提供身份證明、權屬證明及詳細侵權或不實情況證明。本網站在收到上述法律文件后,將會依法盡快聯(lián)系相關文章源頭核實,溝通刪除相關內容或斷開相關鏈接。