北京時間5月21日消息(岳明)Light Reading在一篇最新報道中針對英偉達(dá)ARC-Compact的推出與潛在市場影響進(jìn)行了分析。
盡管市場反響有限,英偉達(dá)仍未放棄向電信行業(yè)銷售AI芯片的嘗試。不過這家GPU巨頭似乎正在轉(zhuǎn)向中低端市場,并在最新推出的RAN解決方案中弱化了對AI的強(qiáng)調(diào)。如果說以著名計算機(jī)奇才兼海軍少將命名的Grace Hopper芯片組是一艘豪華超級游艇,那么近日發(fā)布的ARC-Compact則像是一艘配置簡化、功能精簡的經(jīng)濟(jì)型船只。
去年發(fā)布的搭載Grace Hopper及后續(xù)Grace Blackwell的ARC服務(wù)器主要面向部署集中式RAN(C-RAN)的電信運營商,旨在通過就近數(shù)據(jù)中心支撐多基站運行。而全新推出的ARC-Compact專為分布式RAN(D-RAN)基站部署設(shè)計,這一架構(gòu)轉(zhuǎn)變將完全改變技術(shù)需求與經(jīng)濟(jì)模型。
圖:英偉達(dá)ARC-Compact產(chǎn)品圖。
ARC-Compact的核心組件是基于軟銀旗下Arm架構(gòu)的Grace CPU及L4 Tensor Core GPU。相較于Hopper和Blackwell GPU,該解決方案更加輕量級,適用于一些邊緣視頻處理及推理任務(wù),但無法勝任大語言模型訓(xùn)練或高強(qiáng)度AI運算。
在官方技術(shù)博客中,英偉達(dá)將ARC-Compact描述為“高性價比、高能效”的解決方案,適用于“低時延AI工作負(fù)載與RAN加速”。但即便L4 Tensor Core的配置也可能超出實際需求。當(dāng)前市場競爭有限,僅有三家RAN設(shè)備商可能采用該技術(shù),且其關(guān)注重點更傾向于Grace CPU而非其他GPU。
CUDA架構(gòu)推進(jìn)遇阻
這三家設(shè)備商為愛立信、諾基亞與三星,它們均已對虛擬化RAN(vRAN)技術(shù)進(jìn)行投資。該技術(shù)以通用CPU替代了5G網(wǎng)絡(luò)中常見的專用集成電路(ASIC)。英偉達(dá)提出的AI-RAN是這一概念的演進(jìn),它建議保留CPU用于處理計算強(qiáng)度較低的工作負(fù)載,同時引入GPU作為Layer 1的“內(nèi)聯(lián)”加速器——Layer 1在RAN軟件棧中屬于資源密集型部分。
當(dāng)前的問題在于,上述三大設(shè)備商均未展現(xiàn)出采用英偉達(dá)統(tǒng)一計算設(shè)備架構(gòu)(CUDA)來基于GPU進(jìn)行RAN開發(fā)的強(qiáng)烈意愿。愛立信與三星更傾向于采用“旁路(lookaside)”vRAN架構(gòu),該方案為實現(xiàn)硬件獨立性,致力于最大限度將軟件保留在CPU運行。在現(xiàn)行部署中,僅Layer 1中的高負(fù)載任務(wù)——前向糾錯(FEC)需使用硬件加速器。
愛立信表示,在試驗環(huán)境中,其為英特爾x86架構(gòu)CPU編寫的軟件經(jīng)少量修改即可移植至Grace平臺。這意味著即便最終采用GPU進(jìn)行任何RAN計算,也僅用于FEC處理。三星同樣在Grace平臺進(jìn)行軟件測試,并在最近明確表示不考慮采用Layer 1內(nèi)聯(lián)加速器?!爱?dāng)CPU無法提供足夠容量時,才需要內(nèi)聯(lián)加速器。”該公司近期通過郵件向Light Reading表示,“隨著技術(shù)的進(jìn)步,CPU已具備支持增強(qiáng)容量的能力,我們預(yù)計即使沒有內(nèi)聯(lián)加速器也可支持足夠的容量?!?/p>
諾基亞則另辟蹊徑,將vRAN資源集中投入內(nèi)聯(lián)架構(gòu)。但其Layer 1加速器來自Marvell Technology而非英偉達(dá),且該公司承認(rèn)轉(zhuǎn)向CUDA架構(gòu)需完全重寫代碼。諾基亞移動網(wǎng)絡(luò)業(yè)務(wù)集團(tuán)負(fù)責(zé)人Tommi Uitto在今年3月MWC巴塞羅那期間表示,除非電信運營商采用GPU進(jìn)行主流AI推理,否則幾乎沒有必要進(jìn)行此類重構(gòu)開發(fā)。
“在這種情況下,大部分計算將用于Layer 1之外的工作負(fù)載,那么使用Layer 1加速器也就無關(guān)緊要了?!彼?dāng)時指出,“最終,我們希望在GPU中也實現(xiàn)Layer 1?!痹诖酥?,諾基亞對英偉達(dá)技術(shù)的關(guān)注點更可能聚焦于將Grace用于Layer 1以上的功能模塊。
復(fù)蘇邊緣計算的設(shè)想
如果說將Grace Blackwell芯片作為AI推理的關(guān)鍵組件部署于電信數(shù)據(jù)中心已難以想象,那么ARC-Compact就更難扮演這一角色了。委婉而言,如今關(guān)于電信運營商可以從超大規(guī)模云服務(wù)商(hyperscaler)與其他數(shù)據(jù)中心企業(yè)服務(wù)不足的眾多地點提供AI 推理服務(wù)并實現(xiàn)盈利的構(gòu)想近乎不切實際,這聽起來像是試圖重振邊緣計算的又一次嘗試。
甚至連電信運營商自身亦對此缺乏信心。Omdia近期開展了一項調(diào)查,詢問受訪者認(rèn)為未來大多數(shù)AI處理將發(fā)生在何處。僅17%的受訪者回答是基站與樞紐站點,另有6%選擇了中心機(jī)房與前端站點。占比高達(dá)43%的最主流答案為終端用戶設(shè)備。電信運營商似乎處于終端設(shè)備與hyperscaler云服務(wù)之間的無人區(qū),他們相較于后者的唯一優(yōu)勢在于更低的網(wǎng)絡(luò)時延。
遺憾的是,對于一個中等規(guī)模的國家來說,那種需要大量站點才能支撐的超低時延服務(wù)需求幾乎為零。Omdia高級首席分析師Kerem Arsal在最近于倫敦舉行的一場活動上指出,AI-RAN方案的負(fù)面因素目前仍遠(yuǎn)超其優(yōu)勢?!按送?,hyperscaler對邊緣計算及合作伙伴關(guān)系的興趣有所消退,部分原因在于其商業(yè)模式未必會給邊緣計算帶來那么多回報。”他分析稱,電信運營商在邊緣計算方面迄今尚未展現(xiàn)“具有說服力的差異化價值”。
隨著業(yè)界對英特爾未來前景的疑慮升溫,Grace的出現(xiàn)顯得恰逢其時。此前,英特爾是vRAN CPU領(lǐng)域的唯一選擇。若RAN供應(yīng)商能證明其軟件可近乎零修改地在x86與Arm架構(gòu)之間進(jìn)行遷移,則標(biāo)志著其已實現(xiàn)底層硬件解耦。同時,CPU性能的持續(xù)提升對長期貶低其能力的廠商構(gòu)成挑戰(zhàn)。英偉達(dá)CEO黃仁勛曾于去年9月表示:“CPU無法跟上ASIC的工作負(fù)載處理能力。”
Kerem Arsal指出:“AI處理架構(gòu)可能從當(dāng)前以GPU為核心的形態(tài)逐步向性能更強(qiáng)的CPU傾斜。此外,總體而言,模型輕量化趨勢顯著,設(shè)備自主處理關(guān)鍵AI工作復(fù)雜的可能性正在提升。” 這一趨勢顯然與黃仁勛的預(yù)期背道而馳。
- 智能數(shù)據(jù)云如何重塑企業(yè)個性化
- 建筑物內(nèi)移動覆蓋的電信基礎(chǔ)設(shè)施及其挑戰(zhàn)
- 如何利用人工智能和數(shù)據(jù)分析實現(xiàn)可持續(xù)綠色技術(shù)
- 了解網(wǎng)絡(luò)適配器:提高計算機(jī)網(wǎng)絡(luò)效率
- 如何為布線環(huán)境選擇合適的網(wǎng)絡(luò)電纜標(biāo)簽
- 無線前傳的核心:CPRI無線模塊全面介紹
- 量子計算如何改善供應(yīng)鏈
- 大疆創(chuàng)新即將發(fā)布新品;CTI收購英國Candeo Vision 拓展歐洲視聽集成市場——2025年06月06日
- 采用機(jī)器學(xué)習(xí)的3大挑戰(zhàn)及應(yīng)對策略
- 構(gòu)建工業(yè)物聯(lián)網(wǎng)能源監(jiān)控應(yīng)用的最佳實踐
免責(zé)聲明:本網(wǎng)站內(nèi)容主要來自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網(wǎng)站出現(xiàn)的信息,均僅供參考。本網(wǎng)站將盡力確保所提供信息的準(zhǔn)確性及可靠性,但不保證有關(guān)資料的準(zhǔn)確性及可靠性,讀者在使用前請進(jìn)一步核實,并對任何自主決定的行為負(fù)責(zé)。本網(wǎng)站對有關(guān)資料所引致的錯誤、不確或遺漏,概不負(fù)任何法律責(zé)任。任何單位或個人認(rèn)為本網(wǎng)站中的網(wǎng)頁或鏈接內(nèi)容可能涉嫌侵犯其知識產(chǎn)權(quán)或存在不實內(nèi)容時,應(yīng)及時向本網(wǎng)站提出書面權(quán)利通知或不實情況說明,并提供身份證明、權(quán)屬證明及詳細(xì)侵權(quán)或不實情況證明。本網(wǎng)站在收到上述法律文件后,將會依法盡快聯(lián)系相關(guān)文章源頭核實,溝通刪除相關(guān)內(nèi)容或斷開相關(guān)鏈接。