9月9日,全球權威AI基準評測MLPerf Inference v2.1榜單公布結果。
MLPerf是業(yè)內公認的國際權威AI性能基準評測,由圖靈獎得主大衛(wèi)·帕特森(David Patterson)聯合谷歌、英偉達 、英特爾、Facebook、浪潮等全球AI領軍企業(yè),以及來自哈佛大學、斯坦福大學等學術機構的研究人員創(chuàng)立。
該測評以其標準嚴格、測評嚴謹而著稱,英偉達、高通等國際AI芯片企業(yè)均攜最強產品參加測評,競爭十分激烈,各賽道均有數百項產品提交成績。
中國AI芯片企業(yè)首次超越英偉達“史上最強GPU”、未來4nm產品——H100:中國AI芯片明星創(chuàng)業(yè)公司——墨芯人工智能(以下簡稱“墨芯”)S30計算卡以95784 FPS的單卡算力,奪得Resnet-50模型算力全球第一。
以上數據摘自MLCommons官網MLPerf Inference v2.1測試結果
墨芯首次參賽 單卡算力全球第一
眾所周知,“單卡算力”是檢驗AI計算產品的“真標準”。
墨芯奪冠項目是數據中心最常用主流模型ResNet-50,該賽道競爭尤為激烈,競爭者包括H100、A100。
S30以ResNet-50 95784 FPS的單卡算力奪得第一,是英偉達未來4nm產品——H100的1.2倍,是A100的2倍。
同時,墨芯S30運行BERT-Large是A100的2倍,僅次于H100,在Bert-large高精度模型(99.9%),單卡算力達3,837 SPS。
值得強調的是此次是“12nm”戰(zhàn)勝“4nm”。
從競爭者角度看,墨芯參與的ResNet-50和BERT-Large都是數據中心最常用主流模型,因此競爭尤為激烈。特別是競爭者包括H100,是英偉達迄今推出的最強大的GPU,據悉使用臺積電最新的4納米工藝,可謂“最強王者”。而戰(zhàn)勝“最強王者”,足以體現墨芯S30采用12nm,性能已經站在世界頂尖水平。
精度要求99%以上,經受嚴格檢驗
更值得一提的是,MLPerf的測試要求非常嚴格:不僅考驗各產品算力,同時設置精度要求在99%以上,主要為了考察AI推理精度的高要求對計算性能的影響。換句話說,參賽廠商無法以犧牲精度的方式換取算力提升,在這種嚴要求下奪冠,表明了墨芯的硬核技術實力。
- 英飛凌的“在中國,為中國”本土化戰(zhàn)略,有何獨到之處?
- 英飛凌發(fā)布“在中國,為中國”本土化戰(zhàn)略,三十而勵啟新篇
- 2024年全球半導體收入6559億美元 英偉達超越三星首次躍居榜首
- Qorvo?推出高輸出功率倍增器QPA3311和QPA3316,加速DOCSIS? 4.0向更智能高效演進
- 蘋果自研基帶首秀折戟:C1性能短板凸顯,追趕之路荊棘密布
- 央視新聞報道,透露5納米工藝麒麟X90芯片量產
- 玄戒O1發(fā)布前小米手機芯片供應情況:聯發(fā)科與高通“唱主角”,紫光展銳占2%
- 高塔半導體主動退出與阿達尼合作的印度晶圓廠項目
- 臺積電加速2納米量產布局,全球擴產步伐提速
- 黃仁勛將提前亮相Computex 2025,全球科技巨頭共赴亞洲科技盛宴
免責聲明:本網站內容主要來自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網站出現的信息,均僅供參考。本網站將盡力確保所提供信息的準確性及可靠性,但不保證有關資料的準確性及可靠性,讀者在使用前請進一步核實,并對任何自主決定的行為負責。本網站對有關資料所引致的錯誤、不確或遺漏,概不負任何法律責任。任何單位或個人認為本網站中的網頁或鏈接內容可能涉嫌侵犯其知識產權或存在不實內容時,應及時向本網站提出書面權利通知或不實情況說明,并提供身份證明、權屬證明及詳細侵權或不實情況證明。本網站在收到上述法律文件后,將會依法盡快聯系相關文章源頭核實,溝通刪除相關內容或斷開相關鏈接。