AI安全新規(guī)出臺:螞蟻、清華、中國電信聯(lián)手畫紅線
隨著人工智能技術(shù)在全球范圍內(nèi)的快速普及,AI智能體的安全問題日益凸顯。近日,世界數(shù)字科學院(WDTA)在聯(lián)合國日內(nèi)瓦總部正式發(fā)布了《AI智能體運行安全測試標準》,這是全球首個針對單智能體運行安全的技術(shù)標準。該標準由螞蟻集團、清華大學、中國電信牽頭,聯(lián)合普華永道、新加坡南洋理工大學、美國圣路易斯華盛頓大學等二十余家國內(nèi)外機構(gòu)共同編制,標志著AI安全治理邁入新階段。
填補全球AI安全測試空白
當前,AI智能體在金融、醫(yī)療、教育等領域的應用日益廣泛,但其潛在的安全風險也引發(fā)行業(yè)關(guān)注。智能體在跨越“語言墻”時可能產(chǎn)生不可控的“行為”偏差,甚至導致數(shù)據(jù)泄露、決策失誤等嚴重后果。然而,此前全球范圍內(nèi)缺乏統(tǒng)一的AI智能體安全測試標準,使得企業(yè)和機構(gòu)在部署AI技術(shù)時面臨較高的不確定性。
此次發(fā)布的《AI智能體運行安全測試標準》首次構(gòu)建了全鏈路風險分析框架,涵蓋輸入輸出、大模型、RAG(檢索增強生成)、記憶和工具五個關(guān)鍵環(huán)節(jié),并與運行環(huán)境進行對應分析。同時,標準還細化了智能體風險類型,并創(chuàng)新性地提出了模型檢測、網(wǎng)絡通信分析和工具模糊測試等方法,為AI智能體的安全運行提供了可量化的評估依據(jù)。
產(chǎn)學研協(xié)同推動標準落地
該標準的制定匯聚了全球頂尖學術(shù)機構(gòu)、科技企業(yè)和行業(yè)專家的智慧。螞蟻集團作為主要牽頭方之一,憑借其在金融科技領域的安全實踐,為標準的可操作性提供了重要支持。清華大學和中國電信則分別從學術(shù)研究和通信安全的角度貢獻了關(guān)鍵技術(shù)方案。此外,普華永道、南洋理工大學等國際機構(gòu)的參與,也確保了標準在全球范圍內(nèi)的適用性。
值得注意的是,這并非WDTA首次發(fā)布AI安全相關(guān)標準。此前,該機構(gòu)已推出“生成式人工智能應用安全測試標準”“大語言模型安全測試方法”和“大模型供應鏈安全要求”三項標準,OpenAI、谷歌、微軟、百度等企業(yè)均參與其中。此次新標準的發(fā)布,進一步完善了AI安全治理體系,為行業(yè)提供了更全面的技術(shù)參考。
金融、醫(yī)療領域率先應用
目前,該標準的部分測評與認證已在金融、醫(yī)療等高風險領域落地。在金融行業(yè),智能體的安全漏洞可能導致交易異?;蚩蛻綦[私泄露,而新標準通過工具模糊測試等方法,能夠有效識別潛在風險。在醫(yī)療領域,AI輔助診斷系統(tǒng)的可靠性直接關(guān)乎患者安全,標準的實施有助于提升智能體的行為可控性。
業(yè)界普遍認為,這一標準的推出不僅為AI智能體的安全運行劃定了“紅線”,也為全球AI生態(tài)的可持續(xù)發(fā)展提供了重要支撐。未來,隨著更多行業(yè)采用該標準,AI技術(shù)的可信度有望進一步提升,從而加速其在關(guān)鍵領域的規(guī)?;瘧谩?/p>
結(jié)語
AI技術(shù)的快速發(fā)展離不開安全基石的穩(wěn)固。此次螞蟻集團、清華大學和中國電信等機構(gòu)聯(lián)手制定的《AI智能體運行安全測試標準》,不僅填補了全球AI安全測試的空白,也為行業(yè)提供了可落地的技術(shù)方案。在AI與實體經(jīng)濟深度融合的背景下,此類標準的持續(xù)完善將成為技術(shù)健康發(fā)展的重要保障。
(免責聲明:本網(wǎng)站內(nèi)容主要來自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網(wǎng)站出現(xiàn)的信息,均僅供參考。本網(wǎng)站將盡力確保所提供信息的準確性及可靠性,但不保證有關(guān)資料的準確性及可靠性,讀者在使用前請進一步核實,并對任何自主決定的行為負責。本網(wǎng)站對有關(guān)資料所引致的錯誤、不確或遺漏,概不負任何法律責任。
任何單位或個人認為本網(wǎng)站中的網(wǎng)頁或鏈接內(nèi)容可能涉嫌侵犯其知識產(chǎn)權(quán)或存在不實內(nèi)容時,應及時向本網(wǎng)站提出書面權(quán)利通知或不實情況說明,并提供身份證明、權(quán)屬證明及詳細侵權(quán)或不實情況證明。本網(wǎng)站在收到上述法律文件后,將會依法盡快聯(lián)系相關(guān)文章源頭核實,溝通刪除相關(guān)內(nèi)容或斷開相關(guān)鏈接。 )