2022年7月25日,國內隱私計算“四小龍”之一的翼方健數正式推出隱私安全計算開源技術——翼數開源,包括翼數聯邦學習框架及翼數安全計算框架,向全球開發(fā)者開源數據安全流通關鍵技術。
翼方健數表示,開源對隱私計算意義重大,尤其將在安全性驗證、平臺互聯互通等方面推動行業(yè)蓬勃發(fā)展,并有助于進一步推廣隱私計算在各行各業(yè)的應用,期待隱私計算行業(yè)所有參與者能以開源為契機,攜手為全社會發(fā)掘更大數據價值。
翼方健數首席科學家張霖濤博士表示,目前翼數聯邦學習框架和翼數安全計算框架已于7月25日正式完成開源,希望通過上述開源框架讓更多用戶更便捷地使用隱私計算技術。在這兩個框架開源的引領下,翼方健數計劃在未來逐步開源其他自研技術棧。
翼方健數作為國內隱私計算領域技術專精型企業(yè)代表率先投身開源,或預示隱私計算賽道的競爭格局與發(fā)展模式將迎來升級——技術服務商既要手握核心技術“王牌”保持競爭優(yōu)勢,又要敢于亮出開源“底牌”接受各方檢驗。
事實上,過去一年開源正在成為隱私計算領域的熱點和趨勢之一。在近日由中國信息通信研究院、隱私計算聯盟主辦的2022隱私計算大會上,“隱私計算積極擁抱開源”入選2022隱私計算十大觀察。
翼數開源:兩大框架輕裝上陣
相比互聯網幾十年的開源史,隱私計算開源盡管時間不長,卻絲毫不輸前輩。其中由著名開源社區(qū)OpenMined在2017年主導的多方安全計算及聯邦學習開源框架PySyft可以看作是早期代表。其后兩年,谷歌、臉書等國際巨頭也都發(fā)布了可信執(zhí)行環(huán)境、多方安全計算、聯邦學習相關開源框架和平臺。
據中國信通院總結,自2019年起,微眾銀行、螞蟻集團、字節(jié)跳動等都推出了開源框架和平臺,越來越多的企業(yè)加入了隱私計算開源隊伍,有底層技術協議,也有企業(yè)的平臺類項目。
這些開源平臺呈現出四大特點及趨勢:一是易用性,方便流程簡易部署方便,用戶能快速上手。二是可擴展性,產品架構可分為底層算法協議、算子層和應用層等,各層之間可獨立開發(fā),并支持模塊化。三是完備性,能支持包括聯合統計、隱私集合求交、建模等多種功能,每種功能也有滿足不同性能與安全要求的算法。四是兼容性,能為未來互聯互通做準備,架構設計上能兼容其他框架。
可以看出,翼方健數投身開源不僅順應了隱私計算向開源發(fā)展的時代趨勢,相關框架的設計與表現也完全呼應了目前隱私計算開源平臺的特色。張霖濤介紹說,翼數開源的兩大框架體現了翼方健數對開源理念的深刻理解與創(chuàng)新實踐,其中輕量化是重要原則之一,即兩大框架各自獨立、分工明確,實現“專用系統做專用事情”。
據了解,翼數聯邦學習框架(XFL)是安全高效的聯邦學習引擎,全面覆蓋聯邦學習算法,支持多種聯邦學習模式。翼數安全計算框架(XSCE)是安全密文計算算法庫,支持多種隱私加密算法,應用部署靈活。這兩大框架均為翼方健數隱私計算框架XDP平臺的核心組成部分。
從開發(fā)角度來看,輕量化設計易于開發(fā),規(guī)避了龐大系統的復雜性,便于用戶各取所需、快速上手、開發(fā)擴展。從應用角度來說,這樣的設計商業(yè)友好,更容易適配不同場景,部件化應用可集成可重用。
使用體驗輕量化的背后是扎實“內功”的支撐。在性能方面,兩大框架近期剛剛通過中國信息通信研究院「多方安全計算 性能專項評測」和「聯邦學習 性能專項評測」雙認證,各項計算時間均優(yōu)于參評項目平均值。在安全性方面,翼數聯邦學習框架采用一次一密、CKKS及 Paillier同態(tài)加密算法等安全技術,確保計算安全性。并且翼數聯邦學習框架還支持多種主流深度學習框架,如TensorFlow、PyTorch等。
翼方健數團隊還著力提高代碼質量,解決了現有各類多方安全計算開源代碼偏重學術研究、,不適于產業(yè)應用的問題,重新測試、修改、增強了相關算法,包括PSI/PIR/聯合統計/特征工程/邏輯回歸/線性回歸/深度學習模型推斷等,令翼數安全計算框架擁有更加高效、全面的算法庫,并可與聯邦學習結合,形成完整的工作流。
此外,翼數開源還賦予用戶極大的開放性。基于Apache License 2.0軟件許可證,用戶擁有充分空間使用和修改相關代碼。張霖濤認為,這樣的寬松度更便于用戶在他人工作的基礎上貢獻自己的智慧,把整個系統越做越好,無需從頭開始或“重造輪子”。
他還強調,開源在技術層面有利于提升隱私計算安全性,但更重要的還是能讓更多人了解和利用隱私計算技術。翼方健數雖然是一家年輕的公司,卻已是隱私計算領域的“老兵”,愿意把多年技術積累和市場經驗開放給更多終端行業(yè)使用,開源正是理想的分享與推廣方式,有利于擴大隱私計算的整體市場規(guī)模。
與業(yè)界一起“做大蛋糕”正是翼數開源的核心愿景之一。翼方健數聯邦學習研發(fā)負責人同樣認為,借助聯邦學習技術加速數據價值流通,賦能千行百業(yè)。翼方健數多方安全計算研發(fā)負責人也表示,MPC技術具有數據隱私高安全和參與方地位平等的特點,在業(yè)界同仁的通力合作下定能加速MPC技術規(guī)?;涞貞谩?/p>
精準解決安全與互通兩大痛點
隱私計算擁抱開源絕非偶然,開源本身就是整個軟件產業(yè)的重要模式和趨勢。
中國信通院云計算與大數據研究所副主任姜春宇指出,開源模式正在“吞噬”整個軟件產業(yè),近年來我國在政策層面鼓勵開源軟件、開源項目的發(fā)展。從基礎軟件到新技術領域,開源都在逐步變成軟件研發(fā)迭代,甚至商業(yè)模式的主要形式,整個軟件產業(yè)走向開源模式已經成為明顯趨勢。
對隱私計算來說,開源的最大必然性就在于有望徹底解決隱私計算長久以來急需自證清白、亟待互聯互通的迫切需求。
中國信通院云計算與大數據研究所所長何寶宏表示,隱私計算作為數據流通的基礎設施,除了開源的通用優(yōu)勢外,由于數據全流程的安全性非常重要,將代碼開放會讓安全性變得更加易于驗證;開源社區(qū)內的交流和反饋也會激發(fā)技術創(chuàng)新,創(chuàng)造滿足不同場景需求的多種技術方案。
在閉源模式下,自證清白可謂是隱私計算的一個先天難題。尤其在推進商業(yè)落地的過程中,隱私計算技術服務商始終難以從根本上向用戶證明數據在隱私計算過程中的安全性。開源意味著用戶可以直接在代碼層面檢驗相關系統機制,為用戶提供了徹底的安全性驗證。
張霖濤表示,盡管絕對安全并不存在,但相比閉源,開源無疑是隱私計算在自證清白這條路上邁進了一大步。
當然,心存惡意的技術服務商畢竟是極少數。除了自證清白外,開源提升安全性的更常見場景是把代碼交給更多人檢驗,發(fā)現bug及時修補??v觀軟件發(fā)展史,業(yè)界或用戶通過開源為技術服務商“捉蟲”的案例經常發(fā)生,對于改進代碼,提升系統安全性起到了重要作用。
互聯互通也是近年來隱私計算領域面對的又一大難題。各家技術服務商紛紛推出隱私計算平臺,在為各行各業(yè)消除數據孤島的同時,這些隱私計算平臺卻各自為政,形成了新的孤島。以宏觀和長遠眼光來看,這樣的局面仍然阻礙了數據價值發(fā)掘的效率,也影響了隱私計算產業(yè)的發(fā)展。
近兩年,隱私計算業(yè)界一直在努力解決互聯互通問題。中國信通院云計算與大數據研究所工程師呂艾臨表示,目前業(yè)界技術專家形成的共識是,隱私計算互聯互通在于如何實現算法的互通,其中算法的開源程度正是關鍵指標。算法開源程度越高,建立信任就更容易,實現互聯互通就越簡單直觀。
對此張霖濤認為,隱私計算平臺的互聯互通需要基于共識,還要有實實在在的基礎和抓手,代碼就是基礎,開源正是抓手和推動力。開源有利于各方形成共同代碼,繼而建立連接。翼數開源也秉承了這一理念,令用戶可以很容易與其他隱私計算平臺建立連接。
近年來,翼方健數一直致力于在更大范圍、更高維度上打通數據。翼方健數相信,隱私計算平臺的演化會經歷單體、聯盟、生態(tài)網絡三大階段,分別包括單體平臺(局域網)、平臺聯盟(專業(yè)網絡)及數據和計算互聯網IoDC (Internet of Data & Computing)。
張霖濤表示,梅特卡夫定律揭示網絡價值與連接用戶數的平方成正比,用戶越多,網絡價值越大?;ヂ摼W如此,數據網絡也是如此,IoDC的建設就是希望促進數據流通,建立更廣泛的數據連接,讓數據產生更大價值,相信開源能夠起到橋梁與催化劑的作用。
技術之上:商業(yè)模式的創(chuàng)新契機
時至今日,開源的涵義早已超越了開放源代碼,而是開啟了軟件業(yè)創(chuàng)新商業(yè)模式的新契機。隱私計算進入開源時代,同樣將對技術服務商、用戶、產業(yè)帶來深遠影響。
中國開源軟件推進聯盟《2021中國開源發(fā)展藍皮書》指出,全球范圍內開源商業(yè)模式正在逐漸成熟。在一些特色領域,開源軟件的商業(yè)價值甚至超過閉源軟件,開源相關風險投資交易總量與金額急劇增長,并涌現出一大批上市公司,國際高度分工的數萬億美元開源核心技術生態(tài)體系已經形成。
姜春宇表示,隱私計算開源具有重要意義。對于隱私計算領域的開發(fā)者來說,開源是企業(yè)社會責任的體現,有助于提升企業(yè)影響力,在商業(yè)上則有助于構建更廣泛的上下游生態(tài)圈,布局更完善的商業(yè)模式。對于使用者來說,開源令用戶可以方便地下載和使用源代碼,從而降低開發(fā)門檻,縮短開發(fā)時間,開發(fā)成本進一步降低,選擇更加豐富自由。對整個隱私計算行業(yè)來說,開源可以促進不同用戶群體間的交流,豐富行業(yè)應用、易于發(fā)現問題、激發(fā)技術創(chuàng)新。
張霖濤認為,伴隨技術發(fā)展,越來越多的行業(yè)玩家都已具備相當技術實力,想要進一步拉開競爭差距,就必須對行業(yè)有更深入的洞察,而不再是純技術問題。人工智能等新科技領域的開源歷史已經給隱私計算提供了借鑒參考,當有更多人都能訓練出優(yōu)秀的人工智能模型,獲得絕對技術優(yōu)勢也就變的變得更難。TensorFlow、PyTorch等開源框架的出現,就在技術競爭之上轉向吸引更多人進入AI賽道,推動AI的整體發(fā)展。
他希望隱私計算也會遵循相似路徑,從發(fā)展初期大家爭相比拼技術,到通過開源降低行業(yè)門檻,讓更多用戶和行業(yè)使用隱私計算并發(fā)掘數據價值,共同把整個隱私計算行業(yè)做大做強。
當然,要讓開源真正實現初心愿景并非易事,往往意味著大量技術與運營資源投入,許多國際上成功的開源項目或基于開源信念由眾多個體參與者自發(fā)投入,或由實力雄厚的互聯網巨頭投入主導。相比之下,以創(chuàng)業(yè)公司的姿態(tài)投身開源,就意味著對開源這件事有更客觀和清晰的地認識,翼方健數已然做好準備了。
張霖濤坦言,翼方健數在技術上并未選擇一開始就采用“重”投入策略,翼數開源兩大框架以輕量化為特色正是基于這樣的考量,開源初期搭建起靈活的框架,吸引更多社區(qū)力量做出貢獻。
然而不可忽視的是,開源在給隱私計算用戶帶去“福利”的同時,也對技術服務商提出了更高要求,帶來挑戰(zhàn)甚至是風險。
姜春宇就指出,開源雖然有很多好處,但也伴隨風險,需要長期關注,其中主要是合規(guī)風險和代碼安全漏洞風險,如泄露自身商業(yè)秘密,未遵守或識別知識產權問題導致違法等。另外,開源的“靈魂”或價值核心——開源社區(qū)也會帶來不少艱辛與挑戰(zhàn),如吸引和留存用戶,社區(qū)治理等。
事實上,開源的一大“副作用”就在于,把長期的技術積累公開示人相當于把競爭優(yōu)勢拱手相讓,同行或對手不僅能獲取相關技術,甚至能以此為基礎一舉超越代碼原創(chuàng)者。
對此張霖濤坦言,風險確實存在,但應該正面看待。相比風險,開源更大的價值是提升商業(yè)格局。翼方健數面對市場競爭方面并不擔憂,而是相信能通過開源做大市場,這樣所有參與者都將成為受益者。
對于安全漏洞與攻擊,張霖濤指出,這些風險本質上并非直接源于開源,即使在閉源模式下也可能發(fā)生,開源反而能讓更多人幫助技術服務商發(fā)現bug,盡早修補。而在社區(qū)建設方面,翼方健數自身也是這兩大框架的積極用戶,會投入足夠技術資源持續(xù)開發(fā)和改良。
盡管需要投入,也必然有挑戰(zhàn)和風險,但事實已經證明,成功的開源項目可以形成價值巨大的商業(yè)體系,如MongoDB市值近200億美元、微軟以75億美元收購 GitHub、IBM花費340億美元收購Red Hat等,許多國內外新興開源項目也吸引了大量資本涌入。
可以預見,隱私計算領域的開源也將帶來商業(yè)模式的一場變革。張霖濤并不諱言,開源除了在技術上有助于自證清白,證明團隊技術實力外,還激發(fā)了翼方健數對商業(yè)模式創(chuàng)新的思考。
他希望,開源能為公司獲得更多市場認可,吸引更多客戶。隱私計算技術服務商的盈利模式并不在于單項技術或為客戶完成項目,而應該始終緊抓數據價值,從構建全棧技術打通數據鏈路、促進數據流通等方面入手,最終實現以發(fā)掘數據價值為盈利模式。在這樣的思路下,數據網絡的擴展和用戶社區(qū)的擴大都將有望給公司帶來更大經濟效益。
《2021中國開源發(fā)展藍皮書》指出,未來10年中國將迎來世界級優(yōu)秀開源公司,一個商業(yè)化開源公司的成功需要方方面面,它需要整個團隊往前推,不僅僅是技術團隊在往前走,而是所有人同心協力往前走。要保證團隊具備技術之外的壁壘,要補足團隊的短板,比如開發(fā)者關系、市場契合度、設計團隊甚至樹立公司的品牌形象,都需要去做。
隱私計算領域是否能誕生現象級的開源商業(yè)標桿,翼方健數已在開拓前行,正如張霖濤所說:“開源推動技術發(fā)展,開源時代已來,翼方健數赴約而來”。
一場勝負在于是否有全局觀,數據價值鏈路的挑戰(zhàn)遠不止于此。但敢于亮出數據流通的底牌,至少說明這是一張實力過硬的王牌。
(免責聲明:本網站內容主要來自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網站出現的信息,均僅供參考。本網站將盡力確保所提供信息的準確性及可靠性,但不保證有關資料的準確性及可靠性,讀者在使用前請進一步核實,并對任何自主決定的行為負責。本網站對有關資料所引致的錯誤、不確或遺漏,概不負任何法律責任。
任何單位或個人認為本網站中的網頁或鏈接內容可能涉嫌侵犯其知識產權或存在不實內容時,應及時向本網站提出書面權利通知或不實情況說明,并提供身份證明、權屬證明及詳細侵權或不實情況證明。本網站在收到上述法律文件后,將會依法盡快聯系相關文章源頭核實,溝通刪除相關內容或斷開相關鏈接。 )