當前資訊!2022隱私計算十大觀察發(fā)布

發(fā)布時間:2022-07-13 18:44:53  |  來源:通信世界全媒體  

(CWW)2022年7月13日,由中國通信標準化協(xié)會指導,中國信息通信研究院(以下簡稱中國信通院)、隱私計算聯(lián)盟主辦的2022隱私計算大會在京召開。會上,中國信通院云計算與大數(shù)據(jù)研究所所長何寶宏發(fā)布了“2022隱私計算十大觀察”。



(資料圖片)

觀點一:數(shù)據(jù)產(chǎn)權分置,隱私計算迎來發(fā)展機遇

作為平衡數(shù)據(jù)流通與安全的重要工具,近幾年,工業(yè)和信息化部、人民銀行、國家發(fā)改委、中央網(wǎng)信辦等部門政策文件中均提到要推進隱私計算相關技術的研究攻關和部署應用,使得技術的關注度日漸提升;近期,隨著中央全面深化改革委員會第二十六次會議上審議通過了《關于構建數(shù)據(jù)基礎制度更好發(fā)揮數(shù)據(jù)要素作用的意見》,建立數(shù)據(jù)資源持有權、數(shù)據(jù)加工使用權、數(shù)據(jù)產(chǎn)品經(jīng)營權等分置的產(chǎn)權運行機制、建立合規(guī)高效的數(shù)據(jù)要素流通和交易制度等舉措,為實現(xiàn)原始數(shù)據(jù)不出域、數(shù)據(jù)可用不可見的隱私計算提供了更加明確的落地指引。

觀點二:技術體系擴展,隱私計算概念外延深化

早在2016年,李鳳華教授等人提出隱私計算是面向隱私信息全生命周期保護的計算理論和方法。后來我們在數(shù)據(jù)流通場景中對其概念進行延伸,將隱私計算的概念定義為不泄露原始數(shù)據(jù)前提下,保障數(shù)據(jù)在流通與融合過程中的“可用不可見”的一系列技術,以多方安全計算、聯(lián)邦學習和可信執(zhí)行環(huán)境三大方法為代表。而今,隨著隱私保護的需求越來越重視,隱私計算也稱隱私增強計算、隱私保護計算,其范疇逐漸擴大。例如,今年美國發(fā)布的法案中定義其為減輕數(shù)據(jù)處理所產(chǎn)生的個人隱私風險的任何軟硬件技術。因此,我們認為廣義的隱私計算是涵蓋隱私信息全生命周期過程的所有計算操作,包括任何實現(xiàn)隱私保護前提下數(shù)據(jù)安全流通共享的技術。除多方安全計算、聯(lián)邦學習、可信執(zhí)行環(huán)境這傳統(tǒng)三大方法外,還包括數(shù)據(jù)限制發(fā)布的技術、數(shù)據(jù)失真的技術和一些輔助技術。未來,可能還會隨著技術的發(fā)展,將包括一些新的技術內(nèi)容,技術外延將進一步擴展。

觀點三:技術路線融合,優(yōu)勢互補突破應用瓶頸

隱私計算的三大主流路線各自有著其獨特的優(yōu)勢與不足,這些不足阻礙了隱私計算的落地應用。

a.基于多方安全計算(MPC)的隱私計算具有較高的安全性,能夠做到可證明安全,但是因為協(xié)議本身需要大量的額外通信與計算,導致其計算效率差,高安全假設的方案難以在現(xiàn)實場景中被使用;

b.基于聯(lián)邦學習(FL)的隱私計算針對多方聯(lián)合機器學習有著較好的適配性,相比MPC方式,其能夠在更為合理的性能范圍之內(nèi)完成聯(lián)合機器學習任務。然而,聯(lián)邦學習的安全性參差不齊,安全基準設置困難,安全性較難評估,加重了用戶對聯(lián)邦學習的安全困擾;

c.基于可信執(zhí)行環(huán)境(TEE)的隱私計算結合了密碼技術與可信硬件,能夠在不過多損失性能的前提下,通過可信認證、一致性核驗、密文傳輸、計算隔絕等一系列手段保護來保護數(shù)據(jù)隱私。但是,基于TEE的方式多需要將數(shù)據(jù)集中處理,若攻擊者通過如側信道攻擊等方式破環(huán)了可信硬件的安全性,可能會導致明文數(shù)據(jù)泄露。

根據(jù)對市場各廠商、產(chǎn)品的調(diào)研,我們發(fā)現(xiàn)隱私計算的技術融合已經(jīng)成為了一大趨勢。在一些場景下,技術融合往往能夠產(chǎn)生1+1>2的效果,為解決隱私計算的各類技術瓶頸提供了新思路。

將MPC與FL融合,以實現(xiàn)更加安全的聯(lián)邦學習聚合算法,如通過秘密分享或全同態(tài)加密等方式在密態(tài)的環(huán)境下完成模型參數(shù)聚合;

將TEE與FL融合,借助TEE的可信性和隔絕性實現(xiàn)模型參數(shù)的安全匯聚,增強FL的安全性;

將MPC與TEE融合,通過MPC將明文態(tài)的數(shù)據(jù)轉為密態(tài)后放入TEE進行計算,防止因TEE被破壞而泄露數(shù)據(jù)隱私;借助TEE的隔絕性、保密性、一致性等能力,將跨網(wǎng)的MPC計算節(jié)點安全的放置在同一網(wǎng)絡內(nèi),解決MPC普遍存在的通信瓶頸問題,提高性能。

觀點四:平衡安全性能,安全分級靈活適應場景

一般來說,隱私計算的安全與性能兩者相互制約。安全假設較弱時,其性能普遍較強;反之,安全假設較強時,其性能普遍較弱。高安全假設的方案會極大增加額外通信和計算負擔,造成性能不具備實用性。

根據(jù)中國信通院“可信隱私計算”性能專項評測以及對一些相關論文的結果分析,我們在圖中舉例列出了三類安全假設下的平均性能情況。在參與方半誠實且不存在合謀風險的情況下,針對聯(lián)合機器學習任務,計算耗時能夠達到明文的50-200倍;在滿足半誠實模型假設并且部分滿足惡意模型,存在少數(shù)不誠實方的前提下,計算耗時提升到了約為明文計算的100倍以上;在最嚴格的不誠實大多數(shù)惡意模型假設下,計算耗時更是增長到了約為明文計算的近千倍以上。因此,在實際的業(yè)務場景中,很多情況并不需要考慮如惡意參與方或合謀攻擊的問題,盲目的選擇高安全方案也是不可取的。應根據(jù)實際需求選擇適合的安全等級,實現(xiàn)安全與性能的動態(tài)平衡,避免唯安全論/唯性能論。

觀點五:支撐產(chǎn)品落地,技術可用性有一定提升

隱私計算已經(jīng)從去年的場景驗證階段邁入今年的場景落地應用階段,除了安全性,隱私計算的可用性也受到各方的極大關注。可用性是應用場景能夠規(guī)模落地的主要抓手。可用性主要包括計算性能、系統(tǒng)穩(wěn)定性、產(chǎn)品易用性和場景支持能力。

性能方面,通過算法優(yōu)化、并行計算或加速卡、一體機來加速計算效率。當下,性能已經(jīng)可以支持億級數(shù)據(jù)的計算,高并發(fā)XGB算法建模效率相比之前可提高至少50%;此外,市面上已經(jīng)不少家廠商推出了一體機產(chǎn)品,計算效率可提升數(shù)十到數(shù)百位。

穩(wěn)定性方面,主備、多活和自動容災恢復的能力在產(chǎn)品應用中也有顯現(xiàn),比如本批次測試中MPC產(chǎn)品穩(wěn)定性用例的通過比率已由去年的10%提高到40%。

易用性和場景支持能力方面,通過拖拉拽、駕駛艙等交互界面的可視化,降低了用戶學習成本;我們也觀察到約9成以上的產(chǎn)品具備可視化操作和容器化部署等易用性能力。同時,今年以來,金融、政務、醫(yī)療場景案例有明顯提升。對金融的實時性業(yè)務場景、海量數(shù)據(jù)高并發(fā)場景的支持能力也有顯著的提升。

觀點六:軟件硬件協(xié)同,一體機成為產(chǎn)品新形態(tài)

當下,利用硬件特性增強軟件方案,實現(xiàn)隱私計算性能和安全性的同時提升是主流的方法。一是隱私計算一體機作為軟硬結合一體的專用設備,其安全加固、性能加速和易用性增強的三大優(yōu)勢,使得隱私計算一體機從眾多工程優(yōu)化方案中脫穎而出,降低用戶使用技術門檻和綜合成本。二是基于硬件的實現(xiàn)方式并不唯一,各家產(chǎn)品百花齊放??苫诳尚庞布蛴布艽a模塊,也可利用計算加速卡,同時還可以預裝應用服務場景組件,組合方案多樣化,多硬件多角度組合提升成為軟硬結合的發(fā)展趨勢,根據(jù)不完全統(tǒng)計也可看出,加速卡因其容易實現(xiàn),因此在目前的軟硬結合方案中占比較大。三是一體機等軟硬結合的方案在金融政務醫(yī)療等場景嶄露頭角,且因為產(chǎn)品形態(tài)多樣,標準化需求迫切,國內(nèi)外已有多個標準帶頭規(guī)范技術研發(fā)和應用。最后,并非僅有隱私計算一體機可以突破應用瓶頸,擴大應用規(guī)模,軟硬結合的多種落地方案仍需進一步探索,加快場景落地。

觀點七:應用落地加速,內(nèi)外雙向賦能數(shù)據(jù)流通

行業(yè)應用方面,我們根據(jù)2019-2022年政府公開招標項目整理,發(fā)現(xiàn)隱私計算在金融、通信、政務、醫(yī)療等行業(yè)的應用比較多。在整理的招標項目中,來自金融行業(yè)的項目占比最高,達到55%,主要包含銀行、證券、保險、金融科技公司等;其他是通信行業(yè)占比17%,主要是運營商;政務行業(yè)占比13%,主要來自政府機構、政府部門、事業(yè)單位等;醫(yī)療行業(yè)占比8%,主要來自醫(yī)院、研究機構等。不同行業(yè)建設部署目的分布不同。我們用對內(nèi)賦能、對外賦能、雙向賦能這三個概念進行區(qū)分。對內(nèi)賦能是指招標方通過隱私計算平臺引入外部數(shù)據(jù)或能力提升內(nèi)部業(yè)務效果,也就是通常說的“買入數(shù)據(jù)”;對外賦能是指招標方通過隱私計算平臺對外輸出數(shù)據(jù)或能力,也就是通常說的“賣出數(shù)據(jù)”;而雙向賦能則是同時進行。我們發(fā)現(xiàn),不同行業(yè)的賦能方向差異很大。比如,金融行業(yè)55%的項目目的為對內(nèi)賦能,主要為聯(lián)合通信、互聯(lián)網(wǎng)、其他金融機構等數(shù)據(jù)資源提升自身風控、營銷水平。而反過來,互聯(lián)網(wǎng)、通信、醫(yī)療、能源行業(yè)對外賦能占比均超50%,以數(shù)據(jù)運營、數(shù)據(jù)服務方式對外輸出自身的數(shù)據(jù)價值。政務行業(yè)雙向賦能占比較高,一是通過政務數(shù)據(jù)內(nèi)部共享,實現(xiàn)政務數(shù)據(jù)整合和協(xié)同共享;二是通過政務數(shù)據(jù)對外開放、數(shù)據(jù)運營對外賦能,如打通銀政企信息孤島促進普惠金融,如通信數(shù)據(jù)提升反欺詐效果。

觀點八:各方積極探索,合規(guī)路徑亟需形成共識

合規(guī)性方面,我們認為隱私計算的合規(guī)性這兩年來大家積極探索,但路徑的共識還需要進一步形成。在我國現(xiàn)行的法律框架內(nèi),匿名化和授權同意是數(shù)據(jù)處理最主要的兩條合規(guī)路徑。而隱私計算合規(guī)性的關鍵爭議就在于隱私計算技術的數(shù)據(jù)處理效果是否可以滿足法律上“不可復原、不可識別”的匿名化要求。

一方面,如果認為隱私計算完全滿足匿名化要求,則無需經(jīng)過授權同意,但現(xiàn)有法律中的“匿名化”要求被認為在絕大多數(shù)應用場景中都無法達到,監(jiān)管層面還沒有可解釋的具體規(guī)則,這類觀點很難被接受

另一方面,如果認為隱私計算僅能滿足去標識化要求,達不到匿名化的標準,那么數(shù)據(jù)處理的對象仍然是個人數(shù)據(jù),仍然需要數(shù)據(jù)處理全流程的授權同意,這必然會降低隱私計算技術應用的吸引力

因此,為了兼顧合規(guī)要求和應用效率,業(yè)界開始探索隱私計算的創(chuàng)新合規(guī)路徑,即認為隱私計算可以在一定程度上滿足匿名化要求,但仍需結合不同場景對關鍵事項獲取授權同意。這就需要對隱私計算的各個技術環(huán)節(jié)進行拆解,明確需要關注的風險點和合規(guī)最佳實踐,建立技術上的匿名化規(guī)則,同時也要嘗試去探索在各個場景下對個人信息主體造成權益侵害的環(huán)節(jié)和事項,對這些事項進行詳細告知,從而在權益保護和技術發(fā)展之間尋求平衡。當然,這種實踐的思路還處于一個初期設想階段,仍然需要技術和法律界同仁的共同努力,從而為隱私計算等技術的合規(guī)發(fā)展提供更為清晰的指引。

觀點九:激發(fā)技術創(chuàng)新,隱私計算積極擁抱開源

再說說開源。開源作為激發(fā)技術創(chuàng)新和建立技術生態(tài)的主要手段,在大數(shù)據(jù)時代已演變得越來越成熟,許多基礎設施軟件都是由開源而來。隱私計算作為數(shù)據(jù)流通的基礎設施同樣也是如此,除了開源的通用優(yōu)勢外,由于數(shù)據(jù)全流程的安全性非常重要,將代碼開放會讓安全性變得更加易于驗證;開源社區(qū)內(nèi)的交流和反饋也會激發(fā)技術創(chuàng)新,創(chuàng)造滿足不同場景需求的多種技術方案。此外,當前隱私計算大部分企業(yè)技術方案迥異,導致難以互通,應用方通常需要部署多種產(chǎn)品,而隱私計算的開源會讓用戶更易達成共識,也有利于隱私計算的互聯(lián)互通。

當前隱私計算開源項目大致可分為協(xié)議框架開源和產(chǎn)品開源,協(xié)議框架開源大部分是針對于某一技術,如MPC領域的mp-spdz、OpenCheetah等,專注于的安全與性能提升。另外也有對產(chǎn)品平臺的開源,更易形成生態(tài)。總體來講,優(yōu)秀的底層開源協(xié)議可以嵌入到平臺中被廣泛應用,而隱私計算的產(chǎn)品開源項目大部分仍處于初期,僅代碼開放但社區(qū)建設不完備。

下圖是國內(nèi)外主要的開源平臺或協(xié)議框架,可以看出近三年越來越多的企業(yè)加入隱私計算開源隊伍,有包括底層技術協(xié)議,也有企業(yè)的平臺類項目,其主要特點包括易用性,方便流程簡易部署方便,用戶能快速上手;可擴展性,指產(chǎn)品架構可分為底層算法協(xié)議、算子層和應用層等,各層之間可獨立開發(fā),并支持模塊化;完備性是指能支持包括聯(lián)合統(tǒng)計、隱私集合求交、建模等多種功能,每種功能也有滿足不同性能與安全要求的算法;最后兼容性是能為未來互聯(lián)互通作準備,架構設計上能兼容其他框架。我們對于未來隱私計算的開源技術和商業(yè)模式充滿信心。

觀點十:共識繼續(xù)強化,互聯(lián)互通加速落地實踐

最后是關于互聯(lián)互通的觀察。隨著隱私計算應用的逐漸鋪開,互聯(lián)互通的需求共識也進一步增強。我們應該認識到互聯(lián)互通既是降低隱私計算部署和應用成本的現(xiàn)實需求,又能夠促進技術產(chǎn)品接口和服務的標準化,為打造數(shù)據(jù)流通基礎設施夯實基礎。

此前一年多的實踐,大家主要圍繞互聯(lián)互通的概念、內(nèi)涵和標準框架進行討論和探索,從標準體系層,包括中國信通院云大所牽頭的隱私計算聯(lián)盟、大數(shù)據(jù)技術標準推進委員會(TC601)、全國信息安全標準化技術委員會(TC260)、北京金融科技產(chǎn)業(yè)聯(lián)盟、IEEE等在內(nèi)的標準化組織和研究機構都在推進相關技術標準的研討和編寫;去年7月發(fā)布的《隱私計算 跨平臺互聯(lián)互通 第1部分:總體框架》也得到了眾多專家的認可。

但是,我們也認識到僅靠標準層面的、原則性的框架要求很難指導實踐落地,具體如何實現(xiàn)互聯(lián)互通,各個技術提供方和應用需求方的觀望多于行動,大家都呼喚可以看到具有標桿性、影響力的可落地、可復制、可驗證的實踐案例來提供參考;今年初公開的招商銀行連同4家技術廠商實現(xiàn)的互聯(lián)互通相對此前已在具體應用層面取得了新的進展,但同很多此前公開宣傳的案例一樣,可驗證、可落地、可復制性等仍然不足,因此,更加成熟的、示范性案例將是接下來促進互聯(lián)互通實踐落地的關鍵。


關鍵詞: 通信世界網(wǎng) 隱私計算

 

網(wǎng)站介紹  |  版權說明  |  聯(lián)系我們  |  網(wǎng)站地圖 

星際派備案號:京ICP備2022016840號-16 營業(yè)執(zhí)照公示信息版權所有 郵箱聯(lián)系:920 891 263@qq.com