00
引 言
近年來,數(shù)字化浪潮蓬勃興起,數(shù)據(jù)作為基礎(chǔ)戰(zhàn)略資源和關(guān)鍵生產(chǎn)要素的地位日益凸顯。根據(jù)歐盟估測,2020年歐洲個人數(shù)據(jù)產(chǎn)生的價值占國內(nèi)生產(chǎn)總值的8%。此外,根據(jù)國際數(shù)據(jù)公司(International Data Corporation,IDC)的報道我國數(shù)據(jù)體量已超全球總量的1/5并正處于持續(xù)增長階段,數(shù)據(jù)紅利將持續(xù)推動我國數(shù)字經(jīng)濟(jì)的向好發(fā)展。然而,在人工智能、物聯(lián)網(wǎng)、移動互聯(lián)網(wǎng)、云計算和5G等新興技術(shù)的驅(qū)動下,數(shù)據(jù)的流通與變現(xiàn)使得數(shù)據(jù)更容易脫離控制,并出現(xiàn)非法濫用的情況。數(shù)據(jù)安全問題日益凸顯,日益增長的隱私泄露事件更是為我國敲響了警鐘。
為解決數(shù)據(jù)的隱私安全問題,同時發(fā)揮數(shù)據(jù)流動與數(shù)據(jù)增值的能力,一系列隱私計算技術(shù)被提出。安全多方計算(Secure Multiparty Computation,MPC)無疑是其中的佼佼者。在經(jīng)歷了40年的理論研究之后,近幾年來MPC被大量應(yīng)用于金融、政務(wù)、醫(yī)療和互聯(lián)網(wǎng)等行業(yè)領(lǐng)域的試點建設(shè)中,顯示良好的應(yīng)用前景,然而從理論到實踐仍有頗多問題亟待解決。本文就MPC的落地應(yīng)用性進(jìn)行綜合研究,在梳理MPC技術(shù)基礎(chǔ)上,提出MPC技術(shù)架構(gòu)和實現(xiàn)路徑,并對行業(yè)應(yīng)用進(jìn)行歸分析,最后從應(yīng)用推廣層面給出建議和下一步規(guī)劃,助力MPC的規(guī)模化應(yīng)用與發(fā)展。
01
數(shù)據(jù)安全與隱私計算
1.1 數(shù)據(jù)安全法律政策背景
大數(shù)據(jù)時代,互聯(lián)網(wǎng)經(jīng)濟(jì)的本質(zhì)更趨向于圍繞用戶創(chuàng)造價值。而實踐中,濫用數(shù)據(jù)、損害數(shù)據(jù)主體權(quán)益的現(xiàn)象時有發(fā)生。數(shù)據(jù)安全,法律先行。越來越多的國家以頂層立法的形式規(guī)范數(shù)據(jù)的安全應(yīng)用,平衡數(shù)據(jù)保護(hù)與數(shù)據(jù)流通的關(guān)系。例如,歐盟出臺的《通用數(shù)據(jù)保護(hù)條例》(General Data Protection Regulation,GDPR)以及美國簽發(fā)的《加利福尼亞州消費者隱私保護(hù)法案》(California Consumer Privacy Act,CCPA)都是數(shù)據(jù)安全立法的典范。我國高度重視數(shù)據(jù)安全,先后頒布了《網(wǎng)絡(luò)安全法》《密碼法》頂層律法,并持續(xù)推動“等?!薄懊茉u”系列保障工作。2021年6月10日,我國頒布《數(shù)據(jù)安全法》,自2021年9月1日起施行,顯示出了我國數(shù)據(jù)安全治理的決心。
1.2 隱私計算
隱私計算是解決數(shù)據(jù)隱私保護(hù)與數(shù)據(jù)價值流通的系列技術(shù)的統(tǒng)稱,其目標(biāo)是“數(shù)據(jù)可用不可見”。隱私計算主要涵蓋4類技術(shù)路線:可信執(zhí)行環(huán)境(Trusted Execution Environment,TEE)、差分隱私(Differential Privacy,DP)、聯(lián)邦學(xué)習(xí)(Federated Learning,F(xiàn)L)以及MPC。
TEE使用硬件隔離技術(shù)構(gòu)建出安全可信區(qū)域,加密后的數(shù)據(jù)在此區(qū)域內(nèi)運算。若無密鑰授權(quán),即使操作系統(tǒng)也無法訪問其中的數(shù)據(jù)。TEE的安全性主要依賴于硬件實現(xiàn),比較典型的方案為Intel SGX以及ARM Trust-Zone。
DP技術(shù)的基本思想是在數(shù)據(jù)中增加噪聲以達(dá)到數(shù)據(jù)混淆不可區(qū)分的目的,主要應(yīng)用于數(shù)據(jù)結(jié)果的隱私保護(hù)。DP在提供隱私安全的同時,會一定程度影響數(shù)據(jù)的實用性。
FL是谷歌公司在2014年針對數(shù)據(jù)孤島提出的分布式機器學(xué)習(xí)方法。最初的FL主要是基于“數(shù)據(jù)不出域,模型跑路”的思想實現(xiàn)聯(lián)合建模,然而模型參數(shù)并未得到充分保護(hù),存在隱私泄露風(fēng)險。后續(xù)研究者提出一系列結(jié)合DP、MPC的FL安全增強方案,以實現(xiàn)隱私性和實用性的平衡。
MPC是一種在參與方不共享各自數(shù)據(jù)且沒有可信第3方的情況下安全地計算約定函數(shù)的密碼學(xué)技術(shù)。該技術(shù)具備高安全性、多場景適用性的特點,同時擁有實用性和可擴(kuò)展性的優(yōu)勢,具有非常高的研究熱度和應(yīng)用價值。本文將重點分析MPC的技術(shù)特點和架構(gòu)思想,提出以MPC構(gòu)建隱私計算體系的實踐之路。
02
MPC技術(shù)架構(gòu)
2.1 MPC密碼技術(shù)體系
1982年,MPC由清華大學(xué)姚期智院士基于百萬富翁問題提出。MPC使多個參與方能夠以一種安全的方式正確執(zhí)行分布式計算任務(wù)。具體來說,圖片個參與方圖片希望利用各自的秘密輸入共同計算圖片元功能函數(shù),元功能函數(shù)通常是一個隨機函數(shù)圖片,每個參與方圖片,持有秘密輸入圖片,計算完成得到輸出圖片。且每個參與方除了自己的輸入和輸出以及由其可以推出的信息外得不到任何額外信息。
如圖1所示,MPC涵蓋無中心、隱私安全以及數(shù)據(jù)價值3方面核心要求。去中心化是MPC區(qū)別于傳統(tǒng)集中式計算的核心,數(shù)據(jù)隱私是MPC的安全目標(biāo),數(shù)據(jù)價值則是MPC能力交付的關(guān)鍵。
圖片
圖1 MPC核心要求
如圖2所示,MPC是一系列密碼技術(shù)的體系化組合,主要涵蓋密碼資源供給、密碼學(xué)基礎(chǔ)、密碼應(yīng)用3個層面。和傳統(tǒng)的密碼系統(tǒng)類似,MPC的密碼底層資源也包括密碼芯片、板卡、整機、軟件、系統(tǒng)和云服務(wù)等多種形態(tài)密碼產(chǎn)品。MPC密碼學(xué)基礎(chǔ)在傳統(tǒng)的對稱密碼與公鑰基礎(chǔ)設(shè)施(Public Key Infrastructure,PKI)等技術(shù)基礎(chǔ)上,拓展了基于標(biāo)識的密碼系統(tǒng)(Identity-Based Cryptograph,IBC)以及無證書公鑰密碼體制(Certificateless Public Key Cryptography,CL-PKC)等技術(shù)。MPC作為一門前沿密碼技術(shù),面向不同應(yīng)用場景主要提供秘密分享、同態(tài)加密、混淆電路以及定制技術(shù)等4類技術(shù)方案或組合。
表1對4種技術(shù)方案進(jìn)行了對比和總結(jié)??偟膩碚f,秘密分享技術(shù)應(yīng)用最為廣泛,適用于所有MPC場景,這也可以從絕大多數(shù)MPC產(chǎn)品都支持秘密分享這一事實進(jìn)行佐證。同態(tài)加密隨著算法的逐漸成熟,未來將會有更廣闊的應(yīng)用空間?;煜娐芳夹g(shù)多用于布爾運算場景。針對特定場景的定制技術(shù)也有較多應(yīng)用案例。
表1 不同MPC技術(shù)比較
圖片
圖片
圖2 MPC密碼技術(shù)體系
2.2 MPC平臺體系架構(gòu)
以MPC技術(shù)為核心構(gòu)建的隱私計算產(chǎn)品,往往稱為MPC平臺,參考框架如圖3所示。MPC平臺是以密碼為核心的隱私安全產(chǎn)品,合規(guī)是其最基本的要求,因此它應(yīng)當(dāng)遵循相關(guān)法律法規(guī),并滿足系列標(biāo)準(zhǔn)要求。MPC技術(shù)平臺支持兩種技術(shù)架構(gòu)。其一是MPC直接貫通平臺的方式:首先采用MPC協(xié)議、MPC編譯器、MPC應(yīng)用適配構(gòu)建MPC運算模塊;其次通過MPC運算模塊支撐上層的通用運算和機器學(xué)習(xí)運算;最后實現(xiàn)隱私求交、隱私統(tǒng)計和聯(lián)合建模等隱私計算功能。其二是以MPC增強FL的方式構(gòu)建平臺:首先在底層構(gòu)建FL運算模塊,并使用MPC對其進(jìn)行安全增強;其次通過FL運算模塊支撐上層的機器學(xué)習(xí)算法;最后實現(xiàn)機器學(xué)習(xí)類的隱私計算功能。
圖片
圖3 MPC平臺體系框架
從產(chǎn)品的角度看,MPC平臺是涉及多個節(jié)點的分布式計算平臺,至少包含6類角色:任務(wù)發(fā)起方、調(diào)度方、算法提供方、數(shù)據(jù)提供方、結(jié)果使用方以及計算方。角色之間的邏輯視圖關(guān)系如圖4所示??梢钥闯觯粋€節(jié)點可以包括多種角色,如某節(jié)點既可能是數(shù)據(jù)提供方,也可能是計算方;多個節(jié)點可以組成同一個角色,如多個節(jié)點以集群的方式成為一個計算方。
圖片
圖4 MPC平臺邏輯
2.3 MPC平臺產(chǎn)品化思路
近年來,MPC理論研究不斷推陳出新,取得進(jìn)步;工業(yè)上MPC產(chǎn)業(yè)初見規(guī)模。如何利用開放的MPC成果,構(gòu)建MPC平臺是值得思考的問題。
通過研究分析,同時結(jié)合產(chǎn)業(yè)情況,本文提出如圖5所示的兩種產(chǎn)品化思路。
?。?)自底向上。這是密碼工程師的視角。具體的是以底層密碼學(xué)原語為基石,一步步自底向上構(gòu)建密碼協(xié)議、密碼應(yīng)用及平臺產(chǎn)品。此種方式安全強度得到充分控制,可以達(dá)到設(shè)定的安全目標(biāo),但通常情況下產(chǎn)品周期較長,可能存在交付問題。
?。?)自頂向下。這是軟件工程師的視角。具體的是先選擇平臺框架,后續(xù)工作主要為基于平臺框架的應(yīng)用開發(fā),同時兼顧其中的MPC技術(shù)的應(yīng)用和優(yōu)化。此種方式適合快速工程實現(xiàn),不過隨著產(chǎn)品的應(yīng)用發(fā)展,會以安全補丁的形式持續(xù)增強安全性。
兩種方式?jīng)]有絕對的優(yōu)劣,在具體的工業(yè)實現(xiàn)中,應(yīng)當(dāng)根據(jù)實際場景及安全強度要求選擇適用的方法。
03
MPC應(yīng)用
3.1 政務(wù)應(yīng)用
政務(wù)領(lǐng)域是MPC的主戰(zhàn)場。主要包括政務(wù)數(shù)據(jù)公開共享、大數(shù)據(jù)交易兩類場景。
政務(wù)數(shù)據(jù)屬于公共資源,其基本屬性就決定了數(shù)據(jù)公開、共享等性質(zhì)。傳統(tǒng)的數(shù)據(jù)共享交換方式仍然存在數(shù)據(jù)出域不受控等風(fēng)險,實際推廣應(yīng)用受到了較多阻礙。MPC突破隱私安全限制,是政務(wù)數(shù)據(jù)共享落地的有力抓手,圖6描述了MPC如何助力政務(wù)數(shù)據(jù)惠民服務(wù)。
圖片
圖6 政務(wù)大數(shù)據(jù)多方計算
大數(shù)據(jù)交易是在數(shù)據(jù)要素賦能產(chǎn)業(yè)升級的背景下提出的。近年來,全國多地紛紛成立大數(shù)據(jù)交易所,提供一系列數(shù)據(jù)清洗、供需撮合、法律咨詢和價值評估等市場化專業(yè)服務(wù),MPC便是其底層核心技術(shù)之一。
3.2 金融應(yīng)用
金融是數(shù)據(jù)密集型行業(yè),MPC需求最為迫切。事實上,MPC最好的商業(yè)機會確實來自于金融領(lǐng)域。MPC等隱私計算技術(shù)正在重構(gòu)金融3大核心業(yè)務(wù):營銷、風(fēng)控、反欺詐。
圖7給出了MPC在金融風(fēng)控場景中的應(yīng)用示例。在進(jìn)行貸款業(yè)務(wù)時,往往單一金融機構(gòu)無法形成用戶客群的完整畫像,很難綜合評判用戶信用。此時便需要多家金融機構(gòu),如各大商業(yè)銀行、保險公司和貸款機構(gòu)等,共同聯(lián)合刻畫用戶行為和決策風(fēng)險。
3.3 醫(yī)療應(yīng)用
MPC在醫(yī)療行業(yè)存在巨大潛在價值,但依然面臨著艱巨的挑戰(zhàn)。由于醫(yī)療數(shù)據(jù)天然不可能做成集中式公共數(shù)據(jù)集且消費邊界清晰,因此MPC機會頗多。但醫(yī)療行業(yè)面臨數(shù)據(jù)整合難、政策限制多和法律不明確等系列困難,MPC難落地。
圖8給出了MPC在大數(shù)據(jù)醫(yī)療中的應(yīng)用示意。結(jié)合MPC、醫(yī)療大數(shù)據(jù)、互聯(lián)網(wǎng)數(shù)據(jù),構(gòu)建醫(yī)療人工智能系統(tǒng),能夠?qū)崿F(xiàn)精準(zhǔn)流調(diào)排查、自主醫(yī)療診斷和精準(zhǔn)藥物研制等目標(biāo)。在后疫情時代,基于MPC的醫(yī)療大數(shù)據(jù)應(yīng)用或?qū)⒊蔀榭焖侔l(fā)展的市場。
3.4 創(chuàng)新應(yīng)用
信息技術(shù)的飛速發(fā)展拓展了MPC的應(yīng)用領(lǐng)域,MPC在和區(qū)塊鏈、物聯(lián)網(wǎng)、邊緣計算和5G等新興技術(shù)的碰撞與融合中,創(chuàng)造了更多的創(chuàng)新應(yīng)用模式。圖9給出了萬物互聯(lián)場景下的MPC示例。安全計算節(jié)點不再局限于傳統(tǒng)的機構(gòu)或單位,而是向邊緣側(cè)、終端側(cè)下沉,形成了覆蓋端、邊、云的協(xié)同計算資源池,實現(xiàn)了更廣義的隱私安全。
04
MPC發(fā)展建議
4.1 當(dāng)前面臨的困難
當(dāng)前,MPC面臨的困難主要體現(xiàn)在以下3個方面。
?。?)上位法律形成,但政策引領(lǐng)不足。我國已頒布網(wǎng)絡(luò)安全法、數(shù)據(jù)安全法、密碼法等系列上位律法,能夠從頂層牽引MPC等隱私計算的落地應(yīng)用,指導(dǎo)意義巨大。然而,行業(yè)規(guī)范、應(yīng)用法規(guī)等系列下位政策并未及時跟進(jìn),總體上存在責(zé)任邊界不清晰、應(yīng)用要求不明確等現(xiàn)狀,導(dǎo)致用戶不敢用、市場不好推等困難。
?。?)技術(shù)百花齊放,但標(biāo)準(zhǔn)化程度低。盡管金融等行業(yè)開始涉足標(biāo)準(zhǔn)化等工作,但標(biāo)準(zhǔn)化程度仍然非常欠缺。由于MPC技術(shù)的多樣性和碎片化,客觀上導(dǎo)致沒有一個技術(shù)可以解決所有隱私計算問題,而且相互之間很難互通,數(shù)據(jù)孤島問題轉(zhuǎn)為技術(shù)孤島問題。
?。?)應(yīng)用前景廣闊,但局面并未打開。目前,MPC項目仍然是研究和試點,處于探索階段,政府、銀行等機構(gòu)還在論證安全性、可行性及適用性,未來還有一段漫長的推廣之路。
4.2 發(fā)展建議
本文對MPC的發(fā)展和應(yīng)用提出以下建議:
?。?)健全政策配套,補齊行業(yè)規(guī)范,明確應(yīng)用要求;
?。?)聚合產(chǎn)業(yè)生態(tài),建立標(biāo)準(zhǔn)化聯(lián)盟,打破技術(shù)孤島;
?。?)加大技術(shù)突破,構(gòu)建成熟商用的能力體系,提升應(yīng)用體驗;
?。?)多元行業(yè)并舉,在政務(wù)、金融、醫(yī)療等行業(yè)樹立標(biāo)桿并規(guī)?;茝V,同時打通企業(yè)數(shù)字化、智慧城市等應(yīng)用場景,全面做大MPC應(yīng)用規(guī)模。
05
結(jié) 語
本文對MPC的技術(shù)與應(yīng)用進(jìn)行梳理,分析數(shù)據(jù)安全政策背景及隱私計算需求,重點針對MPC研究技術(shù)體系、架構(gòu)體系以及產(chǎn)品設(shè)計體系,提出MPC在政務(wù)、金融、醫(yī)療、創(chuàng)新領(lǐng)域的應(yīng)用方案,基于當(dāng)前現(xiàn)狀提出未來發(fā)展建議。本文提出的研究成果具備總體性、系統(tǒng)性、實用性,能夠為未來MPC的發(fā)展提供支撐。