文獻標識碼: A
DOI: 10.19358/j.issn.2096-5133.2020.12.001
引用格式: 陳磊,薛見新,張潤滋,等. 基于信息熵的數(shù)據(jù)集重標識風險評估方法[J].信息技術(shù)與網(wǎng)絡安全,2020,39(12):1-7.
0 引言
在大數(shù)據(jù)時代下,數(shù)據(jù)共享、發(fā)布和交易等場景需求變得越來越多,一方面促進了數(shù)據(jù)流通與價值利用,另一方面引發(fā)的個人數(shù)據(jù)與隱私安全事件近年來呈現(xiàn)爆發(fā)趨勢[1]。
為了應對挑戰(zhàn),在法規(guī)層面,全球掀起了數(shù)據(jù)隱私的立法熱潮,如歐盟《通用數(shù)據(jù)保護條例》(GDPR)、美國《加州消費者隱私法案》(CCPA)等。我國2017年實施的《網(wǎng)絡安全法》,其中一個章節(jié)專門明確個人信息安全;此外,我國《個人信息保護法》在加快立法與制定中。在技術(shù)層面,如何平衡數(shù)據(jù)利用與隱私保護問題,已經(jīng)成為學術(shù)界和工業(yè)界的一大研究熱點[2]。當前,已經(jīng)發(fā)展出了保留格式加密(Format-Preserving Encryption,F(xiàn)PE)[3]、差分隱私(Differential Privacy,DP)[4]、K-匿名(K-Anonymity)[5]和L-多樣性(L-Diversity)[6]以及去標識化(De-identification)[7]等技術(shù)。其中,去標識化技術(shù)通過對原始個人信息進行部分屏蔽、泛化和失真等數(shù)據(jù)變換操作,是一種意圖消除“個人身份”的隱私保護技術(shù)。由于其處理規(guī)則簡單靈活且易于并行處理(高效),目前在隱私保護的數(shù)據(jù)發(fā)布和數(shù)據(jù)挖掘等實際場景中有廣泛應用與部署。通常,在工業(yè)界習慣稱為“數(shù)據(jù)脫敏”。
本文詳細內(nèi)容請下載:http://ihrv.cn/resource/share/2000003069
作者信息:
陳 磊1,2,薛見新1,2,張潤滋1,2,劉文懋1
(1.綠盟科技集團股份有限公司,北京100089;2.清華大學 自動化系,北京100084)