這次開發(fā)出的數(shù)據(jù)保護工具,可確保關(guān)鍵數(shù)據(jù)集中的敏感個人信息通過嚴密檢查后再公開共享,比如用于跟蹤COVID-19疫情蔓延的數(shù)據(jù)集。
澳大利亞國家科學機構(gòu)(CSIRO)下轄Data61專家小組、新南威爾士州政府、澳大利亞計算機協(xié)會(ACS)等多家機構(gòu)合作開發(fā)了一款隱私保障工具,被命名為個人信息因素(Personal Information Factor,簡稱PIF),可評估任意數(shù)據(jù)集內(nèi)的個人數(shù)據(jù)風險,建立起有針對性的高效保護機制。
傳統(tǒng)上,這類評估往往由領(lǐng)先的數(shù)據(jù)與隱私專家進行。如今,專家們可以使用計算機模型快速驗證數(shù)據(jù)敏感性評估結(jié)果。
自2020年以來,澳大利亞國家科學機構(gòu)一直與本國網(wǎng)絡(luò)安全合作研究中心(CSCRC)合作探索增強這款工具的方法。
01 使用復雜的數(shù)據(jù)分析算法
PIF工具使用了一種復雜的數(shù)據(jù)分析算法,對數(shù)據(jù)集敏感信息的還原風險(已脫敏的個人信息是否還能與實際所有者重新匹配起來)做出評估。
自2020年3月以來,新南威爾士州政府一直使用這款工具的早期版本對州內(nèi)的COVID-19疫情傳播數(shù)據(jù)集進行跟蹤,旨在保證數(shù)據(jù)內(nèi)容公開發(fā)布前得到適當保護。
新南威爾士州政府首席數(shù)據(jù)科學家Ian Oppermann博士表示,“目前,PIF工具的作用可以說是獨一無二。它經(jīng)歷了長期的合作與發(fā)展,源自各州、聯(lián)邦政府以及行業(yè)從業(yè)者們的不懈努力。”
“每一天,它都在幫助我們對新南威爾士州民眾的匿名COVID-19感染數(shù)據(jù)集進行安全性與隱私風險評估。在它的幫助下,我們能夠在公開發(fā)布數(shù)據(jù)內(nèi)容之前,將敏感信息還原風險降至最低水平?!?/p>
Oppermann博士還提到,COVID-19進一步增強了公眾對于數(shù)據(jù)隱私需求的認識。
Oppermann博士指出,“考慮到社區(qū)對于不斷增長的COVID-19病例的強烈關(guān)注,我們需要在細粒度層級上及時發(fā)布關(guān)鍵信息,詳細介紹何時、何處確認了新的COVID-19病例。這項工作要求我們在疫情流行初期推理出可能的感染原因,并確認感染者的年齡范圍?!?/strong>
“我們希望相關(guān)數(shù)據(jù)盡可能詳盡精準,同時切實保護與這些數(shù)據(jù)集相關(guān)的個人隱私與身份信息?!?/p>
02 數(shù)據(jù)去身份化方法可進一步提高隱私水平
澳大利亞國家科學機構(gòu)Data61項目首席研究員兼高級研究科學家Sushmita Ruj博士表示,新的數(shù)據(jù)去身份化方法有望進一步提高隱私水平,并保證個人私密數(shù)據(jù)得到嚴格保護。
Ruj博士提到,“在研究了多種隱私指標之后,研究小組決定采取一種統(tǒng)一的衡量方法,用于評估對特定數(shù)據(jù)成功進行身份還原的風險水平。”
“PIF一直在探索新的方法,考慮如何消除各類能夠?qū)崿F(xiàn)身份還原的攻擊方法,并據(jù)此對不同數(shù)據(jù)集采用量身定制的保護手段。以此為基礎(chǔ),該工具將為各個數(shù)據(jù)集做出一項PIF評分?!?/p>
如果PIF高于所需的閾值,則程序?qū)⑻岢鋈绾翁岣呖蚣馨踩?、證明數(shù)據(jù)集可以安全公開發(fā)布的相關(guān)建議。
澳大利亞網(wǎng)絡(luò)安全合作研究中心研究主任Helge Janicke教授表示,最重要的目標是在信息共享需求與保護隱私之間找到平衡點。Janicke教授提到,“在PIF的幫助下,各方可以充分了解風險水平,這無疑補充了相關(guān)工具領(lǐng)域的空白?!?/p>
“數(shù)據(jù)分析已經(jīng)成為一項廣為人知的技術(shù)方案,但我們以往很難把握共享輸出結(jié)果的具體質(zhì)量。正因為如此,PIF在根據(jù)指標評估關(guān)鍵數(shù)據(jù)共享行為的道德保障與負責任水平方面,發(fā)揮著極為重要的作用。借助這項技術(shù),數(shù)據(jù)所有者可以全面評估與數(shù)據(jù)共享相關(guān)的風險與后續(xù)影響。”
PIF工具還可用于檢查其他有待發(fā)布的數(shù)據(jù)集,比如在COVID-19社交隔離期間收集到的家庭暴力數(shù)據(jù)與公共交通工具使用數(shù)據(jù)。CSIRO Data61與CSCRC將繼續(xù)開發(fā)PIF工具,并規(guī)劃在2022年6月之前進入外部推廣階段。