2020年4月9日,中共中央、國務院發(fā)布《中共中央國務院關(guān)于構(gòu)建更加完善的要素市場化配置體制機制的意見》,提出“土地、勞動力、資本、技術(shù)和數(shù)據(jù)”五個要素領(lǐng)域改革方向,明確數(shù)據(jù)已經(jīng)成為新的生產(chǎn)要素,參與到社會生產(chǎn)生活各環(huán)節(jié)。數(shù)據(jù)通過動態(tài)流動創(chuàng)造價值、提高政府治理能力,同時也面臨數(shù)據(jù)竊取、數(shù)據(jù)泄露、個人隱私安全等問題。為了保障作為生產(chǎn)要素的數(shù)據(jù)安全,需要正確理解認識數(shù)據(jù)特性,把握數(shù)據(jù)安全特點,建設(shè)以數(shù)據(jù)為中心的安全保障體系,切實保障數(shù)據(jù)參與生產(chǎn)過程各環(huán)節(jié)安全。
一、概述
1.數(shù)據(jù)特性
在大數(shù)據(jù)時代,數(shù)據(jù)參與社會生產(chǎn)過程,實現(xiàn)價值增值,是一種新型生產(chǎn)要素,具有以下特性:
?。?)增值性。在大數(shù)據(jù)時代,數(shù)據(jù)可以通過分析挖掘等手段產(chǎn)生新的數(shù)據(jù),挖掘新的信息和情報,生成新的數(shù)據(jù)產(chǎn)品,形成新的數(shù)據(jù)業(yè)務,實現(xiàn)價值的增加。
(2)流動性。數(shù)據(jù)作為新型生產(chǎn)要素參與社會生產(chǎn)過程,需要從一個系統(tǒng)流動到另一個系統(tǒng),從一個網(wǎng)絡(luò)區(qū)域流動到另一個網(wǎng)絡(luò)區(qū)域,從一個組織流動到另一個組織。數(shù)據(jù)流動是實現(xiàn)價值增值的前提和基礎(chǔ)。
?。?)復雜的權(quán)屬性。在大數(shù)據(jù)時代,除了數(shù)據(jù)擁有者,還有數(shù)據(jù)主體、數(shù)據(jù)提供者和數(shù)據(jù)消費者等角色,不同角色擁有數(shù)據(jù)的不同權(quán)益,如數(shù)據(jù)主體對數(shù)據(jù)擁有訪問權(quán)、更正權(quán)和遺忘權(quán)等。
2.數(shù)據(jù)安全特點
由于數(shù)據(jù)具有增值性、流動性和復雜的權(quán)屬性等特性,在數(shù)據(jù)安全保護方面具有以下特點:
?。?)嚴格的合規(guī)要求。國內(nèi)外新增了一系列數(shù)據(jù)安全保護法律法規(guī)和標準規(guī)范,針對數(shù)據(jù)安全保護提出嚴格要求。如歐盟的《通用數(shù)據(jù)保護條例》,我國的《網(wǎng)絡(luò)安全法》《數(shù)據(jù)安全法(草案)》和《信息安全技術(shù) 個人信息安全規(guī)范》(GB/T 35273-2017)等。同時,保護范圍覆蓋全面,涵蓋數(shù)據(jù)采集、存儲、使用、發(fā)布、共享、離境等全生命周期和用戶權(quán)利保護等內(nèi)容。
?。?)開放的應用環(huán)境。作為生產(chǎn)要素的數(shù)據(jù),為了實現(xiàn)增值目標,需要通過API接口與第三方系統(tǒng)交換共享數(shù)據(jù),增加了數(shù)據(jù)暴露面,相對處于更加開放的環(huán)境。
?。?)復雜的應用場景。數(shù)據(jù)在參與生產(chǎn)過程中,存在數(shù)據(jù)在組織內(nèi)部進行匯聚融合、向監(jiān)管單位提供數(shù)據(jù)、與第三方交換共享數(shù)據(jù)、數(shù)據(jù)服務外包、數(shù)據(jù)跨境傳輸?shù)葢脠鼍?,不同的應用場景可能帶來新的安全風險,增加了數(shù)據(jù)安全保護的難度。
(4)多維的關(guān)聯(lián)分析。不同來源、不同類別的數(shù)據(jù)匯聚融合后,可以從多個維度對數(shù)據(jù)進行關(guān)聯(lián)分析,產(chǎn)生新的、更有價值的數(shù)據(jù)。這些新產(chǎn)生的數(shù)據(jù)在帶來新的價值的同時,也可能產(chǎn)生未知安全風險,如泄露個人隱私、組織秘密和國家機密等。
二、數(shù)據(jù)安全保護面臨的問題
根據(jù)數(shù)據(jù)安全具有的特點,從認知觀念、標準規(guī)范和生產(chǎn)過程等方面對數(shù)據(jù)安全保護面臨的問題進行分析。
1.對數(shù)據(jù)安全的認知觀念存在誤區(qū)
目前,對數(shù)據(jù)安全的認知存在誤區(qū),主要體現(xiàn)在以下幾個方面:(1)數(shù)據(jù)安全保護理念落后。認為傳統(tǒng)的信息安全保障思路仍然能夠解決目前數(shù)據(jù)安全遇到的問題,忽視了數(shù)據(jù)是新型生產(chǎn)要素,沒有把握住數(shù)據(jù)動態(tài)流動等特點,缺乏以數(shù)據(jù)為中心的安全保護理念。(2)窄化數(shù)據(jù)安全保護目標。認為數(shù)據(jù)安全保護就是保障數(shù)據(jù)機密性、完整性和可用性,忽視了數(shù)據(jù)具有權(quán)屬性,保護數(shù)據(jù)相關(guān)角色的權(quán)益也是數(shù)據(jù)安全保護的目標之一。(3)簡化數(shù)據(jù)安全保護手段。認為數(shù)據(jù)安全保護就是區(qū)域邊界防護,只需在區(qū)域邊界采取身份鑒別、訪問控制、安全審計等技術(shù)手段,忽視了數(shù)據(jù)具有流動性,在流動過程中更需要通過數(shù)據(jù)脫敏、數(shù)據(jù)溯源分析、數(shù)據(jù)安全持續(xù)風險監(jiān)測等技術(shù)手段。
2.數(shù)據(jù)安全相關(guān)的標準規(guī)范不健全
由于數(shù)據(jù)安全事件頻發(fā),為了控制數(shù)據(jù)安全風險,保護個人的合法權(quán)益,維護國家安全,我國十分重視數(shù)據(jù)安全立法工作。在《網(wǎng)絡(luò)安全法》中提出了“國家鼓勵開發(fā)網(wǎng)絡(luò)數(shù)據(jù)安全保護和利用技術(shù)”“防止網(wǎng)絡(luò)數(shù)據(jù)泄露或被竊取、篡改”等要求;在《數(shù)據(jù)安全法(草案)》中提出了“國家對數(shù)據(jù)實行分級分類保護”“開展數(shù)據(jù)活動必須履行數(shù)據(jù)安全保護義務,承擔社會責任”等,具體包括建立健全數(shù)據(jù)安全治理體系,建立數(shù)據(jù)安全風險評估、數(shù)據(jù)安全應急處置機制,建立數(shù)據(jù)安全審查等數(shù)據(jù)安全管理制度,實現(xiàn)數(shù)據(jù)自由安全流動。在《全球數(shù)據(jù)安全倡議》中呼吁各國秉持發(fā)展和安全并重的原則,平衡處理技術(shù)進步、經(jīng)濟發(fā)展與保護國家安全和社會公共利益的關(guān)系。但是,目前缺乏與《數(shù)據(jù)安全法(草案)》《全球數(shù)據(jù)安全倡議》等配套的實施細則與標準規(guī)范,數(shù)據(jù)安全保護工作難以達到預期效果。
3.數(shù)據(jù)參與生產(chǎn)過程帶來安全風險
由于數(shù)據(jù)具有流動性等特性,數(shù)據(jù)安全具有嚴格的合規(guī)要求、開放的應用環(huán)境和復雜的應用場景等特點,數(shù)據(jù)在存儲訪問、分析挖掘、開放共享、交易流通和數(shù)據(jù)產(chǎn)品使用等生產(chǎn)過程中存在一定的安全風險。
?。?)存儲訪問過程安全風險
由于數(shù)據(jù)具有海量規(guī)模,存儲數(shù)據(jù)的平臺以分布式大數(shù)據(jù)系統(tǒng)為主。當前,建設(shè)大數(shù)據(jù)系統(tǒng)主要采用基于開源產(chǎn)品搭建、開源產(chǎn)品二次封裝、采購國外產(chǎn)品等方式。以上三種模式的核心還是離不開開源產(chǎn)品和國外產(chǎn)品,關(guān)鍵技術(shù)不能安全可控,數(shù)據(jù)在存儲和訪問過程中面臨數(shù)據(jù)泄露風險。根據(jù)國家漏洞庫(CNNVD)統(tǒng)計數(shù)據(jù)顯示,截至今年9月底,Hadoop存在權(quán)限控制、輸入驗證、目錄遍歷、信息泄露等27個漏洞,Spark存在權(quán)限控制、跨站腳本等45個漏洞,MongoDB存在訪問控制等26個漏洞。因安全漏洞導致大量數(shù)據(jù)丟失和數(shù)據(jù)泄露,如2019年5月,MongoDB因安全漏洞導致超過1.2萬個數(shù)據(jù)庫被攻擊者刪除。2020年9月,微軟的Elasticsearch數(shù)據(jù)庫因存在身份認證缺陷,數(shù)據(jù)庫直接暴露在互聯(lián)網(wǎng)上,導致1億多條數(shù)據(jù)泄露。
?。?)分析挖掘過程安全風險
在分析挖掘過程中存在以下安全問題:1)泄露用戶隱私信息。通過知識挖掘、機器學習、人工智能等技術(shù),將過去分離的信息進行關(guān)聯(lián)、碰撞和整合,可以重新刻畫用戶的興趣愛好、政治傾向和人格特征等,使原始數(shù)據(jù)中被隱藏的信息再次顯現(xiàn)出來,甚至分析挖掘后得到的信息遠遠大于原始數(shù)據(jù)所擁有的信息;2)人工智能技術(shù)帶來數(shù)據(jù)安全問題。因人工智能學習框架和組件存在安全漏洞,導致訓練數(shù)據(jù)存在竊取和泄露風險。某安全團隊在一個月的時間里發(fā)現(xiàn)了數(shù)十個深度學習框架及其依賴庫存在內(nèi)存訪問越界、空指針引用、整數(shù)溢出、除零異常等漏洞,使深度學習應用存在數(shù)據(jù)泄露、數(shù)據(jù)污染等安全風險。3)數(shù)據(jù)濫用。數(shù)據(jù)分析人員在開展業(yè)務的過程中,沒有嚴格按照業(yè)務目標和業(yè)務要求進行數(shù)據(jù)分析和挖掘,基于授權(quán)的數(shù)據(jù)進行違規(guī)操作,開展與業(yè)務目標不相關(guān)的分析挖掘,導致用戶隱私泄露。如某電子商務網(wǎng)站要求基于用戶的購買歷史數(shù)據(jù)和查看商品記錄預測用戶感興趣的商品,業(yè)務目標是對用戶可能購買的商品進行自動推薦。但是,數(shù)據(jù)分析員可以基于這些數(shù)據(jù)對用戶的職業(yè)、興趣愛好等進行分析,導致用戶隱私泄漏。4)侵犯數(shù)據(jù)主體權(quán)益。按照《數(shù)據(jù)安全法(草案)》等要求,需要采取特定技術(shù)手段對數(shù)據(jù)主體提供訪問權(quán)、控制權(quán)、更正權(quán)等權(quán)益保護,使數(shù)據(jù)主體能夠及時了解、掌握自身數(shù)據(jù)參與數(shù)據(jù)分析挖掘的業(yè)務過程和參與程度。如數(shù)據(jù)在做某種用途的分析時,數(shù)據(jù)主體提出異議,需要能立即把相關(guān)數(shù)據(jù)從分析作業(yè)中刪除。但是,目前并沒有相應的生產(chǎn)流程和技術(shù)系統(tǒng)能夠滿足數(shù)據(jù)主體權(quán)益保護要求。5)產(chǎn)生不可預知的安全風險。大數(shù)據(jù)分析是一把雙刃劍,分析結(jié)果除了能夠?qū)崿F(xiàn)正常的業(yè)務目標外,還可能產(chǎn)生其他難以預料的結(jié)果。如2016年劍橋分析事件,通過調(diào)查問卷收集美國選民所關(guān)注的問題,對這些數(shù)據(jù)進行分析后居然能夠得知每個選民的政治傾向,然后投放有針對性的廣告來引導他們的投票結(jié)果,最終達到干擾政治選舉的目的。
?。?)開放共享過程安全風險
首先,由于海量數(shù)據(jù)治理困難,以及對分析過程中新產(chǎn)生的數(shù)據(jù)很難及時制定開放共享策略,使開放共享過程中存在不合規(guī)的開放和共享,導致數(shù)據(jù)泄漏。其次,在共享過程中,數(shù)據(jù)已經(jīng)脫離所有者的控制,數(shù)據(jù)追蹤溯源技術(shù)并不成熟,無法跟蹤數(shù)據(jù)的最終去向和使用情況,使數(shù)據(jù)處于失控狀態(tài)。再次,由于數(shù)據(jù)脫敏技術(shù)不成熟,脫敏后的數(shù)據(jù)會改變數(shù)據(jù)間原有的關(guān)系,降低數(shù)據(jù)價值。部分組織為了實現(xiàn)數(shù)據(jù)價值最大化,在未脫敏或脫敏不夠的情況下共享數(shù)據(jù),導致數(shù)據(jù)面臨泄露的安全風險。最后,由于數(shù)據(jù)融合技術(shù)的發(fā)展,不同來源、不同維度的數(shù)據(jù)經(jīng)過匯聚融合后,很可能把脫敏前的原始數(shù)據(jù)還原出來。
(4)交易流通過程安全風險
交易流通是數(shù)據(jù)價值體現(xiàn)的基本途徑,更是盤活數(shù)據(jù)、用好數(shù)據(jù)的關(guān)鍵環(huán)節(jié)。目前,典型的數(shù)據(jù)交易模式是代理商模式,由數(shù)據(jù)提供者、數(shù)據(jù)代理商(中介)和數(shù)據(jù)消費者等三個角色組成。數(shù)據(jù)提供者擁有數(shù)據(jù)資源,把數(shù)據(jù)賣給數(shù)據(jù)代理商。數(shù)據(jù)代理商既可以把交易的原始數(shù)據(jù)賣給數(shù)據(jù)消費者,又可以把基于原始數(shù)據(jù)進行挖掘分析得到價值更高的分析結(jié)果數(shù)據(jù)賣給數(shù)據(jù)消費者。在數(shù)據(jù)交易流通過程中,一方面,數(shù)據(jù)提供者主要通過爬蟲等技術(shù)采集數(shù)據(jù),可能侵犯用戶個人隱私。2019年9月,魔蝎科技和同盾科技等多家第三方大數(shù)據(jù)公司因非法采集和向金融機構(gòu)提供用戶數(shù)據(jù),侵犯用戶個人隱私而被公安機關(guān)調(diào)查。另一方面,數(shù)據(jù)已經(jīng)脫離數(shù)據(jù)擁有者的掌控,數(shù)據(jù)代理商取代數(shù)據(jù)擁有者,成為數(shù)據(jù)的掌控者。因此,數(shù)據(jù)代理商等第三方的數(shù)據(jù)安全防護能力和安全管理力度決定數(shù)據(jù)的安全性。根據(jù)美國銀行信用卡發(fā)行商TCM Bank公開消息,由于第三方供應商管理的網(wǎng)站存在配置錯誤問題,導致信用卡申請人數(shù)據(jù)在2017年3月至2018年7月期間暴露在互聯(lián)網(wǎng)上長達16個月。
?。?)數(shù)據(jù)產(chǎn)品使用過程安全風險
目前,隨著信息系統(tǒng)整合共享等一系列舉措的實施和推進,海量數(shù)據(jù)資源進一步共享和匯聚,為數(shù)據(jù)產(chǎn)品的開發(fā)打好了堅實的基礎(chǔ),數(shù)據(jù)的下一站即是數(shù)據(jù)應用——數(shù)據(jù)產(chǎn)品。但是,數(shù)據(jù)產(chǎn)品可能給個人、組織和國家?guī)戆踩L險。一方面,由于數(shù)據(jù)產(chǎn)品是基于用戶個人信息或者其它社會數(shù)據(jù)等開發(fā)出來的,目前既缺乏相關(guān)法律法規(guī)和標準規(guī)范對數(shù)據(jù)產(chǎn)品的開發(fā)進行指導和約束,又缺乏數(shù)據(jù)產(chǎn)品相關(guān)的檢測評估機構(gòu)和檢測技術(shù)手段,在數(shù)據(jù)產(chǎn)品上市交易前沒辦法對其可能帶來的安全風險進行評估。另一方面,由于數(shù)據(jù)產(chǎn)品作為商品在交易過程中存在再次轉(zhuǎn)手交易的情況,以及數(shù)據(jù)產(chǎn)品具有易復制、修改等特點,使數(shù)據(jù)產(chǎn)品在使用、流通過程中面臨被非法復制、非法傳播、非法篡改和知識產(chǎn)權(quán)竊取等安全風險。
三、建議
針對數(shù)據(jù)安全保護存在的問題,需要結(jié)合數(shù)據(jù)安全特點,提高對數(shù)據(jù)安全的理解認識,完善數(shù)據(jù)安全標準規(guī)范,建設(shè)以數(shù)據(jù)為中心的安全保障體系。
1.正確理解認識數(shù)據(jù)安全保護
一方面,需要把握數(shù)據(jù)的本質(zhì)特征。數(shù)據(jù)不僅是資產(chǎn),更是一種生產(chǎn)要素,通過對數(shù)據(jù)進行分析挖掘,能夠產(chǎn)生新的數(shù)據(jù),得到新的數(shù)據(jù)產(chǎn)品。通過共享和交易,數(shù)據(jù)在碰撞、關(guān)聯(lián)和比對等過程中能夠最大化數(shù)據(jù)的價值。而數(shù)據(jù)在分析挖掘、共享交易等動態(tài)流轉(zhuǎn)過程中,更容易面臨隱私泄漏、數(shù)據(jù)竊取、數(shù)據(jù)誤用和濫用等安全風險。另一方面,需要轉(zhuǎn)變數(shù)據(jù)安全保護理念。數(shù)據(jù)使用場景多而復雜,應用環(huán)境開放,傳統(tǒng)的安全防護措施難以適應新的應用場景。需要結(jié)合數(shù)據(jù)安全具有的新特點,以數(shù)據(jù)為核心,以生產(chǎn)過程中用戶對數(shù)據(jù)的操作、訪問行為和被訪問的數(shù)據(jù)為分析對象,建立風險控制模型,對數(shù)據(jù)的流向、數(shù)據(jù)訪問頻次和數(shù)據(jù)體量等持續(xù)進行安全風險監(jiān)測,實現(xiàn)數(shù)據(jù)安全、自由流動。
2.加快完善數(shù)據(jù)安全標準規(guī)范
一方面,在全球?qū)用嫘枰y(tǒng)籌制定全球數(shù)據(jù)安全標準規(guī)范。依據(jù)《全球數(shù)據(jù)安全倡議》提出的原則和內(nèi)容,聯(lián)合世界其他國家簽訂雙邊或多邊承諾協(xié)議,在普遍參與的基礎(chǔ)上達成國際共識,制定相關(guān)標準規(guī)范。另一方面,在國家層面需要制定與數(shù)據(jù)安全法等配套的標準規(guī)范與實施細則。需要以《數(shù)據(jù)安全法(草案)》為指導,統(tǒng)籌考慮現(xiàn)有數(shù)據(jù)安全標準,查漏補缺。組織數(shù)據(jù)提供者、數(shù)據(jù)代理商(中介)和數(shù)據(jù)消費者等數(shù)據(jù)參與單位,規(guī)劃涵蓋數(shù)據(jù)生產(chǎn)全生命周期的安全標準體系,加快研制數(shù)據(jù)安全風險評估、數(shù)據(jù)安全審計和數(shù)據(jù)安全應急響應等重點標準,支撐《數(shù)據(jù)安全法(草案)》的落地與實施。
3.建設(shè)以數(shù)據(jù)為中心的安全保障體系
針對數(shù)據(jù)安全面臨的問題,需要構(gòu)建以數(shù)據(jù)為中心的動態(tài)安全防控體系,通過數(shù)據(jù)治理、安全防護措施、風險識別和審計溯源等手段重點識別和控制數(shù)據(jù)訪問、應用和流轉(zhuǎn)等動態(tài)過程中的安全風險。第一、數(shù)據(jù)治理。通過大數(shù)據(jù)治理實現(xiàn)數(shù)據(jù)分類分級、數(shù)據(jù)溯源,能夠從全域的角度“看得見、看得清”所有的數(shù)據(jù),包括數(shù)據(jù)存儲、使用流轉(zhuǎn)情況和對應的數(shù)據(jù)安全策略。掌握數(shù)據(jù)流動情況,包括表與表之間的流動、系統(tǒng)之間的流動、部門之間的流動、單位之間的流動等等;第二、部署安全防護措施。在大數(shù)據(jù)基礎(chǔ)設(shè)施、數(shù)據(jù)挖掘分析和共享交易等方面采取安全防護措施,保障數(shù)據(jù)安全;第三、主動識別和控制風險。通過收集基礎(chǔ)設(shè)施、用戶操作、數(shù)據(jù)流轉(zhuǎn)等方面的日志數(shù)據(jù),重點識別用戶對數(shù)據(jù)的異常操作風險和數(shù)據(jù)的異常流動風險;第四、安全審計與溯源分析。通過細粒度的數(shù)據(jù)行為審計與溯源能力建設(shè),形成事后可審計、可溯源、可追責的威懾體系。
(本文刊登于《中國信息安全》雜志2020年第11期)