文獻(xiàn)標(biāo)識(shí)碼: A
DOI:10.16157/j.issn.0258-7998.2018.S1.032
0 引言
數(shù)據(jù)安全是信息安全的關(guān)鍵環(huán)節(jié)。在當(dāng)今大數(shù)據(jù)技術(shù)和互聯(lián)網(wǎng)飛速發(fā)展的時(shí)代,數(shù)據(jù)是推動(dòng)國(guó)家經(jīng)濟(jì)與社會(huì)發(fā)展的重要戰(zhàn)略資源。在電力行業(yè)領(lǐng)域,隨著信息技術(shù)的深入應(yīng)用,尤其是用電采集、SCADA等系統(tǒng)的應(yīng)用,業(yè)務(wù)數(shù)據(jù)量呈爆炸式增長(zhǎng),數(shù)據(jù)中蘊(yùn)藏的巨大商業(yè)價(jià)值被逐步挖掘出來(lái),同時(shí)也帶來(lái)了巨大的安全挑戰(zhàn)——個(gè)人隱私信息的保護(hù)。2017年6月,《中華人民共和國(guó)網(wǎng)絡(luò)安全法》正式實(shí)施,其中對(duì)個(gè)人信息的保護(hù)做了明確規(guī)定,網(wǎng)絡(luò)運(yùn)營(yíng)者應(yīng)當(dāng)采取技術(shù)措施和其他必要措施,確保其收集的個(gè)人信息安全,防止信息泄露、毀損、丟失。
由于非線性數(shù)據(jù)量巨大,數(shù)據(jù)關(guān)系錯(cuò)綜復(fù)雜,傳統(tǒng)的安全手段難以提供完善的保障,攻擊者可通過(guò)大數(shù)據(jù)技術(shù)還原信息、竊取隱私。因此,針對(duì)大數(shù)據(jù)應(yīng)用建設(shè)過(guò)程中的安全問(wèn)題,根據(jù)實(shí)際情況制定特有的數(shù)據(jù)脫敏規(guī)則加以保障,對(duì)提高電力大數(shù)據(jù)安全應(yīng)用具有重要意義。
1 電力大數(shù)據(jù)脫敏策略研究
電力大數(shù)據(jù)的應(yīng)用場(chǎng)景主要有重過(guò)載預(yù)測(cè)、日用電負(fù)荷預(yù)測(cè)、設(shè)備事故關(guān)聯(lián)分析、精準(zhǔn)客戶服務(wù)、業(yè)務(wù)工單分析等,涉及用戶數(shù)據(jù)、工單數(shù)據(jù)、流程數(shù)據(jù)、用電數(shù)據(jù)、設(shè)備數(shù)據(jù)等。為了保護(hù)客戶隱私數(shù)據(jù),提高電力信息安全,需要對(duì)重要數(shù)據(jù)進(jìn)行脫敏。
數(shù)據(jù)脫敏又叫數(shù)據(jù)漂白或者數(shù)據(jù)去隱私化,通過(guò)一定的規(guī)則,對(duì)某些重要信息進(jìn)行數(shù)據(jù)的變形,以實(shí)現(xiàn)對(duì)重要隱私數(shù)據(jù)的可靠保護(hù)。比如個(gè)人身份識(shí)別數(shù)據(jù)(personal identifiable data)、個(gè)人重要數(shù)據(jù)(personal sensitive data)和商業(yè)重要數(shù)據(jù)等,必須經(jīng)過(guò)脫敏后才能使用,尤其是在大數(shù)據(jù)應(yīng)用的開(kāi)發(fā)測(cè)試階段。經(jīng)過(guò)數(shù)據(jù)脫敏后的數(shù)據(jù),就可以在規(guī)定的授權(quán)環(huán)境中使用。
在電力行業(yè)中,重要數(shù)據(jù)主要包括兩方面,一是工作中各業(yè)務(wù)系統(tǒng)的運(yùn)行數(shù)據(jù),包括內(nèi)部郵件、組織架構(gòu)、業(yè)務(wù)流程數(shù)據(jù)、各類工單數(shù)據(jù)、現(xiàn)場(chǎng)工作票數(shù)據(jù)、各類電表儀器實(shí)時(shí)量測(cè)數(shù)據(jù)等;二是客戶的個(gè)人信息,包括個(gè)人客戶的姓名、性別、年齡、住址、手機(jī)號(hào)、身份證號(hào)、銀行賬號(hào)等,單位客戶的名稱、地址、行業(yè)等。
本文通過(guò)研究一種自適用于電力大數(shù)據(jù)應(yīng)用的數(shù)據(jù)脫敏手段,自適應(yīng)于電力大數(shù)據(jù)場(chǎng)景中的數(shù)據(jù)脫敏分類,精準(zhǔn)定位電力業(yè)務(wù)重要數(shù)據(jù),從而實(shí)現(xiàn)電力業(yè)務(wù)數(shù)據(jù)的多層次安全防護(hù)。
2 重點(diǎn)內(nèi)容及創(chuàng)新點(diǎn)
電力大數(shù)據(jù)脫敏的最大難點(diǎn)在于電力大數(shù)據(jù)不同業(yè)務(wù)場(chǎng)景下的數(shù)據(jù)安全(隱私保護(hù))和數(shù)據(jù)信息價(jià)值兩者之間的平衡,因此,電力大數(shù)據(jù)應(yīng)用建設(shè)中的重要數(shù)據(jù)保護(hù)需要在保護(hù)數(shù)據(jù)安全的基礎(chǔ)上更好地展現(xiàn)大數(shù)據(jù)的業(yè)務(wù)應(yīng)用價(jià)值,從而為電力事業(yè)提供更高水平的服務(wù)。
2.1 脫敏規(guī)則遵循原則
(1)數(shù)據(jù)可用性需求:要求脫敏后的數(shù)據(jù)能夠滿足各業(yè)務(wù)部門(mén)的大數(shù)據(jù)應(yīng)用需求。如分析用戶用電習(xí)慣,需要保留完整戶號(hào)信息、用戶電量信息,戶號(hào)作為用戶在電力系統(tǒng)里的唯一標(biāo)記,可在電力系統(tǒng)里作為基礎(chǔ)查詢標(biāo)識(shí)。而用戶姓名、性別、地址、聯(lián)系方式可以隱私數(shù)據(jù)可以脫敏展示。
(2)數(shù)據(jù)的邏輯關(guān)聯(lián):為滿足大數(shù)據(jù)的分析邏輯特征、統(tǒng)計(jì)分布特征,對(duì)于復(fù)雜的業(yè)務(wù),需要保留各種數(shù)據(jù)之間的關(guān)聯(lián)性。如工單數(shù)據(jù)分析,需要保留工單信息、客戶信息、內(nèi)部流程信息等數(shù)據(jù)之間的關(guān)聯(lián)性。
(3)數(shù)據(jù)可重現(xiàn)性:采用相同規(guī)則和參數(shù)配置,相同源數(shù)據(jù)脫敏后的數(shù)據(jù)必須保持一致。
(4)脫敏規(guī)則可配置:可以結(jié)合應(yīng)用需求和隱私保護(hù)的需要,動(dòng)態(tài)配置脫敏規(guī)則及相關(guān)處理方法,從而滿足各種不同業(yè)務(wù)應(yīng)用的需要。
2.2 數(shù)據(jù)脫敏分類分級(jí)方法
在電力行業(yè)的大數(shù)據(jù)應(yīng)用建設(shè)過(guò)程中,因?yàn)閿?shù)據(jù)的多樣性以及生產(chǎn)、營(yíng)銷等應(yīng)用各自的分析側(cè)重點(diǎn)不同,對(duì)數(shù)據(jù)脫敏細(xì)分提出了更高要求?;陔娏Υ髷?shù)據(jù)場(chǎng)景數(shù)據(jù)安全(隱私保護(hù))和數(shù)據(jù)信息價(jià)值的共同追求,遵循以上數(shù)據(jù)脫敏規(guī)則,結(jié)合電網(wǎng)業(yè)務(wù)數(shù)據(jù)的實(shí)際情況,根據(jù)不同的應(yīng)用場(chǎng)景,按用戶編號(hào)、客戶姓名、電話號(hào)碼、用電地址、身份證號(hào)等不同類別進(jìn)行數(shù)據(jù)脫敏,并將數(shù)據(jù)脫敏工作按不同的數(shù)據(jù)類型分為三個(gè)等級(jí),從一級(jí)到三級(jí)安全等級(jí)依次降低,從而實(shí)現(xiàn)了基于多層次安全等級(jí)防護(hù)的電力大數(shù)據(jù)應(yīng)用建設(shè)。
下面就用戶編號(hào)、客戶姓名、電話號(hào)碼、用電地址、身份證號(hào)等不同類別數(shù)據(jù)進(jìn)行等級(jí)劃分,具體舉例說(shuō)明:
2.3 建立電力大數(shù)據(jù)脫敏管理平臺(tái)
電力大數(shù)據(jù)脫敏管理平臺(tái)及應(yīng)用架構(gòu)分別如圖1、圖2所示。
根據(jù)數(shù)據(jù)脫敏的規(guī)則以及本文提出的分類分級(jí)脫敏的設(shè)定,設(shè)計(jì)適用于電力大數(shù)據(jù)的數(shù)據(jù)脫敏機(jī)制:
(1)源數(shù)據(jù)層:電力大數(shù)據(jù)來(lái)源于電力系統(tǒng)內(nèi)部各系統(tǒng)的數(shù)據(jù),主要包括用戶數(shù)據(jù)、工單數(shù)據(jù)、流程數(shù)據(jù)、用電數(shù)據(jù)、設(shè)備數(shù)據(jù)等。
(2)脫敏處理:根據(jù)脫敏規(guī)則選取相應(yīng)的脫敏算法,將原始數(shù)據(jù)進(jìn)行拆分和脫敏存儲(chǔ),并遵循設(shè)定的分級(jí)脫敏規(guī)則,對(duì)于重要數(shù)據(jù)進(jìn)行分級(jí)脫敏并分別存儲(chǔ),形成數(shù)據(jù)中間庫(kù)。
(3)脫敏中間庫(kù)存儲(chǔ):中間庫(kù)重要數(shù)據(jù)采用單獨(dú)字段分級(jí)脫敏存儲(chǔ),保證數(shù)據(jù)存儲(chǔ)的安全性。同時(shí)中間庫(kù)的應(yīng)用也有助于提高系統(tǒng)的工作效率。
(4)脫敏數(shù)據(jù)服務(wù):根據(jù)應(yīng)用場(chǎng)景需求分析所要展示的數(shù)據(jù)及數(shù)據(jù)之間的關(guān)聯(lián)特性,并分析數(shù)據(jù)是否需要脫敏,自動(dòng)識(shí)別脫敏的級(jí)別,從中間庫(kù)提取相關(guān)數(shù)據(jù)。如張三豐->張先生->張**->張*,某某某指揮部-> ***。系統(tǒng)同時(shí)進(jìn)行數(shù)據(jù)的校驗(yàn),符合數(shù)據(jù)安全規(guī)則的交由應(yīng)用層進(jìn)行相關(guān)展示。
(5)電力大數(shù)據(jù)應(yīng)用:根據(jù)各業(yè)務(wù)部門(mén)的需求,電力大數(shù)據(jù)的應(yīng)用場(chǎng)景主要有業(yè)務(wù)工單分析、精準(zhǔn)客戶服務(wù)、用電行為分析、設(shè)備故障管理分析、用電負(fù)荷預(yù)測(cè)。
采用本文的數(shù)據(jù)脫敏機(jī)制,在保證數(shù)據(jù)安全的基礎(chǔ)上,根據(jù)數(shù)據(jù)重要度不同的分級(jí)制度能夠更好地滿足業(yè)務(wù)場(chǎng)景應(yīng)用。如進(jìn)行業(yè)務(wù)工單的重復(fù)致電分析,需要展示的數(shù)據(jù)是電話號(hào)碼、戶號(hào)、姓名、地址、致電次數(shù)、關(guān)聯(lián)工單等。采用本方法的分級(jí)脫敏規(guī)則,電話號(hào)碼作為展示主體,采用三級(jí)脫敏,保留主要特征。戶號(hào)作為系統(tǒng)唯一標(biāo)記不脫敏。用戶姓名、身份證、地址信息采用二級(jí)脫敏,保證用戶隱私。即保證了大數(shù)據(jù)應(yīng)用的直觀展示,同時(shí)業(yè)務(wù)部門(mén)在系統(tǒng)中有據(jù)可查、有效處理,又保護(hù)了用戶的隱私,避免了數(shù)據(jù)安全風(fēng)險(xiǎn)。
2.4 應(yīng)用實(shí)例介紹
以營(yíng)銷服務(wù)工單熱詞分析場(chǎng)景為例,涉及的業(yè)務(wù)數(shù)據(jù)有全量工單數(shù)據(jù)、客戶基本信息數(shù)據(jù)、接入點(diǎn)信息數(shù)據(jù)、接入點(diǎn)計(jì)量表信息數(shù)據(jù)、計(jì)量表讀數(shù)數(shù)據(jù)、氣象數(shù)據(jù),這些原始數(shù)據(jù)有數(shù)據(jù)量大、數(shù)據(jù)形態(tài)多樣性等特點(diǎn),具體情況如下表:
3 結(jié)論
數(shù)據(jù)脫敏是電力行業(yè)信息化應(yīng)用中的一個(gè)環(huán)節(jié),現(xiàn)有的脫敏方法既要滿足大數(shù)據(jù)價(jià)值分析應(yīng)用的需要,也要遵從整體信息安全治理的要求。本文研究了電力大數(shù)據(jù)典型應(yīng)用場(chǎng)景下的數(shù)據(jù)脫敏分級(jí)分類方法,通過(guò)電力大數(shù)據(jù)脫敏管理平臺(tái)實(shí)現(xiàn)電力業(yè)務(wù)數(shù)據(jù)內(nèi)容、性質(zhì)及應(yīng)用場(chǎng)景的自適應(yīng)脫敏,分級(jí)分類脫敏,并對(duì)數(shù)據(jù)脫敏的框架提出建議及具體的脫敏執(zhí)行方案,在保護(hù)用戶隱私、保證數(shù)據(jù)安全的前提下,滿足各業(yè)務(wù)單位、數(shù)據(jù)歸口單位、科技信息等部門(mén)大數(shù)據(jù)成果應(yīng)用需求。
參考文獻(xiàn)
[1] 張沛,楊華飛,許元斌.電力大數(shù)據(jù)及其在電網(wǎng)公司的應(yīng)用[J].中國(guó)電機(jī)工程學(xué)報(bào),2014,34(增刊):85-92.
[2] 彭小圣,鄧迪元,程時(shí)杰,等.面向智能電網(wǎng)應(yīng)用的電力大數(shù)據(jù)關(guān)鍵技術(shù)[J].中國(guó)電機(jī)工程學(xué)報(bào),2015,34(3):503-511.
[3] 張沛,和怡,張大海,等.電力大數(shù)據(jù)應(yīng)用的判斷原則[J].電力建設(shè),2017,38(5):85-90.
[4] Datamasker. Data masking:what you need to know[J].A Net 2000 Ltd.White Paper, 2016.
[5] CHOUDRY B. Masking the data on cloud[J].International Journal of Advances in Computing, 2012,1(04):388—390.
[6] CASTELLANOS M, Zhang BaimenezI,et al. Data desensitization of customer data for use in optimizer performance experiments[M].IEEE International Conference on Data Engineering, 2010:1081-1092.
[7] Gartner.Gartner 2014 Magic Quadrant Data Masking Report[R].2015.
[8] 王繼業(yè).智能電網(wǎng)大數(shù)據(jù)[M].北京:中國(guó)電力出版社.
作者信息:
黃凌宇1,叢中方1,趙 城2,葉紅星2,張豹鋒2
(1. 山東文登抽水蓄能有限公司,山東 威海264200;2. 北京易用視點(diǎn)科技有限公司,北京100144)