《電子技術(shù)應用》
您所在的位置:首頁 > 通信與網(wǎng)絡(luò) > 設(shè)計應用 > 電力大數(shù)據(jù)應用建設(shè)中的重要數(shù)據(jù)保護
電力大數(shù)據(jù)應用建設(shè)中的重要數(shù)據(jù)保護
2018智能電網(wǎng)增刊
黃凌宇1,叢中方1,趙 城2,葉紅星2,張豹鋒2
1. 山東文登抽水蓄能有限公司,山東 威海264200;2. 北京易用視點科技有限公司,北京100144
摘要: 針對大數(shù)據(jù)技術(shù)在電力行業(yè)應用發(fā)展過程中面臨的業(yè)務數(shù)據(jù)安全問題,遵循數(shù)據(jù)脫敏規(guī)則,提出了一種電力大數(shù)據(jù)應用建設(shè)中不同應用場景、不同數(shù)據(jù)類型的重要數(shù)據(jù)分類分級方法及多層次安全等級策略,自適應于電力大數(shù)據(jù)應用場景不同屬性的數(shù)據(jù)脫敏,該方法獲得的劃分結(jié)果相比傳統(tǒng)方法,更符合電力大數(shù)據(jù)應用建設(shè)價值,對重要數(shù)據(jù)的精準定位和保護效果更好。
中圖分類號: TM76
文獻標識碼: A
DOI:10.16157/j.issn.0258-7998.2018.S1.032
Abstract:
Key words :

0  引言

    數(shù)據(jù)安全是信息安全的關(guān)鍵環(huán)節(jié)。在當今大數(shù)據(jù)技術(shù)和互聯(lián)網(wǎng)飛速發(fā)展的時代,數(shù)據(jù)是推動國家經(jīng)濟與社會發(fā)展的重要戰(zhàn)略資源。在電力行業(yè)領(lǐng)域,隨著信息技術(shù)的深入應用,尤其是用電采集、SCADA等系統(tǒng)的應用,業(yè)務數(shù)據(jù)量呈爆炸式增長,數(shù)據(jù)中蘊藏的巨大商業(yè)價值被逐步挖掘出來,同時也帶來了巨大的安全挑戰(zhàn)——個人隱私信息的保護。2017年6月,《中華人民共和國網(wǎng)絡(luò)安全法》正式實施,其中對個人信息的保護做了明確規(guī)定,網(wǎng)絡(luò)運營者應當采取技術(shù)措施和其他必要措施,確保其收集的個人信息安全,防止信息泄露、毀損、丟失。

    由于非線性數(shù)據(jù)量巨大,數(shù)據(jù)關(guān)系錯綜復雜,傳統(tǒng)的安全手段難以提供完善的保障,攻擊者可通過大數(shù)據(jù)技術(shù)還原信息、竊取隱私。因此,針對大數(shù)據(jù)應用建設(shè)過程中的安全問題,根據(jù)實際情況制定特有的數(shù)據(jù)脫敏規(guī)則加以保障,對提高電力大數(shù)據(jù)安全應用具有重要意義。

1  電力大數(shù)據(jù)脫敏策略研究

    電力大數(shù)據(jù)的應用場景主要有重過載預測、日用電負荷預測、設(shè)備事故關(guān)聯(lián)分析、精準客戶服務、業(yè)務工單分析等,涉及用戶數(shù)據(jù)、工單數(shù)據(jù)、流程數(shù)據(jù)、用電數(shù)據(jù)、設(shè)備數(shù)據(jù)等。為了保護客戶隱私數(shù)據(jù),提高電力信息安全,需要對重要數(shù)據(jù)進行脫敏。

    數(shù)據(jù)脫敏又叫數(shù)據(jù)漂白或者數(shù)據(jù)去隱私化,通過一定的規(guī)則,對某些重要信息進行數(shù)據(jù)的變形,以實現(xiàn)對重要隱私數(shù)據(jù)的可靠保護。比如個人身份識別數(shù)據(jù)(personal identifiable data)、個人重要數(shù)據(jù)(personal sensitive data)和商業(yè)重要數(shù)據(jù)等,必須經(jīng)過脫敏后才能使用,尤其是在大數(shù)據(jù)應用的開發(fā)測試階段。經(jīng)過數(shù)據(jù)脫敏后的數(shù)據(jù),就可以在規(guī)定的授權(quán)環(huán)境中使用。

    在電力行業(yè)中,重要數(shù)據(jù)主要包括兩方面,一是工作中各業(yè)務系統(tǒng)的運行數(shù)據(jù),包括內(nèi)部郵件、組織架構(gòu)、業(yè)務流程數(shù)據(jù)、各類工單數(shù)據(jù)、現(xiàn)場工作票數(shù)據(jù)、各類電表儀器實時量測數(shù)據(jù)等;二是客戶的個人信息,包括個人客戶的姓名、性別、年齡、住址、手機號、身份證號、銀行賬號等,單位客戶的名稱、地址、行業(yè)等。

    本文通過研究一種自適用于電力大數(shù)據(jù)應用的數(shù)據(jù)脫敏手段,自適應于電力大數(shù)據(jù)場景中的數(shù)據(jù)脫敏分類,精準定位電力業(yè)務重要數(shù)據(jù),從而實現(xiàn)電力業(yè)務數(shù)據(jù)的多層次安全防護。

2  重點內(nèi)容及創(chuàng)新點

    電力大數(shù)據(jù)脫敏的最大難點在于電力大數(shù)據(jù)不同業(yè)務場景下的數(shù)據(jù)安全(隱私保護)和數(shù)據(jù)信息價值兩者之間的平衡,因此,電力大數(shù)據(jù)應用建設(shè)中的重要數(shù)據(jù)保護需要在保護數(shù)據(jù)安全的基礎(chǔ)上更好地展現(xiàn)大數(shù)據(jù)的業(yè)務應用價值,從而為電力事業(yè)提供更高水平的服務。

2.1  脫敏規(guī)則遵循原則

    (1)數(shù)據(jù)可用性需求:要求脫敏后的數(shù)據(jù)能夠滿足各業(yè)務部門的大數(shù)據(jù)應用需求。如分析用戶用電習慣,需要保留完整戶號信息、用戶電量信息,戶號作為用戶在電力系統(tǒng)里的唯一標記,可在電力系統(tǒng)里作為基礎(chǔ)查詢標識。而用戶姓名、性別、地址、聯(lián)系方式可以隱私數(shù)據(jù)可以脫敏展示。

    (2)數(shù)據(jù)的邏輯關(guān)聯(lián):為滿足大數(shù)據(jù)的分析邏輯特征、統(tǒng)計分布特征,對于復雜的業(yè)務,需要保留各種數(shù)據(jù)之間的關(guān)聯(lián)性。如工單數(shù)據(jù)分析,需要保留工單信息、客戶信息、內(nèi)部流程信息等數(shù)據(jù)之間的關(guān)聯(lián)性。

    (3)數(shù)據(jù)可重現(xiàn)性:采用相同規(guī)則和參數(shù)配置,相同源數(shù)據(jù)脫敏后的數(shù)據(jù)必須保持一致。

    (4)脫敏規(guī)則可配置:可以結(jié)合應用需求和隱私保護的需要,動態(tài)配置脫敏規(guī)則及相關(guān)處理方法,從而滿足各種不同業(yè)務應用的需要。

2.2  數(shù)據(jù)脫敏分類分級方法

    在電力行業(yè)的大數(shù)據(jù)應用建設(shè)過程中,因為數(shù)據(jù)的多樣性以及生產(chǎn)、營銷等應用各自的分析側(cè)重點不同,對數(shù)據(jù)脫敏細分提出了更高要求。基于電力大數(shù)據(jù)場景數(shù)據(jù)安全(隱私保護)和數(shù)據(jù)信息價值的共同追求,遵循以上數(shù)據(jù)脫敏規(guī)則,結(jié)合電網(wǎng)業(yè)務數(shù)據(jù)的實際情況,根據(jù)不同的應用場景,按用戶編號、客戶姓名、電話號碼、用電地址、身份證號等不同類別進行數(shù)據(jù)脫敏,并將數(shù)據(jù)脫敏工作按不同的數(shù)據(jù)類型分為三個等級,從一級到三級安全等級依次降低,從而實現(xiàn)了基于多層次安全等級防護的電力大數(shù)據(jù)應用建設(shè)。

    下面就用戶編號、客戶姓名、電話號碼、用電地址、身份證號等不同類別數(shù)據(jù)進行等級劃分,具體舉例說明:

hly-b1.gif

hly-b2.gif

hly-b3.gif

hly-b4.gif

2.3  建立電力大數(shù)據(jù)脫敏管理平臺

    電力大數(shù)據(jù)脫敏管理平臺及應用架構(gòu)分別如圖1、圖2所示。

hly-t1.gif

hly-t2.gif

    根據(jù)數(shù)據(jù)脫敏的規(guī)則以及本文提出的分類分級脫敏的設(shè)定,設(shè)計適用于電力大數(shù)據(jù)的數(shù)據(jù)脫敏機制:

    (1)源數(shù)據(jù)層:電力大數(shù)據(jù)來源于電力系統(tǒng)內(nèi)部各系統(tǒng)的數(shù)據(jù),主要包括用戶數(shù)據(jù)、工單數(shù)據(jù)、流程數(shù)據(jù)、用電數(shù)據(jù)、設(shè)備數(shù)據(jù)等。

    (2)脫敏處理:根據(jù)脫敏規(guī)則選取相應的脫敏算法,將原始數(shù)據(jù)進行拆分和脫敏存儲,并遵循設(shè)定的分級脫敏規(guī)則,對于重要數(shù)據(jù)進行分級脫敏并分別存儲,形成數(shù)據(jù)中間庫。

    (3)脫敏中間庫存儲:中間庫重要數(shù)據(jù)采用單獨字段分級脫敏存儲,保證數(shù)據(jù)存儲的安全性。同時中間庫的應用也有助于提高系統(tǒng)的工作效率。

    (4)脫敏數(shù)據(jù)服務:根據(jù)應用場景需求分析所要展示的數(shù)據(jù)及數(shù)據(jù)之間的關(guān)聯(lián)特性,并分析數(shù)據(jù)是否需要脫敏,自動識別脫敏的級別,從中間庫提取相關(guān)數(shù)據(jù)。如張三豐->張先生->張**->張*,某某某指揮部-> ***。系統(tǒng)同時進行數(shù)據(jù)的校驗,符合數(shù)據(jù)安全規(guī)則的交由應用層進行相關(guān)展示。

    (5)電力大數(shù)據(jù)應用:根據(jù)各業(yè)務部門的需求,電力大數(shù)據(jù)的應用場景主要有業(yè)務工單分析、精準客戶服務、用電行為分析、設(shè)備故障管理分析、用電負荷預測。

    采用本文的數(shù)據(jù)脫敏機制,在保證數(shù)據(jù)安全的基礎(chǔ)上,根據(jù)數(shù)據(jù)重要度不同的分級制度能夠更好地滿足業(yè)務場景應用。如進行業(yè)務工單的重復致電分析,需要展示的數(shù)據(jù)是電話號碼、戶號、姓名、地址、致電次數(shù)、關(guān)聯(lián)工單等。采用本方法的分級脫敏規(guī)則,電話號碼作為展示主體,采用三級脫敏,保留主要特征。戶號作為系統(tǒng)唯一標記不脫敏。用戶姓名、身份證、地址信息采用二級脫敏,保證用戶隱私。即保證了大數(shù)據(jù)應用的直觀展示,同時業(yè)務部門在系統(tǒng)中有據(jù)可查、有效處理,又保護了用戶的隱私,避免了數(shù)據(jù)安全風險。

2.4  應用實例介紹

    以營銷服務工單熱詞分析場景為例,涉及的業(yè)務數(shù)據(jù)有全量工單數(shù)據(jù)、客戶基本信息數(shù)據(jù)、接入點信息數(shù)據(jù)、接入點計量表信息數(shù)據(jù)、計量表讀數(shù)數(shù)據(jù)、氣象數(shù)據(jù),這些原始數(shù)據(jù)有數(shù)據(jù)量大、數(shù)據(jù)形態(tài)多樣性等特點,具體情況如下表:

hly-b5.gif

hly-b6.gif

hly-b7.gif

3  結(jié)論

    數(shù)據(jù)脫敏是電力行業(yè)信息化應用中的一個環(huán)節(jié),現(xiàn)有的脫敏方法既要滿足大數(shù)據(jù)價值分析應用的需要,也要遵從整體信息安全治理的要求。本文研究了電力大數(shù)據(jù)典型應用場景下的數(shù)據(jù)脫敏分級分類方法,通過電力大數(shù)據(jù)脫敏管理平臺實現(xiàn)電力業(yè)務數(shù)據(jù)內(nèi)容、性質(zhì)及應用場景的自適應脫敏,分級分類脫敏,并對數(shù)據(jù)脫敏的框架提出建議及具體的脫敏執(zhí)行方案,在保護用戶隱私、保證數(shù)據(jù)安全的前提下,滿足各業(yè)務單位、數(shù)據(jù)歸口單位、科技信息等部門大數(shù)據(jù)成果應用需求。

參考文獻

[1] 張沛,楊華飛,許元斌.電力大數(shù)據(jù)及其在電網(wǎng)公司的應用[J].中國電機工程學報,2014,34(增刊):85-92.

[2] 彭小圣,鄧迪元,程時杰,等.面向智能電網(wǎng)應用的電力大數(shù)據(jù)關(guān)鍵技術(shù)[J].中國電機工程學報,2015,34(3):503-511.

[3] 張沛,和怡,張大海,等.電力大數(shù)據(jù)應用的判斷原則[J].電力建設(shè),2017,38(5):85-90. 

[4] Datamasker. Data masking:what you need to know[J].A Net 2000 Ltd.White Paper, 2016.

[5] CHOUDRY B. Masking the data on cloud[J].International Journal of Advances in Computing, 2012,1(04):388—390.

[6] CASTELLANOS M, Zhang BaimenezI,et al. Data desensitization of customer data for use in optimizer performance experiments[M].IEEE International Conference on Data Engineering, 2010:1081-1092.

[7] Gartner.Gartner 2014 Magic Quadrant Data Masking Report[R].2015.

[8] 王繼業(yè).智能電網(wǎng)大數(shù)據(jù)[M].北京:中國電力出版社.



作者信息:

黃凌宇1,叢中方1,趙  城2,葉紅星2,張豹鋒2

(1. 山東文登抽水蓄能有限公司,山東 威海264200;2. 北京易用視點科技有限公司,北京100144)

此內(nèi)容為AET網(wǎng)站原創(chuàng),未經(jīng)授權(quán)禁止轉(zhuǎn)載。