123,123

数据仓库安全模型分析

日期： 2009-08-06

作者：王子高1, 马艳锋2

關(guān)鍵詞： 元数据访问控制多维面的控制策略

　　摘? 要： 對數(shù)據(jù)倉庫安全模型進行了分析，討論了現(xiàn)有的數(shù)據(jù)倉庫安全模型，并對數(shù)據(jù)倉庫安全模型的發(fā)展方向進行了展望。
　　關(guān)鍵詞： 數(shù)據(jù)倉庫? 數(shù)據(jù)倉庫安全? 安全模型

　　數(shù)據(jù)倉庫是在以事務(wù)處理為主要任務(wù)的數(shù)據(jù)庫基礎(chǔ)上發(fā)展起來的,但是它與數(shù)據(jù)庫有著根本的不同。數(shù)據(jù)倉庫的主要特征是面向主題的、集成的、與時間相關(guān)的、不可修改的數(shù)據(jù)集合[1]。數(shù)據(jù)倉庫是一種決策支持系統(tǒng),它主要是對企業(yè)決策提供強有力的支持,因此它的安全性更加重要。因為數(shù)據(jù)倉庫中數(shù)據(jù)的丟失將損害企業(yè)的決策,所以數(shù)據(jù)倉庫的安全性相對于數(shù)據(jù)庫來說更為重要。

　　近幾年來,雖然對數(shù)據(jù)倉庫的研究較多,但是控制對數(shù)據(jù)倉庫的訪問卻是一個正在發(fā)展的技術(shù)領(lǐng)域,對數(shù)據(jù)倉庫的安全控制方面的研究仍舊涉及很少。對數(shù)據(jù)倉庫的安全控制和對于傳統(tǒng)的操作型數(shù)據(jù)庫的安全控制是不同的。數(shù)據(jù)倉庫的控制有著更高的復(fù)雜性,原因主要在于數(shù)據(jù)倉庫的建立目的與限制對數(shù)據(jù)的訪問是矛盾的;數(shù)據(jù)倉庫中存在著不同粒度的數(shù)據(jù);數(shù)據(jù)倉庫中的數(shù)據(jù)是以多維的方式存在的。這些因素決定了數(shù)據(jù)倉庫安全的研究是一個復(fù)雜的領(lǐng)域。目前對于數(shù)據(jù)倉庫安全性的研究還比較少,國內(nèi)還處于起步階段,但是它卻有著極其重要的現(xiàn)實意義。本文主要是通過對幾個數(shù)據(jù)倉庫安全模型的研究,對數(shù)據(jù)倉庫安全性目前研究的主要內(nèi)容、現(xiàn)狀和發(fā)展趨勢進行了分析,并給出了一些模型的應(yīng)用實例。

1? 數(shù)據(jù)倉庫安全模型

　　一個好的安全模型是數(shù)據(jù)倉庫安全性的重要保障?，F(xiàn)存的許多數(shù)據(jù)倉庫在設(shè)計階段都沒有能夠很好地在數(shù)據(jù)倉庫的安全方面進行很好的設(shè)計,這使得在數(shù)據(jù)倉庫建成之后再添加關(guān)于安全方面的設(shè)計時成本大增,而且在數(shù)據(jù)倉庫建成之后再實施安全策略時也比較困難。因此在設(shè)計階段就設(shè)計好數(shù)據(jù)倉庫的安全模型對于構(gòu)建一個安全的數(shù)據(jù)倉庫有著極其重要的意義。本文主要分析了四種關(guān)于數(shù)據(jù)倉庫和OLAP的安全模型。

1.1 基于元數(shù)據(jù)的數(shù)據(jù)倉庫安全模型設(shè)計

　　元數(shù)據(jù)是描述數(shù)據(jù)倉庫內(nèi)數(shù)據(jù)的結(jié)構(gòu)和建立方法的數(shù)據(jù)。元數(shù)據(jù)是數(shù)據(jù)倉庫中很重要的一部分,它將會影響數(shù)據(jù)倉庫中所有的層次,常被開發(fā)者用來管理控制和開發(fā)數(shù)據(jù)倉庫。元數(shù)據(jù)也是用戶訪問數(shù)據(jù)倉庫的一部分,它常被用來控制訪問控制和分析數(shù)據(jù)。

　　通過對元數(shù)據(jù)的控制來加強數(shù)據(jù)倉庫的安全性,這種情況下與安全主題和客體相關(guān)的訪問規(guī)則被以元數(shù)據(jù)的形式存儲。當一個用戶訪問數(shù)據(jù)倉庫中的數(shù)據(jù)時,安全查詢機制層將會查詢這個訪問是否被允許。為了保證查詢的正確進行,可通過分析“安全元數(shù)據(jù)”來分析相應(yīng)的訪問許可機制。

　　N.Katic于1998年提出一個基于元數(shù)據(jù)的安全模型[2]。這是通過“安全管理者”的方式來實現(xiàn)的。通過它可以管理、定義、描述用戶和用戶群體。此外還設(shè)置了一個安全查詢管理層(SQML),它的作用是通過檢查是否允許一個任務(wù)的執(zhí)行來過濾用戶的查詢。圖1描述了這個安全模型。

　　此模型的主要作用是如果用戶企圖查詢他沒有訪問權(quán)限的數(shù)據(jù),則由“安全管理者”和“信息服務(wù)器”可以把用戶想查詢而又沒有查詢權(quán)限的那部分數(shù)據(jù)過濾掉,而只把他可以訪問的那些數(shù)據(jù)返回給他。這種操作對于用戶來說是透明的,用戶并不知道還有些數(shù)據(jù)他沒有訪問到。數(shù)據(jù)倉庫的信息對于用戶來說好像是提供了他所需要的所有數(shù)據(jù)。這是一個很重要的安全策略,使用戶不知道自己被禁止了部分數(shù)據(jù),因而他不會去試圖訪問他原本看不到的數(shù)據(jù)。這樣也極大地增強了數(shù)據(jù)倉庫中數(shù)據(jù)的安全性。

　　該模型主要特點是把數(shù)據(jù)倉庫中的元數(shù)據(jù)擴充為二類元數(shù)據(jù):結(jié)構(gòu)元數(shù)據(jù)和訪問元數(shù)據(jù)。利用訪問元數(shù)據(jù)來控制用戶對數(shù)據(jù)倉庫的訪問。充分利用了元數(shù)據(jù)在數(shù)據(jù)倉庫中的作用。通過元數(shù)據(jù)減少了用戶試圖訪問無權(quán)訪問的數(shù)據(jù)的可能性,減少了攻擊數(shù)據(jù)倉庫的行為,從而增強了安全性。

1.2 基于角色的數(shù)據(jù)倉庫安全性模型設(shè)計

　　角色是數(shù)據(jù)庫中一個很重要的概念。通過角色的定義可以加強數(shù)據(jù)庫的安全性。由于數(shù)據(jù)倉庫中的數(shù)據(jù)存儲與數(shù)據(jù)庫中的數(shù)據(jù)存儲有著諸多的不同,所以將數(shù)據(jù)庫中角色的實現(xiàn)照搬到數(shù)據(jù)倉庫中是行不通的。

　　Remzi Kirkgoze,Nevena Katic于1997年提出一種基于角色的OLAP數(shù)據(jù)立方體訪問控制策略[3]。這個模型是一個基于AMAC(Adapted Mandatory Access Control)的控制OLAP多維立方體的安全控制策略。

　　在這個模型中主要描述了數(shù)據(jù)倉庫中每個角色的安全限制規(guī)則。每個用戶有一個角色,每個角色對應(yīng)一個安全規(guī)則表。這些規(guī)則表組成了角色的安全限制文件。根據(jù)這個角色安全限制文件,每個用戶可以訪問到他被授權(quán)訪問的數(shù)據(jù)。

　　這個模型是一個只有“角色”作為安全主體(Scurity Subject)的數(shù)據(jù)倉庫安全模型,該模型權(quán)限只能賦予角色。安全對象(Secrtity Object)是安全系統(tǒng)中的客體,在OLAP環(huán)境中維表、事實表及它們的屬性都是安全對象。每一個安全主體被授權(quán)能對安全對象進行某種操作,這些操作稱為訪問類型。

　　把每個安全對象應(yīng)用分段策略得到所有單級片段后,應(yīng)用謂詞訪問策略得出每種角色能訪問的片段集。假設(shè)用戶現(xiàn)在的角色是R,如果他想訪問某個對象,則該系統(tǒng)能產(chǎn)生訪問該對象的片段集合A,并與安全限制規(guī)則表中R能訪問的片段集合B進行比較;如果A包含于B,則系統(tǒng)將處理查詢,否則將被拒絕訪問。

　　此模型的特點是能為不同的子立方體賦予不同角色,并能為系統(tǒng)用戶賦予不同角色,達到靈活性與安全性的統(tǒng)一。此模型是對于關(guān)系型數(shù)據(jù)庫中基于角色的訪問控制的一種擴展,是角色的訪問控制在數(shù)據(jù)倉庫中的應(yīng)用。

1.3 基于授權(quán)的安全模型

　　授權(quán)是指一個對象對系統(tǒng)對象或者系統(tǒng)本身所擁有的合法訪問權(quán)限。Edgar Weippl等人提出了一種對數(shù)據(jù)倉庫和OLAP的一個授權(quán)模型[4],他們通過一種簡單的描述符號來描述這種訪問授權(quán),它比用SQL的授權(quán)機制更直觀。

　　在這個授權(quán)模型中包括主體對象、訪問類型、客體對象和謂詞。對象指的是數(shù)據(jù)倉庫中多維立方體中的維度、維度中的層次、事實表。訪問類型主要考慮六種基本的操作:read,drill-down,roll-up,slice,dice,drill-through。

　　模型中以用戶而不是角色作為授權(quán)對象。本文通過下面的例子來說明這個模型。例如數(shù)據(jù)倉庫中的一個銷售鏈包括四個維度:時間、地理位置、商品、銷售度量。

　　時間:日-月-年

　　商品:產(chǎn)品-子類別-類別

　　地理位置:鄉(xiāng)鎮(zhèn)-縣市-地區(qū)-省份

　　銷售度量:單價、利潤

　　考慮地方經(jīng)理和產(chǎn)品經(jīng)理二個不同的角色,他們職責不同,地方經(jīng)理可能是一個地方的管理者,而一個產(chǎn)品經(jīng)理可能主要是負責一個單獨的商品銷售情況和各種商品的銷售情況。

　　下面通過一個例子來說明此模型的使用。例如:

　　(張三,{單價},{(時間,{(Drill-Down,月)}),(地理位置,{(Drill-Down,省份),(Roll-Up,地區(qū))}),(商品,{(Drill-Down,類別),(Roll-Up,產(chǎn)品)})})。

　　這說明允許張三訪問每種產(chǎn)品的單價,但是不允許訪問每種產(chǎn)品的利潤,允許訪問子類別或者類別。同時,他也不能檢索基于每年或者每天的合成數(shù)據(jù),但是允許訪問每個城市或商店的數(shù)據(jù)。如果加上下面的集合:

　　(張三,{單價,利潤},{(時間,{(Drill-Down,年)}),(地理位置,{(Drill-Down,省份),(Roll-Up,商店),(Slice,地區(qū)=“濟南”)}),(商品,{(Drill-Down,類別),(Roll-Up,商品)})})。

　　這樣,張三就能夠完全訪問濟南地區(qū)的所有商店的數(shù)據(jù)。由這二個數(shù)據(jù)集他就能夠完成他的工作:監(jiān)督濟南地區(qū)的商店并且能以綜合的方式比較它們的性能如何。

　　此模型的特點是:從邏輯上把授權(quán)模型分為二部分SUBJECT和OBJECT,通過一種簡單的操作用戶可以方便地描述所需要的安全訪問權(quán)限,從而增強了表述能力和安全的可用性。通過一套簡單的描述符號,對于任意一種給定的安全策略,都可以很容易地實現(xiàn)它的訪問控制權(quán)限。此模型主要是作者通過對關(guān)系數(shù)據(jù)庫中SQL語言機制的演變,提出的一種更適合數(shù)據(jù)倉庫中多維數(shù)據(jù)訪問的策略。但是要實現(xiàn)此種控制還需要開發(fā)能夠解釋此種語言的機制。

1.4 基于視圖的數(shù)據(jù)倉庫安全模型

　　A.Rosenthal等人在2000年提出了一種基于視圖的數(shù)據(jù)倉庫安全模型[5]。這個模型是通過從數(shù)據(jù)庫與數(shù)據(jù)倉庫的聯(lián)系方面來解決問題的?，F(xiàn)在,在數(shù)據(jù)倉庫中訪問控制的管理常常存在于一個與數(shù)據(jù)源策略相互獨立的地方。其結(jié)果是造成不一致性,對于變化反映滯后,并且浪費管理工作。針對這種情況,本文提出把源數(shù)據(jù)所在的數(shù)據(jù)源和數(shù)據(jù)倉庫都看作是同一個分布式數(shù)據(jù)庫的一部分。由于在數(shù)據(jù)庫中已經(jīng)有了比較成熟的依靠視圖機制來控制各個用戶的訪問權(quán)限的方法,把數(shù)據(jù)倉庫和數(shù)據(jù)源作為同一個分布式數(shù)據(jù)庫的一部分,這樣在數(shù)據(jù)倉庫中就不用再單獨定義數(shù)據(jù)的視圖機制,而讓它延續(xù)用數(shù)據(jù)庫中的視圖訪問機制即可。這就是說,允許自動配置對數(shù)據(jù)倉庫的許多訪問控制。從某種意義上說,這樣減少了管理員學習過程中要走的曲線過程,同時也減少了軟件提供商需要實現(xiàn)的軟件數(shù)量。上述安全模型可用圖2描述。

　　這種安全模型的特點是系統(tǒng)易于管理,使得授權(quán)管理系統(tǒng)及其應(yīng)用更健壯。系統(tǒng)能夠自動地從數(shù)據(jù)源分析用戶對于數(shù)據(jù)的訪問權(quán)限,然后自動地生成用戶在數(shù)據(jù)倉庫中所能夠訪問的數(shù)據(jù)。因為數(shù)據(jù)倉庫中的數(shù)據(jù)都是通過數(shù)據(jù)抽取轉(zhuǎn)換工具從數(shù)據(jù)源處得到的。這樣就減少了技術(shù)人員在數(shù)據(jù)倉庫中在進行相應(yīng)方位策略的配置問題。同時能夠很好地解決變化之后的問題。但是僅僅通過從數(shù)據(jù)庫沿用過來的視圖安全是不能夠滿足數(shù)據(jù)倉庫需要的。因為數(shù)據(jù)倉庫的數(shù)據(jù)模型是多維數(shù)據(jù)和關(guān)系數(shù)據(jù)的混合,它要比數(shù)據(jù)庫中單純的關(guān)系型數(shù)據(jù)復(fù)雜得多。視圖機制對于數(shù)據(jù)庫中writeupdate操作機制很奏效,而在數(shù)據(jù)倉庫中主要進行的操作是讀取數(shù)據(jù)分析數(shù)據(jù),僅有此不能很好地滿足數(shù)據(jù)倉庫的需要。但是這確實提供了一種安全機制。

2? 總結(jié)與展望

　　本文分析的幾種數(shù)據(jù)倉庫安全模型具有很強的代表性。它們分別以不同的方式達到了增強數(shù)據(jù)倉庫安全性的目的?；谠獢?shù)據(jù)的模型,充分考慮了元數(shù)據(jù)在數(shù)據(jù)倉庫中的重要作用。通過一些限制對元數(shù)據(jù)訪問的方法來減少數(shù)據(jù)倉庫受攻擊的可能性。其他幾種基于角色的模型、基于授權(quán)的模型以及基于視圖的模型也都有其各自的特點。但是可以看出,這些安全模型大部分都是在數(shù)據(jù)庫安全模型方面的擴展。當然這也是一種理所當然的趨勢,因為畢竟數(shù)據(jù)庫的安全理論已經(jīng)比較成熟?？墒怯捎跀?shù)據(jù)倉庫的建立目的、數(shù)據(jù)模型、訪問策略等與數(shù)據(jù)庫不同,二者的安全策略也是有相應(yīng)區(qū)別。從數(shù)據(jù)倉庫本身的特點出發(fā),利用一些已經(jīng)成熟的安全理論來構(gòu)造一種更加安全的、實施更加方便的安全模型,這也是下一步工作的重點。

　　總之,數(shù)據(jù)倉庫是一項基于數(shù)據(jù)管理和利用的綜合性技術(shù)和解決方案,它將成為數(shù)據(jù)庫市場的新一輪的增長點。對數(shù)據(jù)倉庫的安全性訪問作為數(shù)據(jù)倉庫技術(shù)與信息安全技術(shù)的結(jié)合點,必將會面臨更大的挑戰(zhàn)和機遇。

參考文獻

1? Inmon W H著,王志海譯.Building the Data Warehouse. 北京:機械工業(yè)出版社,2000

2? Katic N,Quirchmayr G,Schiefer J et al.A Prototype Model for DataWarehouse Security based on Metadata.

IEEE Computer Society,1998;8

3? Kirkgoze R,Katic N,Stolba M et al.A Security Concept for OLAP.in:Proceedings of the 8th.International

Workshop on Database and Expert Systems Applications(DEXA′97),IEEE Computer Society,1997

4? Weippl E,Mangisengi O,Essmayr W et al.An Autho rization Model for Data Warehouses and OLAP.in:

Proceedings of the Workshop on Security in Distributed Data Warehousing，in Conjunction with 2th.IEEE Symposium Reliable Distributed Systems (SRDS′2001),2001

5? Rosenthal A,Sciore E.View Security asthe Basis for Data Warehouse Security.in:Proceedings of the International Workshop on Design and Management of Data? Warehouse(DMDW′2000),Sweden,2000

版權(quán)聲明：本站內(nèi)容除特別聲明的原創(chuàng)文章之外，轉(zhuǎn)載內(nèi)容只為傳遞更多信息，并不代表本網(wǎng)站贊同其觀點。轉(zhuǎn)載的所有的文章、圖片、音/視頻文件等資料的版權(quán)歸版權(quán)所有權(quán)人所有。本站采用的非本站原創(chuàng)文章及圖片等內(nèi)容無法一一聯(lián)系確認版權(quán)者。如涉及作品內(nèi)容、版權(quán)和其它問題，請及時通過電子郵件或電話通知我們，以便迅速采取適當措施，避免給雙方造成不必要的經(jīng)濟損失。聯(lián)系電話：010-82306118；郵箱：aet@chinaaet.com。

数据仓库安全模型分析

日期： 2009-08-06

作者：王子高1, 马艳锋2

相關(guān)內(nèi)容