摘 要: 空間聯(lián)機分析處理技術將GIS與聯(lián)機分析處理技術OLAP相結合,提供在空間維度上進行不同尺度鉆取的解決方案——SOLAP。在SOLAP的基礎上,進一步考慮時間維度,設計了雪花模式的案事件時空數(shù)據(jù)立方體,通過對目標數(shù)據(jù)的切片、旋轉、鉆取等操作,分別基于案發(fā)地空間維度、案發(fā)時間維度和時空多個維度進行分析,探索案事件在時空上的分布規(guī)律,并結合二維顏色矩陣圖、二維等值區(qū)域圖、雷達圖等圖表對分析結果進行可視化展示,為公安機關犯罪預防、警力配置等決策提供技術支持。
關鍵詞: OLAP;數(shù)據(jù)立方體;數(shù)據(jù)倉庫;案事件時空分析
研究表明,犯罪在地理時空分布并不均勻,而是表現(xiàn)出一定的時空聚集特性,這種聚集性常用“犯罪熱點”來表述[1]。通常犯罪現(xiàn)象高度集中的時段或區(qū)域就是犯罪熱點。隨著我國經(jīng)濟的發(fā)展和社會的轉型,犯罪急劇增加,治安形勢日益嚴峻[2],如何有效地找到犯罪熱點,科學地配置警力資源,提高警務工作效率是一個值得研究的課題。
早在18世紀中期,就有國外學者將地理學與犯罪研究相結合。犯罪地理學從誕生到現(xiàn)在一共經(jīng)歷了4個發(fā)展時期:地理環(huán)境決定論、環(huán)境決定論、芝加哥犯罪學派、犯罪行為學派。20世紀90年代,地理信息系統(tǒng)GIS(Geographic Information System)被引入到犯罪地理學的研究中[3-4]。GIS的聚類分析、鄰近分析等空間統(tǒng)計分析方法在犯罪地理學的研究中發(fā)揮了重大的作用,為犯罪地理學提供了新的技術方法[4-5]。
聯(lián)機分析處理OLAP(Online Analytical Processing)是在數(shù)據(jù)倉庫的基礎上實現(xiàn)快速多維分析的商務智能技術[6]。空間聯(lián)機分析處理技術SOLAP(Spatial OLAP)將GIS與OLAP相結合,提供一個進行空間維度上不同尺度的自動鉆取的解決方案,實現(xiàn)各類空間聯(lián)機分析,為用戶提供更加全面靈活的空間決策支持[7-9]。本文在SOLAP的基礎上進一步考慮時間維度,設計適合案事件時空分析的時空數(shù)據(jù)立方體及數(shù)據(jù)模型,通過對目標數(shù)據(jù)的切片、旋轉、鉆取等OLAP操作分析案事件的時空分布規(guī)律,并且以一種直觀易懂的形式將分析的結果進行可視化展現(xiàn),為公安機關打擊和預防犯罪提供決策支持,為警力配置提供依據(jù)。
1 案事件時空數(shù)據(jù)立方體
為了滿足用戶從多角度進行數(shù)據(jù)查詢分析的需求,需要建立一個基于事實和維的數(shù)據(jù)庫模型——多維數(shù)據(jù)模型。常見的多維數(shù)據(jù)模型有星型模型和雪花模型。星型模型的維度表是非規(guī)范化的,往往會造成數(shù)據(jù)冗余,使事實表變得臃腫。通過對星型模型的進一步層次化可以得到雪花模型。公安案事件數(shù)據(jù)層級結構較為復雜,且屬性數(shù)據(jù)間多對多關系比較多,例如,不同類型的案件可能發(fā)生在不同的警區(qū),不同警區(qū)需要處理不同類型的案件。為了減少數(shù)據(jù)冗余,提高查詢性能,本文選擇雪花模型來組織公安案事件的數(shù)據(jù),如圖所示。
基于多維數(shù)據(jù)模型,進行案事件時空數(shù)據(jù)立方體的維度和度量的設計。維度指觀察對象的角度,比如案發(fā)時間、案發(fā)地、案件類別等;度量是與多個維度交叉的測度,如案事件數(shù)量??梢杂靡唤M視圖表示維度和度量的多種組合,
2 案事件時空分析
基于上述案事件時空數(shù)據(jù)雪花模型和數(shù)據(jù)立方體,建立案事件時空數(shù)據(jù)倉庫,通過上卷、下鉆、切片、切塊等操作及其組合和各種可視化形式,即可進行基本的犯罪時空分析。
2.1 基于案發(fā)地空間維度的分析
利用案發(fā)地維度的上卷、下鉆操作,可以直接獲得不同空間維度的各類案事件數(shù)量。還可以根據(jù)案發(fā)地的地理坐標,將其“撒點”到行政區(qū)劃地圖或警務轄區(qū)地圖,分析案事件的空間分布情況,得到不同空間維度的案事件分布“撒點圖”,如圖所示。
2.2 基于案發(fā)時間維度的分析
利用案發(fā)時間維度的上卷、下鉆操作,可以直接獲得不同時間維度的各類案事件數(shù)量。
也可以通過二維顏色矩陣圖、二維等值區(qū)域圖(二者皆用顏色的飽和度大小表示案事件數(shù)量的多少),或者用雷達圖(用從圓心到曲線的距離大小表示案件數(shù)量的多少)分析案事件的高發(fā)時段。
根據(jù)案發(fā)時間和“撒點圖”,還可以通過時間軸的形式分析案事件的空間分布隨時間(如不同年份、不同月份、不同季度、周一到周日、一天中的不同時段等)的變化;也可以通過上卷、下鉆操作得到不同時間維度的犯罪分布狀況。如圖8所示,可以通過基于犯罪年歷的時間選擇進行“年—月—日”的下鉆操作,分別得到某年、某月直至某天的案事件分布“撒點圖”。
2.3 基于時空多個維度的分析
例如,如果需要獲得某時刻各個區(qū)域案事件的數(shù)量,可以按照時間維度進行切片操作。行政區(qū)劃維度選擇“縣(市、區(qū))”字段,時間維度選擇“時”字段,用從紅色到綠色的雙色漸變方式表示案事件數(shù)量從多到少,形成如圖所示的二維顏色矩陣,從中可以發(fā)現(xiàn)各縣(市、區(qū))案事件的高發(fā)時段。
公安案事件數(shù)據(jù)量非常大,用手工方式或傳統(tǒng)的基于數(shù)據(jù)庫的查詢方式分析起來比較復雜。本文提出基于OLAP的犯罪時空分析,可以從時間、空間等多維角度對案事件數(shù)據(jù)進行查詢分析,輔之以地圖和圖表對結果進行可視化展現(xiàn),為公安機關打擊和預防犯罪、科學配置警力等決策提供技術支持。
參考文獻
[1] 陸娟,湯國安,張宏,等.犯罪熱點時空分布研究方法綜述[J].地理科學進展,2012,31(4):419-425.
[2] 姜博,任亞丁.警力資源配置問題淺析[J].北京人民警察學院學報,2004,16(3):59-62.
[3] 孫峰華,毛愛華.犯罪地理學的理論研究[J].人文地理,2003,18(5):70-74.
[4] 孫峰華,魏曉.犯罪地理學研究的新進展[J].人文地理,2004,19(5):60-63.
[5] 劉大千,修春亮.國內(nèi)外犯罪地理學研究進展評析[J].人文地理,2012,27(2):38-44.
[6] 楊光,張雷,艾波.數(shù)據(jù)倉庫及聯(lián)機分析處理技術[J].計算機工程與科學,2000,22(1):39-42.
[7] RIVEST S, BEDARD Y, MARCHAND P. Toward better support for spatial decision making: defining the characteristics of spatial on-line analytical processing (SOLAP)[J]. GEOMATICA-OTTAWA-,2001,55(4): 539-555.
[8] RIVEST S, B?魪DARD Y, PROULX M J, et al. SOLAP technology: merging business intelligence with geospatial technology for interactive spatio-temporal exploration and analysis of data[J]. ISPRS Journal of Photogrammetry and Remote Sensing, 2005, 60(1): 17-33.
[9] MIK?譒OVSK?譭 P, KOUBA Z. GOLAP-geographical online analytical processing[C]. Database and Expert Systems Applica-tions, Springer Berlin Heidelberg, 2001: 442-449.