摘 要: 有組織犯罪集團(tuán)挖掘是目前數(shù)據(jù)挖掘技術(shù)研究的熱點(diǎn),利用共犯網(wǎng)絡(luò)結(jié)構(gòu)提出一種新的有組織犯罪集團(tuán)挖掘的方法。該方法能從大型真實(shí)犯罪數(shù)據(jù)集獲取有組織犯罪集團(tuán)信息,提高了有組織犯罪集團(tuán)檢測效率。實(shí)驗結(jié)果表明,該方法能分析出有組織犯罪集團(tuán)特征演變軌跡,對挖掘有組織犯罪集團(tuán)證據(jù)可行、有效。
關(guān)鍵詞: 數(shù)據(jù)挖掘;共犯網(wǎng)絡(luò);有組織犯罪集團(tuán);檢測效率
0 引言
共犯網(wǎng)絡(luò)結(jié)構(gòu)分析是理解有組織犯罪成因和干預(yù)策略影響的關(guān)鍵,即如何在共犯網(wǎng)絡(luò)結(jié)構(gòu)基礎(chǔ)上對有組織犯罪集團(tuán)證據(jù)進(jìn)行挖掘[1]。本文抓住有組織犯罪集團(tuán)檢測計算方法的關(guān)鍵——共犯網(wǎng)絡(luò),利用小團(tuán)體的擴(kuò)展?jié)B透法匹配犯罪集團(tuán)中的某個單元,提出了共犯網(wǎng)絡(luò)分析視角(Co-offending Networks Analysis Perspective,CNAP)算法,并在大型真實(shí)犯罪數(shù)據(jù)集進(jìn)行實(shí)驗。實(shí)驗結(jié)果表明,在共犯網(wǎng)絡(luò)結(jié)構(gòu)分析上,該方法極大地提高了有組織犯罪分析計算速度,而且保持了較高的有效性。
1 概念
定義1 罪犯組
指3人以上為了實(shí)施一種或幾種犯罪而組織起來的共同犯罪組織,定義模型中,C1t,C2t,…,Cnt指n個罪犯組在時間t的共犯網(wǎng)絡(luò)。
定義2 有組織犯罪集團(tuán)
在理論上[2],有組織犯罪集團(tuán)和犯罪集團(tuán)的兩個概念至少在3個基本方面不同:(1)組織規(guī)模和動機(jī);(2)合作的時間間隔;(3)犯罪活動的類型。然而在實(shí)踐中,有組織的犯罪集團(tuán)和犯罪集團(tuán)之間的區(qū)別并不總是清晰的,這也給研究帶來了許多挑戰(zhàn)。在以下模型中,用O1t,O2t,…,Omt表示在時間t共犯網(wǎng)絡(luò)中有m個有組織犯罪集團(tuán)。
2 有組織犯罪集團(tuán)檢測
2.1 罪犯組檢測
該方法的第一步是建立K-結(jié)點(diǎn)的罪犯組網(wǎng)絡(luò),彼此共享至少k-1結(jié)點(diǎn)的相鄰K-結(jié)點(diǎn)網(wǎng)絡(luò)[3]。假設(shè)k=3,因為有組織犯罪集團(tuán)至少有3個成員,每個組可能屬于不同的獨(dú)立社區(qū)但有共同交叉結(jié)點(diǎn),因此該罪犯組既有重疊的成員還有普通成員。將這些成員分配到每個罪犯組形成內(nèi)核K(Ci),內(nèi)核是一個犯罪集團(tuán)主要的成員,是完全參與該犯罪組活動。第二步,將鄰居結(jié)點(diǎn)直接連接到內(nèi)核添加到罪犯組,這些結(jié)點(diǎn)被稱為外圍,用 P(Ci)表示。
2.2 有組織犯罪集團(tuán)檢測
犯罪活動和犯罪行為是理解犯罪集團(tuán)組織結(jié)構(gòu)兩個關(guān)鍵特征[4]。下面提出兩個操作算子對犯罪活動和行為進(jìn)行計算。
犯罪集團(tuán)Ci在時間t犯罪行為表示為(Ci),定義為:
其中,表示某個罪犯ik的嚴(yán)重程度,即犯罪集團(tuán)Ci成員在t時刻的犯罪行為。
設(shè)i1,i2,…,in是Ci在時間t的犯罪成員,犯罪集團(tuán)C在時間t1到時間t2的活動記為,計算公式如下:
其中,|Rt1(Ci)|和|Rt2(Ci)|分別表示犯罪集團(tuán)Ci在時刻t1和時刻t2共犯次數(shù)。
為了確定發(fā)現(xiàn)罪犯組是否被認(rèn)為是有組織犯罪集團(tuán),必須同時考慮犯罪活動和犯罪行為,定義兩個閾值:表示犯罪活動和
表示犯罪行為。如果
(Ci)>
,那么給定的犯罪集團(tuán)C就是活動的犯罪集團(tuán)A;如果
(Ci)>
,那么C就是一個嚴(yán)重犯罪集團(tuán)。
2.3 有組織犯罪集團(tuán)演化模型
這個模型需要確定原來的某個犯罪集團(tuán)已經(jīng)演變當(dāng)前的某個犯罪集團(tuán)。一個犯罪集團(tuán)的一個周期會出現(xiàn)5個階段:產(chǎn)生、分裂、合并、出現(xiàn)和終止[5]。為此,引入一個匹配的函數(shù)F:
其中,表示一個犯罪組織集合,2
表示
的冪集。給定一個有組織犯罪集團(tuán)Oit和有組織犯罪集團(tuán)集合
t+1,如果F(Oit,g)得出集團(tuán)Oit+1與Oit有最大的交集超過給定的閾值
,形式定義如下:
這里兩個有組織犯罪集團(tuán)O,O′∈,P(O,O′)定義如下:
算法1 有組織犯罪集團(tuán)檢測
輸入:
?。?)犯罪事件數(shù)據(jù)集;
(2)Crime seriousness index(犯罪程度索引);
?。?)犯罪活動和犯罪行為的閾值:α,β。
輸出:有組織犯罪集團(tuán)O1t,O2t,…,Omt
?。?)/*數(shù)據(jù)準(zhǔn)備*/;
?。?)掃描在[t1,t2]時間之間每個犯罪事件集;
?。?)抽取共犯網(wǎng)絡(luò);
(4)檢測犯罪組織C1t,C2t,…Cnt;
?。?)對每個犯罪組織Cit∈Ct做第(6)步和(7)步;
(6)計算組織犯罪活動閾值
?。?)計算組織犯罪行為閾值
?。?)對滿足閾值的犯罪組織標(biāo)識為有可能組織犯罪集團(tuán);
?。?)對每個犯罪組織候選集Oit,進(jìn)行第(10)步;
?。?0)評估出犯罪組織物質(zhì)利益;
(11)對有組織犯罪集團(tuán),O1t,O2t,…,Omt,應(yīng)用演變跟蹤模型。
3 實(shí)驗結(jié)果
3.1 犯罪數(shù)據(jù)集
為了驗證方法的有效性,實(shí)驗數(shù)據(jù)采用加拿大不列顛哥倫比亞省arrest-data犯罪數(shù)據(jù)集[6],該數(shù)據(jù)集記錄了從2001-8-1至2006-7-31共5年的犯罪數(shù)據(jù)。
圖1顯示了活躍罪犯組的數(shù)量隨著第1、2、3、4這4段時間觀察到的區(qū)別。值得注意的是,隨著時間的推移,活躍犯罪組的數(shù)量急劇下降。在a值較高時從一個時間段到下一個時間段連續(xù)活動明顯可見,這一發(fā)現(xiàn)印證了犯罪組織的短期合作的理論[7]。
3.2 罪犯組演變
因為不知道第一步以前的歷史時間和最后一次未來時間,在有限的可觀測時間跨度里對罪犯組的整個生命周期進(jìn)行量化工作非常困難[8]。
在5個不同時間段各罪犯組的演化軌跡統(tǒng)計如圖2所示。匹配函數(shù)的閾值0.3適用于考慮幸存一組,值大于0.2和小于0.3分別適用于分裂和合并,組匹配閾值小于0.2被認(rèn)為是終止罪犯組??傮w而言(平均而言),所有罪犯群體大約14%幸存,但分裂和合并事件很少發(fā)生,不到犯罪組的1%。大約88%的罪犯組被認(rèn)為是終止了,因為在接下來的時間并沒有觀察到他們的活動,所有組織中90%是新出現(xiàn)的犯罪組。
4 結(jié)論
為提高有組織犯罪集團(tuán)證據(jù)計算效率,本文提出基于共犯網(wǎng)絡(luò)結(jié)構(gòu)分析技術(shù)。實(shí)驗結(jié)果表明,雖然罪犯在犯罪集團(tuán)中的合作是連續(xù)的,但大多數(shù)犯罪組織的活動不會持續(xù)很長時間。另外,活躍的犯罪組織通常有更多的外圍,相比之下嚴(yán)重的犯罪組織外圍成員偏少,這一發(fā)現(xiàn)表明,嚴(yán)重犯罪組織的運(yùn)作主要來自他們的內(nèi)核成員。在未來的工作中將探索有組織犯罪的組織結(jié)構(gòu),區(qū)分層次組織和分散組織,并分析這些結(jié)構(gòu)演變軌跡。
參考文獻(xiàn)
[1] MCGLOIN J M, NGUYEN H. The importance of studying co-offending networks for criminological theory and policy[C]. Proceedings of Third Annual Illicit Networks Workshop, Montréal, Québec, October 2011.
[2] KIM M S, HAN J W. A particle-and-density based evolutionary clustering method for dynamic networks[J]. Proceedings of Very Large Data Base Endowment, 2009, 2(1): 622-633.
[8] KIM K, MCKAY R, MOON B R. Multiobjective evolutionary algorithms for dynamic social network clustering[C]. Proceedings of the 12th Conf.Genetic and Evolutionary Computation, 2010:1179-1186.
[3] SATULURI V, PARTHASARATHY S. Scalable graph clustering using stochastic flows: applications to community discovery[C]. KDD, Paris, France, 2009:737-746.
[4] INOKUCHI A, WASHIO T. Mining frequent graph sequence patterns induced by vertices[C]. Proceedings of the SIAM Int′1 Conference on Data Mining, 2010:466-477.
[5] MICHELLE G, NEWMAN M E J. Community structure in social and biological networks[J]. PNAS, 2002,99(12):7821-7826.
[6] TAYEBI M A, GL?魧SSER U. Organized crime structures in co-offending networks[C]. Proceedings of International Conference on Social Computing and its Applications, Sydney, Australia, Dec. 2011.
[7] NGUYEN N P,DINH T N,Ying Xuan, et al. Adaptive algorithms for detecting community structure in dynamic social networks[C]. Shanghai: Proceedings of IEEE Infocom′11, 2011:2282-2290.
[8] BACKSTROM L, HUTTENLOCHER D, KLEINBERG J, et al. Group formation in large social networks: membership, growth and evolution[C]. Proceedings of the KDD, 2006: 44-54.