摘 要: 有組織犯罪集團(tuán)挖掘是目前數(shù)據(jù)挖掘技術(shù)研究的熱點(diǎn),利用共犯網(wǎng)絡(luò)結(jié)構(gòu)提出一種新的有組織犯罪集團(tuán)挖掘的方法。該方法能從大型真實(shí)犯罪數(shù)據(jù)集獲取有組織犯罪集團(tuán)信息,提高了有組織犯罪集團(tuán)檢測(cè)效率。實(shí)驗(yàn)結(jié)果表明,該方法能分析出有組織犯罪集團(tuán)特征演變軌跡,對(duì)挖掘有組織犯罪集團(tuán)證據(jù)可行、有效。
關(guān)鍵詞: 數(shù)據(jù)挖掘;共犯網(wǎng)絡(luò);有組織犯罪集團(tuán);檢測(cè)效率
0 引言
共犯網(wǎng)絡(luò)結(jié)構(gòu)分析是理解有組織犯罪成因和干預(yù)策略影響的關(guān)鍵,即如何在共犯網(wǎng)絡(luò)結(jié)構(gòu)基礎(chǔ)上對(duì)有組織犯罪集團(tuán)證據(jù)進(jìn)行挖掘[1]。本文抓住有組織犯罪集團(tuán)檢測(cè)計(jì)算方法的關(guān)鍵——共犯網(wǎng)絡(luò),利用小團(tuán)體的擴(kuò)展?jié)B透法匹配犯罪集團(tuán)中的某個(gè)單元,提出了共犯網(wǎng)絡(luò)分析視角(Co-offending Networks Analysis Perspective,CNAP)算法,并在大型真實(shí)犯罪數(shù)據(jù)集進(jìn)行實(shí)驗(yàn)。實(shí)驗(yàn)結(jié)果表明,在共犯網(wǎng)絡(luò)結(jié)構(gòu)分析上,該方法極大地提高了有組織犯罪分析計(jì)算速度,而且保持了較高的有效性。
1 概念
定義1 罪犯組
指3人以上為了實(shí)施一種或幾種犯罪而組織起來(lái)的共同犯罪組織,定義模型中,C1t,C2t,…,Cnt指n個(gè)罪犯組在時(shí)間t的共犯網(wǎng)絡(luò)。
定義2 有組織犯罪集團(tuán)
在理論上[2],有組織犯罪集團(tuán)和犯罪集團(tuán)的兩個(gè)概念至少在3個(gè)基本方面不同:(1)組織規(guī)模和動(dòng)機(jī);(2)合作的時(shí)間間隔;(3)犯罪活動(dòng)的類型。然而在實(shí)踐中,有組織的犯罪集團(tuán)和犯罪集團(tuán)之間的區(qū)別并不總是清晰的,這也給研究帶來(lái)了許多挑戰(zhàn)。在以下模型中,用O1t,O2t,…,Omt表示在時(shí)間t共犯網(wǎng)絡(luò)中有m個(gè)有組織犯罪集團(tuán)。
2 有組織犯罪集團(tuán)檢測(cè)
2.1 罪犯組檢測(cè)
該方法的第一步是建立K-結(jié)點(diǎn)的罪犯組網(wǎng)絡(luò),彼此共享至少k-1結(jié)點(diǎn)的相鄰K-結(jié)點(diǎn)網(wǎng)絡(luò)[3]。假設(shè)k=3,因?yàn)橛薪M織犯罪集團(tuán)至少有3個(gè)成員,每個(gè)組可能屬于不同的獨(dú)立社區(qū)但有共同交叉結(jié)點(diǎn),因此該罪犯組既有重疊的成員還有普通成員。將這些成員分配到每個(gè)罪犯組形成內(nèi)核K(Ci),內(nèi)核是一個(gè)犯罪集團(tuán)主要的成員,是完全參與該犯罪組活動(dòng)。第二步,將鄰居結(jié)點(diǎn)直接連接到內(nèi)核添加到罪犯組,這些結(jié)點(diǎn)被稱為外圍,用 P(Ci)表示。
2.2 有組織犯罪集團(tuán)檢測(cè)
犯罪活動(dòng)和犯罪行為是理解犯罪集團(tuán)組織結(jié)構(gòu)兩個(gè)關(guān)鍵特征[4]。下面提出兩個(gè)操作算子對(duì)犯罪活動(dòng)和行為進(jìn)行計(jì)算。
犯罪集團(tuán)Ci在時(shí)間t犯罪行為表示為(Ci),定義為:
其中,表示某個(gè)罪犯ik的嚴(yán)重程度,即犯罪集團(tuán)Ci成員在t時(shí)刻的犯罪行為。
設(shè)i1,i2,…,in是Ci在時(shí)間t的犯罪成員,犯罪集團(tuán)C在時(shí)間t1到時(shí)間t2的活動(dòng)記為,計(jì)算公式如下:
其中,|Rt1(Ci)|和|Rt2(Ci)|分別表示犯罪集團(tuán)Ci在時(shí)刻t1和時(shí)刻t2共犯次數(shù)。
為了確定發(fā)現(xiàn)罪犯組是否被認(rèn)為是有組織犯罪集團(tuán),必須同時(shí)考慮犯罪活動(dòng)和犯罪行為,定義兩個(gè)閾值:表示犯罪活動(dòng)和
表示犯罪行為。如果
(Ci)>
,那么給定的犯罪集團(tuán)C就是活動(dòng)的犯罪集團(tuán)A;如果
(Ci)>
,那么C就是一個(gè)嚴(yán)重犯罪集團(tuán)。
2.3 有組織犯罪集團(tuán)演化模型
這個(gè)模型需要確定原來(lái)的某個(gè)犯罪集團(tuán)已經(jīng)演變當(dāng)前的某個(gè)犯罪集團(tuán)。一個(gè)犯罪集團(tuán)的一個(gè)周期會(huì)出現(xiàn)5個(gè)階段:產(chǎn)生、分裂、合并、出現(xiàn)和終止[5]。為此,引入一個(gè)匹配的函數(shù)F:
其中,表示一個(gè)犯罪組織集合,2
表示
的冪集。給定一個(gè)有組織犯罪集團(tuán)Oit和有組織犯罪集團(tuán)集合
t+1,如果F(Oit,g)得出集團(tuán)Oit+1與Oit有最大的交集超過(guò)給定的閾值
,形式定義如下:
這里兩個(gè)有組織犯罪集團(tuán)O,O′∈,P(O,O′)定義如下:
算法1 有組織犯罪集團(tuán)檢測(cè)
輸入:
?。?)犯罪事件數(shù)據(jù)集;
?。?)Crime seriousness index(犯罪程度索引);
?。?)犯罪活動(dòng)和犯罪行為的閾值:α,β。
輸出:有組織犯罪集團(tuán)O1t,O2t,…,Omt
?。?)/*數(shù)據(jù)準(zhǔn)備*/;
?。?)掃描在[t1,t2]時(shí)間之間每個(gè)犯罪事件集;
?。?)抽取共犯網(wǎng)絡(luò);
?。?)檢測(cè)犯罪組織C1t,C2t,…Cnt;
(5)對(duì)每個(gè)犯罪組織Cit∈Ct做第(6)步和(7)步;
(6)計(jì)算組織犯罪活動(dòng)閾值
?。?)計(jì)算組織犯罪行為閾值
(8)對(duì)滿足閾值的犯罪組織標(biāo)識(shí)為有可能組織犯罪集團(tuán);
(9)對(duì)每個(gè)犯罪組織候選集Oit,進(jìn)行第(10)步;
?。?0)評(píng)估出犯罪組織物質(zhì)利益;
?。?1)對(duì)有組織犯罪集團(tuán),O1t,O2t,…,Omt,應(yīng)用演變跟蹤模型。
3 實(shí)驗(yàn)結(jié)果
3.1 犯罪數(shù)據(jù)集
為了驗(yàn)證方法的有效性,實(shí)驗(yàn)數(shù)據(jù)采用加拿大不列顛哥倫比亞省arrest-data犯罪數(shù)據(jù)集[6],該數(shù)據(jù)集記錄了從2001-8-1至2006-7-31共5年的犯罪數(shù)據(jù)。
圖1顯示了活躍罪犯組的數(shù)量隨著第1、2、3、4這4段時(shí)間觀察到的區(qū)別。值得注意的是,隨著時(shí)間的推移,活躍犯罪組的數(shù)量急劇下降。在a值較高時(shí)從一個(gè)時(shí)間段到下一個(gè)時(shí)間段連續(xù)活動(dòng)明顯可見(jiàn),這一發(fā)現(xiàn)印證了犯罪組織的短期合作的理論[7]。
3.2 罪犯組演變
因?yàn)椴恢赖谝徊揭郧暗臍v史時(shí)間和最后一次未來(lái)時(shí)間,在有限的可觀測(cè)時(shí)間跨度里對(duì)罪犯組的整個(gè)生命周期進(jìn)行量化工作非常困難[8]。
在5個(gè)不同時(shí)間段各罪犯組的演化軌跡統(tǒng)計(jì)如圖2所示。匹配函數(shù)的閾值0.3適用于考慮幸存一組,值大于0.2和小于0.3分別適用于分裂和合并,組匹配閾值小于0.2被認(rèn)為是終止罪犯組。總體而言(平均而言),所有罪犯群體大約14%幸存,但分裂和合并事件很少發(fā)生,不到犯罪組的1%。大約88%的罪犯組被認(rèn)為是終止了,因?yàn)樵诮酉聛?lái)的時(shí)間并沒(méi)有觀察到他們的活動(dòng),所有組織中90%是新出現(xiàn)的犯罪組。
4 結(jié)論
為提高有組織犯罪集團(tuán)證據(jù)計(jì)算效率,本文提出基于共犯網(wǎng)絡(luò)結(jié)構(gòu)分析技術(shù)。實(shí)驗(yàn)結(jié)果表明,雖然罪犯在犯罪集團(tuán)中的合作是連續(xù)的,但大多數(shù)犯罪組織的活動(dòng)不會(huì)持續(xù)很長(zhǎng)時(shí)間。另外,活躍的犯罪組織通常有更多的外圍,相比之下嚴(yán)重的犯罪組織外圍成員偏少,這一發(fā)現(xiàn)表明,嚴(yán)重犯罪組織的運(yùn)作主要來(lái)自他們的內(nèi)核成員。在未來(lái)的工作中將探索有組織犯罪的組織結(jié)構(gòu),區(qū)分層次組織和分散組織,并分析這些結(jié)構(gòu)演變軌跡。
參考文獻(xiàn)
[1] MCGLOIN J M, NGUYEN H. The importance of studying co-offending networks for criminological theory and policy[C]. Proceedings of Third Annual Illicit Networks Workshop, Montréal, Québec, October 2011.
[2] KIM M S, HAN J W. A particle-and-density based evolutionary clustering method for dynamic networks[J]. Proceedings of Very Large Data Base Endowment, 2009, 2(1): 622-633.
[8] KIM K, MCKAY R, MOON B R. Multiobjective evolutionary algorithms for dynamic social network clustering[C]. Proceedings of the 12th Conf.Genetic and Evolutionary Computation, 2010:1179-1186.
[3] SATULURI V, PARTHASARATHY S. Scalable graph clustering using stochastic flows: applications to community discovery[C]. KDD, Paris, France, 2009:737-746.
[4] INOKUCHI A, WASHIO T. Mining frequent graph sequence patterns induced by vertices[C]. Proceedings of the SIAM Int′1 Conference on Data Mining, 2010:466-477.
[5] MICHELLE G, NEWMAN M E J. Community structure in social and biological networks[J]. PNAS, 2002,99(12):7821-7826.
[6] TAYEBI M A, GL?魧SSER U. Organized crime structures in co-offending networks[C]. Proceedings of International Conference on Social Computing and its Applications, Sydney, Australia, Dec. 2011.
[7] NGUYEN N P,DINH T N,Ying Xuan, et al. Adaptive algorithms for detecting community structure in dynamic social networks[C]. Shanghai: Proceedings of IEEE Infocom′11, 2011:2282-2290.
[8] BACKSTROM L, HUTTENLOCHER D, KLEINBERG J, et al. Group formation in large social networks: membership, growth and evolution[C]. Proceedings of the KDD, 2006: 44-54.