《電子技術(shù)應(yīng)用》
您所在的位置:首頁(yè) > 通信與網(wǎng)絡(luò) > 設(shè)計(jì)應(yīng)用 > 基于共犯網(wǎng)絡(luò)結(jié)構(gòu)的有組織犯罪集團(tuán)挖掘方法
基于共犯網(wǎng)絡(luò)結(jié)構(gòu)的有組織犯罪集團(tuán)挖掘方法
2015年微型機(jī)與應(yīng)用第12期
唐德權(quán)1,史偉奇1,凌志剛2
(1.湖南警察學(xué)院 信息技術(shù)(網(wǎng)監(jiān))系,湖南 長(zhǎng)沙 410138; 2.湖南大學(xué) 電氣與信息工程學(xué)院,湖南 長(zhǎng)沙 410082)
摘要: 有組織犯罪集團(tuán)挖掘是目前數(shù)據(jù)挖掘技術(shù)研究的熱點(diǎn),利用共犯網(wǎng)絡(luò)結(jié)構(gòu)提出一種新的有組織犯罪集團(tuán)挖掘的方法。該方法能從大型真實(shí)犯罪數(shù)據(jù)集獲取有組織犯罪集團(tuán)信息,提高了有組織犯罪集團(tuán)檢測(cè)效率。實(shí)驗(yàn)結(jié)果表明,該方法能分析出有組織犯罪集團(tuán)特征演變軌跡,對(duì)挖掘有組織犯罪集團(tuán)證據(jù)可行、有效。
Abstract:
Key words :

  摘  要有組織犯罪集團(tuán)挖掘是目前數(shù)據(jù)挖掘技術(shù)研究的熱點(diǎn),利用共犯網(wǎng)絡(luò)結(jié)構(gòu)提出一種新的有組織犯罪集團(tuán)挖掘的方法。該方法能從大型真實(shí)犯罪數(shù)據(jù)集獲取有組織犯罪集團(tuán)信息,提高了有組織犯罪集團(tuán)檢測(cè)效率。實(shí)驗(yàn)結(jié)果表明,該方法能分析出有組織犯罪集團(tuán)特征演變軌跡,對(duì)挖掘有組織犯罪集團(tuán)證據(jù)可行、有效。

  關(guān)鍵詞: 數(shù)據(jù)挖掘;共犯網(wǎng)絡(luò);有組織犯罪集團(tuán);檢測(cè)效率

0 引言

  共犯網(wǎng)絡(luò)結(jié)構(gòu)分析是理解有組織犯罪成因和干預(yù)策略影響的關(guān)鍵,即如何在共犯網(wǎng)絡(luò)結(jié)構(gòu)基礎(chǔ)上對(duì)有組織犯罪集團(tuán)證據(jù)進(jìn)行挖掘[1]。本文抓住有組織犯罪集團(tuán)檢測(cè)計(jì)算方法的關(guān)鍵——共犯網(wǎng)絡(luò),利用小團(tuán)體的擴(kuò)展?jié)B透法匹配犯罪集團(tuán)中的某個(gè)單元,提出了共犯網(wǎng)絡(luò)分析視角(Co-offending Networks Analysis Perspective,CNAP)算法,并在大型真實(shí)犯罪數(shù)據(jù)集進(jìn)行實(shí)驗(yàn)。實(shí)驗(yàn)結(jié)果表明,在共犯網(wǎng)絡(luò)結(jié)構(gòu)分析上,該方法極大地提高了有組織犯罪分析計(jì)算速度,而且保持了較高的有效性。

1 概念

  定義1 罪犯組

  指3人以上為了實(shí)施一種或幾種犯罪而組織起來(lái)的共同犯罪組織,定義模型中,C1t,C2t,…,Cnt指n個(gè)罪犯組在時(shí)間t的共犯網(wǎng)絡(luò)。

  定義2 有組織犯罪集團(tuán)

  在理論上[2],有組織犯罪集團(tuán)和犯罪集團(tuán)的兩個(gè)概念至少在3個(gè)基本方面不同:(1)組織規(guī)模和動(dòng)機(jī);(2)合作的時(shí)間間隔;(3)犯罪活動(dòng)的類型。然而在實(shí)踐中,有組織的犯罪集團(tuán)和犯罪集團(tuán)之間的區(qū)別并不總是清晰的,這也給研究帶來(lái)了許多挑戰(zhàn)。在以下模型中,用O1t,O2t,…,Omt表示在時(shí)間t共犯網(wǎng)絡(luò)中有m個(gè)有組織犯罪集團(tuán)。

2 有組織犯罪集團(tuán)檢測(cè)

  2.1 罪犯組檢測(cè)

  該方法的第一步是建立K-結(jié)點(diǎn)的罪犯組網(wǎng)絡(luò),彼此共享至少k-1結(jié)點(diǎn)的相鄰K-結(jié)點(diǎn)網(wǎng)絡(luò)[3]。假設(shè)k=3,因?yàn)橛薪M織犯罪集團(tuán)至少有3個(gè)成員,每個(gè)組可能屬于不同的獨(dú)立社區(qū)但有共同交叉結(jié)點(diǎn),因此該罪犯組既有重疊的成員還有普通成員。將這些成員分配到每個(gè)罪犯組形成內(nèi)核K(Ci),內(nèi)核是一個(gè)犯罪集團(tuán)主要的成員,是完全參與該犯罪組活動(dòng)。第二步,將鄰居結(jié)點(diǎn)直接連接到內(nèi)核添加到罪犯組,這些結(jié)點(diǎn)被稱為外圍,用     P(Ci)表示。

  2.2 有組織犯罪集團(tuán)檢測(cè)

  犯罪活動(dòng)和犯罪行為是理解犯罪集團(tuán)組織結(jié)構(gòu)兩個(gè)關(guān)鍵特征[4]。下面提出兩個(gè)操作算子對(duì)犯罪活動(dòng)和行為進(jìn)行計(jì)算。

  犯罪集團(tuán)Ci在時(shí)間t犯罪行為表示為A)]8YVKJHTB0`W@2AB$E64W.jpg(Ci),定義為:

  1.png

  其中,0KVCQETVF5_J9P)82XEG{61.jpg表示某個(gè)罪犯ik的嚴(yán)重程度,即犯罪集團(tuán)Ci成員在t時(shí)刻的犯罪行為。

  設(shè)i1,i2,…,in是Ci在時(shí)間t的犯罪成員,犯罪集團(tuán)C在時(shí)間t1到時(shí)間t2的活動(dòng)記為@FAN%DBWVKKU{COH0@_BX~8.png,計(jì)算公式如下:

  2.png

  其中,|Rt1(Ci)|和|Rt2(Ci)|分別表示犯罪集團(tuán)Ci在時(shí)刻t1和時(shí)刻t2共犯次數(shù)。

  為了確定發(fā)現(xiàn)罪犯組是否被認(rèn)為是有組織犯罪集團(tuán),必須同時(shí)考慮犯罪活動(dòng)和犯罪行為,定義兩個(gè)閾值:$X54LDG@BZ~{)II~EUMPP%D.jpg表示犯罪活動(dòng)和XLKM7DZOXUSI)_WF6DSHZHE.jpg表示犯罪行為。如果0}{W0~`KSYY$6~X~(B8UJ7O.jpg(Ci)>$X54LDG@BZ~{)II~EUMPP%D.jpg,那么給定的犯罪集團(tuán)C就是活動(dòng)的犯罪集團(tuán)A;如果0}{W0~`KSYY$6~X~(B8UJ7O.jpg(Ci)>XLKM7DZOXUSI)_WF6DSHZHE.jpg,那么C就是一個(gè)嚴(yán)重犯罪集團(tuán)。

  2.3 有組織犯罪集團(tuán)演化模型

  這個(gè)模型需要確定原來(lái)的某個(gè)犯罪集團(tuán)已經(jīng)演變當(dāng)前的某個(gè)犯罪集團(tuán)。一個(gè)犯罪集團(tuán)的一個(gè)周期會(huì)出現(xiàn)5個(gè)階段:產(chǎn)生、分裂、合并、出現(xiàn)和終止[5]。為此,引入一個(gè)匹配的函數(shù)F:

  3.png

  其中,IM%FBF@(07JEV9BLPCZSO2E.png表示一個(gè)犯罪組織集合,2IM%FBF@(07JEV9BLPCZSO2E.png表示IM%FBF@(07JEV9BLPCZSO2E.png的冪集。給定一個(gè)有組織犯罪集團(tuán)Oit和有組織犯罪集團(tuán)集合IM%FBF@(07JEV9BLPCZSO2E.pngt+1,如果F(Oit,g)得出集團(tuán)Oit+1與Oit有最大的交集超過(guò)給定的閾值{AWDTO2HL]2LLVSUN78HLCH.png,形式定義如下:

  4.png

  這里兩個(gè)有組織犯罪集團(tuán)O,O′∈IM%FBF@(07JEV9BLPCZSO2E.png,P(O,O′)定義如下:

  5.png

  算法1 有組織犯罪集團(tuán)檢測(cè)

  輸入:

 ?。?)犯罪事件數(shù)據(jù)集;

 ?。?)Crime seriousness index(犯罪程度索引);

 ?。?)犯罪活動(dòng)和犯罪行為的閾值:α,β。

  輸出:有組織犯罪集團(tuán)O1t,O2t,…,Omt

 ?。?)/*數(shù)據(jù)準(zhǔn)備*/;

 ?。?)掃描在[t1,t2]時(shí)間之間每個(gè)犯罪事件集;

 ?。?)抽取共犯網(wǎng)絡(luò);

 ?。?)檢測(cè)犯罪組織C1t,C2t,…Cnt;

  (5)對(duì)每個(gè)犯罪組織Cit∈Ct做第(6)步和(7)步;

  (6)計(jì)算組織犯罪活動(dòng)閾值$5{GV$}`Q_RV{WGJI[_JOCY.png

 ?。?)計(jì)算組織犯罪行為閾值}{WY{%046O[S[]8F34GI6]V.png

  (8)對(duì)滿足閾值的犯罪組織標(biāo)識(shí)為有可能組織犯罪集團(tuán);

  (9)對(duì)每個(gè)犯罪組織候選集Oit,進(jìn)行第(10)步;

 ?。?0)評(píng)估出犯罪組織物質(zhì)利益;

 ?。?1)對(duì)有組織犯罪集團(tuán),O1t,O2t,…,Omt,應(yīng)用演變跟蹤模型。

3 實(shí)驗(yàn)結(jié)果

  3.1 犯罪數(shù)據(jù)集

  為了驗(yàn)證方法的有效性,實(shí)驗(yàn)數(shù)據(jù)采用加拿大不列顛哥倫比亞省arrest-data犯罪數(shù)據(jù)集[6],該數(shù)據(jù)集記錄了從2001-8-1至2006-7-31共5年的犯罪數(shù)據(jù)。

001.jpg

  圖1顯示了活躍罪犯組的數(shù)量隨著第1、2、3、4這4段時(shí)間觀察到的區(qū)別。值得注意的是,隨著時(shí)間的推移,活躍犯罪組的數(shù)量急劇下降。在a值較高時(shí)從一個(gè)時(shí)間段到下一個(gè)時(shí)間段連續(xù)活動(dòng)明顯可見(jiàn),這一發(fā)現(xiàn)印證了犯罪組織的短期合作的理論[7]。

  3.2 罪犯組演變

  因?yàn)椴恢赖谝徊揭郧暗臍v史時(shí)間和最后一次未來(lái)時(shí)間,在有限的可觀測(cè)時(shí)間跨度里對(duì)罪犯組的整個(gè)生命周期進(jìn)行量化工作非常困難[8]。

002.jpg

  在5個(gè)不同時(shí)間段各罪犯組的演化軌跡統(tǒng)計(jì)如圖2所示。匹配函數(shù)的閾值0.3適用于考慮幸存一組,值大于0.2和小于0.3分別適用于分裂和合并,組匹配閾值小于0.2被認(rèn)為是終止罪犯組。總體而言(平均而言),所有罪犯群體大約14%幸存,但分裂和合并事件很少發(fā)生,不到犯罪組的1%。大約88%的罪犯組被認(rèn)為是終止了,因?yàn)樵诮酉聛?lái)的時(shí)間并沒(méi)有觀察到他們的活動(dòng),所有組織中90%是新出現(xiàn)的犯罪組。

4 結(jié)論

  為提高有組織犯罪集團(tuán)證據(jù)計(jì)算效率,本文提出基于共犯網(wǎng)絡(luò)結(jié)構(gòu)分析技術(shù)。實(shí)驗(yàn)結(jié)果表明,雖然罪犯在犯罪集團(tuán)中的合作是連續(xù)的,但大多數(shù)犯罪組織的活動(dòng)不會(huì)持續(xù)很長(zhǎng)時(shí)間。另外,活躍的犯罪組織通常有更多的外圍,相比之下嚴(yán)重的犯罪組織外圍成員偏少,這一發(fā)現(xiàn)表明,嚴(yán)重犯罪組織的運(yùn)作主要來(lái)自他們的內(nèi)核成員。在未來(lái)的工作中將探索有組織犯罪的組織結(jié)構(gòu),區(qū)分層次組織和分散組織,并分析這些結(jié)構(gòu)演變軌跡。

參考文獻(xiàn)

  [1] MCGLOIN J M, NGUYEN H. The importance of studying co-offending networks for criminological theory and  policy[C]. Proceedings of Third Annual Illicit Networks Workshop, Montréal, Québec, October 2011.

  [2] KIM M S, HAN J W. A particle-and-density based evolutionary clustering method for dynamic networks[J]. Proceedings of Very Large Data Base Endowment, 2009, 2(1): 622-633.

  [8] KIM K, MCKAY R, MOON B R. Multiobjective evolutionary algorithms for dynamic social network clustering[C].  Proceedings of the 12th Conf.Genetic and Evolutionary Computation, 2010:1179-1186.

  [3] SATULURI V, PARTHASARATHY S. Scalable graph clustering using stochastic flows: applications to community discovery[C]. KDD, Paris, France, 2009:737-746.

  [4] INOKUCHI A, WASHIO T. Mining frequent graph sequence patterns induced by vertices[C]. Proceedings of the SIAM Int′1 Conference on Data Mining, 2010:466-477.

  [5] MICHELLE G, NEWMAN M E J. Community structure in social and biological networks[J]. PNAS, 2002,99(12):7821-7826.

  [6] TAYEBI M A, GL?魧SSER U. Organized crime structures in co-offending networks[C]. Proceedings of International Conference on Social Computing and its Applications, Sydney, Australia, Dec. 2011.

  [7] NGUYEN N P,DINH T N,Ying Xuan, et al. Adaptive algorithms for detecting community structure in dynamic social networks[C]. Shanghai: Proceedings of IEEE Infocom′11, 2011:2282-2290.

  [8] BACKSTROM L, HUTTENLOCHER D, KLEINBERG J, et al. Group formation in large social networks: membership, growth and evolution[C]. Proceedings of the KDD, 2006: 44-54.


此內(nèi)容為AET網(wǎng)站原創(chuàng),未經(jīng)授權(quán)禁止轉(zhuǎn)載。