123,123

基于非加权图的大型社会网络检测算法研究

2018年电子技术应用第2期

崔俊明1，李勇1，李跃新2

1.河北地质职工大学，河北石家庄050081；2.湖北大学计算机科学与工程学院，湖北武汉430000

摘要： 社区检测和划分已经成为大规模社会网络中一个非常关键的问题。然而，大多数现有的算法受限于计算成本，其适用性十分有限。为了提高社区划分质量和计算效率，提出了一种基于非加权图的社区网络检测算法。首先,算法采用两个新的参数来度量社区并实现社区检测，即聚类系数和共同的邻居相似性，并通过理论分析和公式推导证明其有效性。最后采用真实社会网络数据集进行了大量的模拟，实验结果表明,与传统的生成树算法以及CBCD算法相比，提出的方法更加有效，且计算运行时间具有线性复杂度，适用于大规模社会网络的社区检测。

關(guān)鍵詞： 社会网络社区检测非加权图模块性聚类系数

中圖分類號(hào)： TP393
文獻(xiàn)標(biāo)識(shí)碼： A
DOI：10.16157/j.issn.0258-7998.174204
中文引用格式： 崔俊明，李勇，李躍新. 基于非加權(quán)圖的大型社會(huì)網(wǎng)絡(luò)檢測(cè)算法研究[J].電子技術(shù)應(yīng)用，2018，44(2)：80-83，87.
英文引用格式： Cui Junming，Li Yong，Li Yuexin. Research on a large scale community detection algorithm based on non-weighted graph[J]. Application of Electronic Technique，2018，44(2)：80-83，87.

Research on a large scale community detection algorithm based on non-weighted graph

Cui Junming1，Li Yong1，Li Yuexin2

1.Hebei Vocational College of Geology，Shijiazhuang 050081，China； 2.School of Computer Science and Engineering，Hubei University，Wuhan 430000，China

Abstract： Community detection and partitioning has become a critical issue in large-scale social networks. However, the applicability of most existing methods is limited by computational costs. In order to improve the quality of community division and calculation efficiency, a community detection algorithm based on un-weighted graphs is proposed. This algorithm uses two parameters to measure the community to achieve community discovery, which is clustering coefficient and common neighbor similarity, and its effectiveness is proved by the academic formula. Experimental analysis is carried out using a real social network dataset, and compared with other algorithms proposed two methods. The experimental results show that the proposed method is more efficient and the computation time is linear. It is suitable for community detection in large-scale social networks.

Key words : social network；community detection；non-weighted graph；modularity；clustering coefficient

0 引言

近年來(lái)，隨著信息交互和數(shù)據(jù)共享的不斷增加，社交網(wǎng)絡(luò)的數(shù)量顯著提高。在分析此類網(wǎng)絡(luò)時(shí)，圖論提供了一個(gè)重要的建模模型。當(dāng)節(jié)點(diǎn)代表用戶，邊表示互聯(lián)時(shí)，可以將此類網(wǎng)絡(luò)定義為一張圖^[1-3]，該圖中的節(jié)點(diǎn)可以是直接或間接相連的。在分析社交網(wǎng)絡(luò)數(shù)據(jù)時(shí)，定義和計(jì)算社區(qū)是最關(guān)鍵的步驟。同時(shí),社區(qū)可以被看作是對(duì)整個(gè)網(wǎng)絡(luò)的概要表示(Summarization)，因此,在社區(qū)檢測(cè)中需要使用這種概要設(shè)計(jì)理念^[4]。

當(dāng)前對(duì)于社區(qū)網(wǎng)絡(luò)劃分研究已取得了很多研究成果，特別是社會(huì)網(wǎng)絡(luò)分析，但其仍然是一項(xiàng)具有挑戰(zhàn)性和吸引力的研究。因?yàn)樵诮o定的圖中進(jìn)行社區(qū)檢測(cè)，可以用于搜索潛在的合作者，用于優(yōu)化社會(huì)關(guān)系，或在不同的社區(qū)中搜索一個(gè)關(guān)鍵人物等^[5]。

基于圖論的原理，已經(jīng)提出了不少方法用來(lái)解決社區(qū)檢測(cè)的問(wèn)題，如譜分析方法^[6]，其代表了一種非常特殊的社區(qū)檢測(cè)技術(shù)。這種方法的特殊性表現(xiàn)在其分類性能上，并以拉普拉斯矩陣的特征向量為基礎(chǔ)。使用這樣一個(gè)矩陣在時(shí)間和內(nèi)存方面需要付出很高的代價(jià)。此外，在時(shí)間復(fù)雜度上，k個(gè)特征向量的計(jì)算復(fù)雜度為O(n³)。雖然，很容易計(jì)算出給定矩陣的特征向量，但是不方便計(jì)算大型拉普拉斯矩陣。這個(gè)方法的第二個(gè)缺點(diǎn)是假設(shè)社區(qū)的數(shù)量必須是已知的，但是在實(shí)際的大型社交網(wǎng)絡(luò)中很難獲得這一信息。文獻(xiàn)[7]提出了一種基于聚類概念的社區(qū)檢測(cè)方法。這種技術(shù)的優(yōu)點(diǎn)是它能夠提供豐富的結(jié)果，使用這種方法發(fā)現(xiàn)的社區(qū)節(jié)點(diǎn)之間相互連接非常緊密。然而，在時(shí)間和內(nèi)存方面代價(jià)很高，而且非常復(fù)雜。BASUCHOWDHURI P等人^[8]提出了一種基于最大生成樹(shù)的并發(fā)方法。該方法使用共同鄰居的相似性作為邊的權(quán)重。將每個(gè)節(jié)點(diǎn)都與鄰居相連接，共享了大量的共同鄰居，從而建造了最大生成樹(shù)。與文獻(xiàn)[7]的方法相比較，這種方法在占用內(nèi)存方面效果較好，但是其時(shí)間運(yùn)行成本還是較高。文獻(xiàn)[9]提出了一種基于節(jié)點(diǎn)和邊的檢測(cè)社區(qū)方法，可廣泛用于查找網(wǎng)橋和服務(wù)供應(yīng)商。但是，對(duì)于大型的社交網(wǎng)絡(luò)而言，這些方法的適用性均較差。

在以上文獻(xiàn)提出的方法中，運(yùn)行時(shí)間的復(fù)雜度和內(nèi)存的使用成本問(wèn)題仍然存在。因此，它們的適用性具有一定的局限。為了解決這些問(wèn)題，本文提出了一種有效的社區(qū)檢測(cè)算法方法，該方法基于聚類系數(shù)和共同鄰居指標(biāo)。實(shí)驗(yàn)結(jié)果表明，在大規(guī)模社會(huì)網(wǎng)絡(luò)數(shù)據(jù)集中提出的方法提供了較高質(zhì)量的社區(qū)劃分結(jié)果，并具備線性運(yùn)行時(shí)間的復(fù)雜度特性。

1 模型和指標(biāo)定義

1.1 問(wèn)題描述

在一個(gè)網(wǎng)絡(luò)模型中，一張圖G由有限集合(V，E)構(gòu)成，其中V表示節(jié)點(diǎn)集合(網(wǎng)絡(luò)的用戶)，E表示邊或節(jié)點(diǎn)之間相互聯(lián)系的集合，V={v_i|i=1，…，n}，E={e_ij|v_i，v_j∈V}，n=|V|為節(jié)點(diǎn)總數(shù)，m=|E|為邊的總數(shù)。此外，當(dāng)圖G′中節(jié)點(diǎn)的集合E′和邊的集合V′都是圖G中V和E的子集時(shí)，G′表示G的子圖。社交網(wǎng)絡(luò)可以建模為一個(gè)有向圖或一個(gè)無(wú)向圖，其中節(jié)點(diǎn)表示個(gè)體，邊表示節(jié)點(diǎn)之間的關(guān)系。本文重點(diǎn)是在社交網(wǎng)絡(luò)中進(jìn)行社區(qū)檢測(cè)，它可以用一個(gè)無(wú)向圖來(lái)表示。這個(gè)社區(qū)可以被定義為節(jié)點(diǎn)的一個(gè)子集，與網(wǎng)絡(luò)的其他節(jié)點(diǎn)相比較，這些節(jié)點(diǎn)更有可能連接在一起。圖1顯示了一張具有3個(gè)社區(qū)的信息圖。

1.2 采用的度量標(biāo)準(zhǔn)

本文采用共同鄰居的相似性來(lái)衡量?jī)蓚€(gè)節(jié)點(diǎn)的相似度，這意味著，當(dāng)此度量指標(biāo)較高時(shí)，節(jié)點(diǎn)更有可能是在同一個(gè)社區(qū)內(nèi)。相比應(yīng)用平均聚類系數(shù)來(lái)衡量集群的方法，本文提出的結(jié)果準(zhǔn)確性更高。本文采用了兩種度量標(biāo)準(zhǔn)：

(1)共同鄰居的相似性：在參考文獻(xiàn)[8]和[10]中使用共同的鄰居來(lái)定義節(jié)點(diǎn)之間的相似性。如果兩個(gè)節(jié)點(diǎn)有大量的共同鄰居，那么它們更相似。這個(gè)指標(biāo)由以下公式進(jìn)行計(jì)算。

式中，A表示鄰居相似性。

(2)聚類系數(shù)：采用此類度量標(biāo)準(zhǔn)的目的是評(píng)估節(jié)點(diǎn)在一個(gè)集群中的集群化趨勢(shì)。其中最受歡迎的一個(gè)測(cè)量標(biāo)準(zhǔn)是模塊性最大化，但是它存在兩個(gè)問(wèn)題：①它合并小型子圖，當(dāng)分辨率較低時(shí)，它占主導(dǎo)地位；②它分裂大型子圖，當(dāng)分辨率較高時(shí)，它占主導(dǎo)地位。另一種被廣泛使用的度量稱為聚類系數(shù)^[10-11]，在一個(gè)社區(qū)內(nèi)提供了一個(gè)強(qiáng)大的鄰居結(jié)構(gòu)。這項(xiàng)標(biāo)準(zhǔn)被廣泛應(yīng)用于社會(huì)網(wǎng)絡(luò)分析中，它被定義為封閉的三聯(lián)體(三角形)數(shù)量和給定圖的三聯(lián)體數(shù)量之間的比率，式(2)給出了其定義^[2]：

式中，C表示聚類系數(shù)。

2 提出的權(quán)重系數(shù)

本研究的目的是研究社區(qū)之間的邊所存在的一些性質(zhì)，最后提取新的社區(qū)。

引理1：假設(shè)G是一張無(wú)向非加權(quán)圖，E表示G的邊集合，V表示G的節(jié)點(diǎn)集合，得到如下公式：

其中，L表示節(jié)點(diǎn)vi鄰居之間的關(guān)聯(lián)數(shù)量。

論證：假設(shè)G為一張圖，僅僅包含一個(gè)三角形T，本文假設(shè)它由3個(gè)節(jié)點(diǎn)組成(v₁，v₂，v₃)。

如果計(jì)算L(v₁)，則發(fā)現(xiàn)一對(duì)關(guān)聯(lián)(v₂和v₃)；如果計(jì)算v₂的這一度量，則發(fā)現(xiàn)v₁和v₃之間的關(guān)聯(lián)；最后計(jì)算v₃，得到了v₁和v₂之間的關(guān)聯(lián)。之后，如果計(jì)算總和L(v₁)+L(v₂)+L(v₃)，那么得到的結(jié)果是3對(duì)關(guān)聯(lián)。總之，當(dāng)本文計(jì)算一張圖中每個(gè)節(jié)點(diǎn)與其鄰居之間的關(guān)聯(lián)數(shù)量時(shí)，對(duì)同一個(gè)三角形計(jì)算了3次。

圖2闡釋了一張無(wú)向圖，由7個(gè)節(jié)點(diǎn)和10條邊構(gòu)成。該圖由3個(gè)三角形組成。當(dāng)本文計(jì)算這7個(gè)節(jié)點(diǎn)鄰居之間的關(guān)聯(lián)數(shù)量總和時(shí)，得到表1所示結(jié)果。

根據(jù)這些結(jié)果，3個(gè)三角形共計(jì)算了3次，這意味著3×(在G₁中的三角形數(shù)量)等于在G₁中每個(gè)節(jié)點(diǎn)鄰居之間的關(guān)聯(lián)數(shù)量總和。

性質(zhì)1：運(yùn)用式(1)，本文可以得出結(jié)論：兩個(gè)社區(qū)之間的一條邊的節(jié)點(diǎn)是不同的。它們沒(méi)有或僅有少數(shù)幾個(gè)共同的鄰居。

性質(zhì)2：本文研究的重點(diǎn)在于在社區(qū)內(nèi)最大化聚類系數(shù)(式(2))。為了達(dá)到這一目標(biāo)，三角形的數(shù)量以及式(4)中的度量必須盡可能地最大化。實(shí)際上，在一個(gè)社區(qū)中每個(gè)節(jié)點(diǎn)鄰居之間的關(guān)聯(lián)數(shù)量必須最大化。這意味著對(duì)于具有較高聚類系數(shù)(大量三角形)的兩個(gè)社區(qū)之間的節(jié)點(diǎn)，其鄰居之間的關(guān)聯(lián)數(shù)量較大。

引理2：假設(shè)G是一張無(wú)向非加權(quán)的圖。在兩個(gè)社區(qū)之間一條邊e(v_i，v_j)的節(jié)點(diǎn)沒(méi)有或有幾個(gè)共同鄰居，節(jié)點(diǎn)v_i和v_j具有較高的度量L。

論據(jù)：通過(guò)使用性質(zhì)1和性質(zhì)2獲得引理2。

本文將節(jié)點(diǎn)鄰居之間的關(guān)聯(lián)數(shù)量標(biāo)準(zhǔn)化。由以下方程來(lái)定義標(biāo)準(zhǔn)化：

式中，B表示的是節(jié)點(diǎn)鄰居關(guān)聯(lián)數(shù)據(jù)標(biāo)準(zhǔn)。

通過(guò)式(1)可知節(jié)點(diǎn)之間共同鄰居的數(shù)量。從引理2可以得知，本文的目標(biāo)是找到這些邊e(v_i，v_j)，它們?cè)卩従觟和j之間的關(guān)聯(lián)數(shù)量較大(見(jiàn)式(5))，而在i和j之間的共同鄰居數(shù)量較少(見(jiàn)式(1))。因此，以這些邊為基礎(chǔ)，所提方法的目標(biāo)是找到度量W，W可以由如下公式定義：

3 本文提出的方法

在過(guò)去的幾年中，在社交網(wǎng)絡(luò)中進(jìn)行社區(qū)檢測(cè)已經(jīng)吸引了很多研究人員，但它仍是一項(xiàng)具有挑戰(zhàn)性的任務(wù)。事實(shí)上，大多數(shù)現(xiàn)有方法的適用性受限于它們的計(jì)算成本。本文提出的方法通過(guò)刪除在未加權(quán)圖中的社區(qū)之間的邊，從社交網(wǎng)絡(luò)中找到社區(qū)。本文假設(shè)一個(gè)社區(qū)必須至少有4個(gè)節(jié)點(diǎn)，如參考文獻(xiàn)[2]所使用的社區(qū)。刪除邊是為了最小化每條邊節(jié)點(diǎn)之間的共同鄰居數(shù)量(少于共同鄰居的20%)，并且提高社區(qū)劃分的質(zhì)量。下面介紹算法步驟和實(shí)例分析。

3.1 算法描述

本文提出的方法使用了以下步驟：

輸入：無(wú)向非加權(quán)的網(wǎng)絡(luò)G(V，E)

輸出：n個(gè)社區(qū)，G_s={G_s1，G_s2，…，G_sn}

(1)首先，本文計(jì)算在圖G中每個(gè)節(jié)點(diǎn)鄰居之間的關(guān)聯(lián)數(shù)量L(v_i)。然后，本文計(jì)算每條邊e共同聚類數(shù)量C，以及這條邊的節(jié)點(diǎn)之間鄰居U的結(jié)合情況。之后，設(shè)L=L(v_i)+L(v_j)和S=|鄰居(v_i)+鄰居(v_j)|，其中v_i、v_j表示由邊e相連的兩個(gè)節(jié)點(diǎn)。

(2)本文使用W在表格T中以遞減順序?qū)呥M(jìn)行分類。一旦這個(gè)操作完成，就按照在T中的順序找到第一條邊e(v_i，v_j)。如果在刪除這條邊之后，v_i鄰居的數(shù)量和v_j鄰居的數(shù)量均會(huì)超過(guò)0，那么將這條邊從G中刪除，否則不刪除。本文需要對(duì)T中的其他邊重復(fù)測(cè)試，直到表格T是空為止。

(3)本文應(yīng)用了一個(gè)社區(qū)必須至少包含4個(gè)節(jié)點(diǎn)的假設(shè)。為了確保該假設(shè)成立，需要把每張少于4個(gè)節(jié)點(diǎn)的子圖G′加入到在步驟(2)中已經(jīng)被分離的最后一張子圖中。

3.2 實(shí)例分析

設(shè)一個(gè)網(wǎng)絡(luò)N1結(jié)構(gòu)如圖3所示，圖4體現(xiàn)了提出的方法應(yīng)用于網(wǎng)絡(luò)N₁的結(jié)果。首先，運(yùn)用步驟(1)在未加權(quán)的圖中計(jì)算每條邊的W值。然后，本文選擇符合以下條件的邊e(v_i，v_j)：在節(jié)點(diǎn)v_i和v_j之間共同鄰居的數(shù)量較低(少于20%)。

本文運(yùn)用W值對(duì)這些邊進(jìn)行分類，按照遞減順序?qū)⑦@些邊儲(chǔ)存在表格T中。重復(fù)步驟(2)中邊的刪除操作，直到為空白為止。注意，大小小于2的群組不可以被分為獨(dú)立的群組。

最后，本文將少于4個(gè)節(jié)點(diǎn)的每張子圖G′加入到已經(jīng)被分離的最后一張子圖中。

4 實(shí)驗(yàn)結(jié)果與分析

為了驗(yàn)證本算法的有效性，采用真實(shí)的較大規(guī)模社會(huì)網(wǎng)絡(luò)數(shù)據(jù)集進(jìn)行實(shí)驗(yàn)分析，并與生成樹(shù)算法^[8]、CBCD算法^[12]進(jìn)行比較分析。

實(shí)驗(yàn)環(huán)境中服務(wù)器設(shè)備參數(shù)為：Xeon E7-4820雙核處理器，2.5 GHz CPU頻率，16 GB內(nèi)存，Windows Server 2012系統(tǒng)。本文在核心圖社區(qū)檢測(cè)時(shí)采用GN算法(Girvan-Newman)。

本文采用模塊性Q函數(shù)^[13]來(lái)評(píng)價(jià)劃分出的模塊性，采用NMI^[13]來(lái)評(píng)價(jià)劃分結(jié)果的相似性，兩個(gè)評(píng)價(jià)指標(biāo)的數(shù)值越接近1，說(shuō)明算法劃分的效果和質(zhì)量越高。實(shí)驗(yàn)采用的4個(gè)較大社會(huì)網(wǎng)絡(luò)數(shù)據(jù)集的具體參數(shù)如表2所示。

4.1 結(jié)果分析

采用生成樹(shù)算法、CBCD算法和本文提出算法在以上4個(gè)社會(huì)網(wǎng)絡(luò)數(shù)據(jù)集上分別進(jìn)行了100次運(yùn)行測(cè)試，實(shí)驗(yàn)結(jié)果的平均指標(biāo)數(shù)據(jù)如表3所示。

通過(guò)表3可以看出，在Q函數(shù)指標(biāo)結(jié)果上，本文提出算法比其他兩種算法都表現(xiàn)更好，即社會(huì)發(fā)現(xiàn)更有效，更好地體現(xiàn)了社區(qū)結(jié)構(gòu)的劃分。在NMI指標(biāo)結(jié)果上，相比其他兩種算法，本文算法的數(shù)值更接近于1，即劃分結(jié)果和真實(shí)的劃分更相似。

從表4中可以看出，本文算法在4個(gè)社會(huì)網(wǎng)絡(luò)數(shù)據(jù)集上的運(yùn)行時(shí)間均比其他兩種算法少，即相比其他兩種算法，本算法具有更高的效率。

4.2 復(fù)雜度分析

該方法不是對(duì)所有的邊進(jìn)行分類，而僅僅對(duì)共同鄰居少于20%的邊進(jìn)行分類。例如，在Ca-CondMat網(wǎng)絡(luò)中，包含186 936條邊，本文僅僅對(duì)其中的67 297條邊進(jìn)行分類。同樣，本文在Cit-HepTh網(wǎng)絡(luò)中僅僅對(duì)352 807條邊中的176 403條邊進(jìn)行分類。

在步驟(2)中，本文對(duì)一部分共同鄰居少于20%的邊進(jìn)行分類。如果本文假設(shè)這些邊的數(shù)量為k，那么復(fù)雜度為O(k·log(k))，即具有線性復(fù)雜度。在本算法的實(shí)施過(guò)程中，運(yùn)用了python 3.3分類算法。如果假設(shè)在步驟(3)的操作之后發(fā)現(xiàn)子圖的數(shù)量為c，由少于4個(gè)節(jié)點(diǎn)構(gòu)成的子圖數(shù)量為c₁，那么復(fù)雜度為O(c₁·log²(c))。因?yàn)镺(c₁·log²(c))<<O(N)，根據(jù)所選擇的網(wǎng)絡(luò)，本文得到出算法的復(fù)雜度取決于O(k·log(k))。因此，本文提出的算法具有線性復(fù)雜度，即使在運(yùn)行時(shí)間最壞的情況下，復(fù)雜度為O(k·log(k))。

5 結(jié)束語(yǔ)

本文提出了一種適用于社交網(wǎng)絡(luò)的新型社區(qū)檢測(cè)新方法。該方法使用了兩個(gè)最重要的度量來(lái)定義社區(qū)：(1)聚類系數(shù)，用于定義社區(qū)的質(zhì)量；(2)屬于同一條邊的兩個(gè)節(jié)點(diǎn)共同鄰居的數(shù)量。實(shí)際上，與在不同社區(qū)中的兩個(gè)節(jié)點(diǎn)相比，在同一個(gè)社區(qū)中的兩個(gè)節(jié)點(diǎn)具有的共同鄰居數(shù)量較高?；谶@些度量，本文推導(dǎo)出一個(gè)公式，允許在社區(qū)之間查找邊。在這個(gè)迭代的算法中，運(yùn)用一些查找社區(qū)的標(biāo)準(zhǔn)來(lái)刪除邊。最后，實(shí)驗(yàn)結(jié)果表明，與傳統(tǒng)的算法相比，本文提出的方法提供的網(wǎng)絡(luò)數(shù)據(jù)集合劃分不但模塊性高，NMI指標(biāo)和運(yùn)行效率也非常高。此外，該方法的運(yùn)行時(shí)間具有線性復(fù)雜度，由此可以應(yīng)用于大型的社交網(wǎng)絡(luò)中。

參考文獻(xiàn)

[1] JIN J.Fast community detection by SCORE[J].Annals of Statistics，2014，43(2)：672-674.

[2] LI Z，ZHANG S，ZHANG X.Mathematical model and algorithm for link community detection in bipartite networks[J].American Journal of Operations Research，2015，5(5)：421-434.

[3] SONG X，GENG Y.Distributed community detection optimization algorithm for complex networks[J].Journal of Networks，2014，9(10)：2758-2765.

[4] 張華健，王有權(quán)，伍之昂，等.基于局部緊耦合結(jié)構(gòu)的模塊性優(yōu)化社區(qū)檢測(cè)方法[J].東南大學(xué)學(xué)報(bào)(自然科學(xué)版)，2014，44(3)：504-509.

[5] 吳大鵬，向小華，王汝言，等.節(jié)點(diǎn)歸屬性動(dòng)態(tài)估計(jì)的機(jī)會(huì)網(wǎng)絡(luò)社區(qū)檢測(cè)策略[J].計(jì)算機(jī)工程與設(shè)計(jì)，2012，33(10)：3673-3677.

[6] 安晶，徐森.基于譜聚類的動(dòng)態(tài)網(wǎng)絡(luò)社區(qū)演化分析算法[J].信息與控制，2015，44(2)：197-202.

[7] 龔尚福，陳婉璐，賈澎濤.層次聚類社區(qū)發(fā)現(xiàn)算法的研究[J].計(jì)算機(jī)應(yīng)用研究，2013，30(11)：3216-3220.

[8] BASUCHOWDHURI P，ROY R，ANAND S，et al.Spanning tree-based fast community detection methods in social networks[J].Innovations in Systems and Software Engineering，2015，11(3)：177-186.

[9] SANLI C，LAMBIOTTE R.Local variation of hashtag spike trains and popularity in Twitter[J].Plos One，2015，10(7)：3-14.

[10] AGGARWAL C C，XIE Y，YU P S.A framework for dynamic link prediction in heterogeneous networks[J].Statistical Analysis & Data Mining the Asa Data Science Journal，2014，7(1)：14-33.

[11] 許鵬遠(yuǎn)，黨延忠.基于聚類系數(shù)的推薦算法[J].計(jì)算機(jī)應(yīng)用研究，2016，33(3)：654-656.

[12] 張新猛，蔣盛益.基于核心圖增量聚類的復(fù)雜網(wǎng)絡(luò)劃分算法[J].自動(dòng)化學(xué)報(bào)，2013，39(7)：1117-1125.

[13] 林友芳，王天宇，唐銳，等.一種有效的社會(huì)網(wǎng)絡(luò)社區(qū)發(fā)現(xiàn)模型和算法[J].計(jì)算機(jī)研究與發(fā)展，2012，49(2)：337-345.

原創(chuàng)聲明：此內(nèi)容為AET網(wǎng)站原創(chuàng)，未經(jīng)授權(quán)禁止轉(zhuǎn)載。

相關(guān)內(nèi)容