基于社區(qū)增量自適應(yīng)爬蟲研究
所屬分類:技術(shù)論文
上傳者:aet
文檔大小:290 K
所需積分:0分積分不夠怎么辦?
文檔介紹:在分析傳統(tǒng)的網(wǎng)絡(luò)蜘蛛搜索特點的基礎(chǔ)上,充分利用Web資源分布的特點,提出了基于在線增量自適應(yīng)算法的搜索策略.該算法一方面避免了過早陷入Web搜索最優(yōu)子空間的陷阱;另一方面不斷對爬蟲數(shù)據(jù)庫更新,以提高其對鏈接主題的判斷能力.通過對四所著名大學(xué)計算機網(wǎng)站做的搜索實驗,表明新的算法可以有效地提高網(wǎng)絡(luò)蜘蛛的搜索性能.
現(xiàn)在下載
VIP會員,AET專家下載不扣分;重復(fù)下載不扣分,本人上傳資源不扣分。