| 基于機器學(xué)習(xí)的網(wǎng)頁正文提取方法 | |
| 所屬分類:技術(shù)論文 | |
| 上傳者:aet | |
| 文檔大小:226 K | |
| 所需積分:0分積分不夠怎么辦? | |
| 文檔介紹:先將網(wǎng)頁轉(zhuǎn)換為規(guī)范的DOM樹,然后計算每行文本的文本密度、與標(biāo)題相關(guān)度等值,并將其作為輸入?yún)?shù)利用BP神經(jīng)網(wǎng)絡(luò)進行訓(xùn)練,進而形成抽取規(guī)則,最后通過實驗驗證該方法的可行性。 | |
| 現(xiàn)在下載 | |
| VIP會員,AET專家下載不扣分;重復(fù)下載不扣分,本人上傳資源不扣分。 | |
Copyright ? 2005-2024 華北計算機系統(tǒng)工程研究所版權(quán)所有 京ICP備10017138號-2