不可靠語料庫的提純及詞權(quán)度量指標(biāo)IDF的改進(jìn)
所屬分類:技術(shù)論文
上傳者:aet
文檔大?。?span>447 K
所需積分:0分積分不夠怎么辦?
文檔介紹:不良短信的泛濫嚴(yán)重影響了社會風(fēng)氣,干擾了人們正常的生活秩序,研發(fā)不良短信過濾技術(shù)具有相當(dāng)高的實用價值。研究了文本分類中的兩個問題,可應(yīng)用于不良短信過濾。其一是應(yīng)用聚類方法進(jìn)行不可靠語料集的提純,實驗表明,該方法對不可靠數(shù)據(jù)的提純效果比較明顯;其二是關(guān)于IDF詞權(quán)度量指標(biāo)的一點改進(jìn)。
現(xiàn)在下載
VIP會員,AET專家下載不扣分;重復(fù)下載不扣分,本人上傳資源不扣分。