基于HybridDL模型的文本相似度檢測方法
所屬分類:技術論文
上傳者:aetmagazine
文檔大小:440 K
標簽: Doc2Vec 潛在狄利克雷分布 文本表示
所需積分:0分積分不夠怎么辦?
文檔介紹:為了提高文本相似度檢測算法的準確度,提出一種結合潛在狄利克雷分布(Latent Dirichlet Allocation,LDA)與Doc2Vec模型的文本相似度檢測方法,并把該算法得到的模型命名為HybridDL模型。該算法通過Doc2Vec對文檔訓練得到文檔向量,再利用LDA模型得到文檔主題與各個主題下特征詞出現的概率,對文檔中各主題及特征詞計算概率加權和,映射到Doc2Vec文檔向量中。實驗結果表明,新算法模型比傳統(tǒng)的Doc2Vec模型對相似文本的判斷更加敏感,在文本相似度檢測上具有更高的準確度。
現在下載
VIP會員,AET專家下載不扣分;重復下載不扣分,本人上傳資源不扣分。