基于Lucene的中文是非問(wèn)答系統(tǒng)的設(shè)計(jì)與實(shí)現(xiàn)
所屬分類:技術(shù)論文
上傳者:aetmagazine
文檔大小:550 K
標(biāo)簽: 是非問(wèn)答 Lucene TextRank
所需積分:0分積分不夠怎么辦?
文檔介紹:針對(duì)中文是非問(wèn)句,設(shè)計(jì)并實(shí)現(xiàn)了基于Lucene的問(wèn)答系統(tǒng),主要包括問(wèn)句預(yù)處理、索引創(chuàng)建和答案整理三部分。問(wèn)句預(yù)處理部分,引入句法成分權(quán)重和命名實(shí)體權(quán)重改進(jìn)TextRank算法,得到一種提取問(wèn)句核心詞的方法。在索引創(chuàng)建部分,針對(duì)本地的多源數(shù)據(jù)進(jìn)行文檔融合創(chuàng)建索引,降低數(shù)據(jù)多樣性帶來(lái)的復(fù)雜度。在答案整理部分,對(duì)查詢索引結(jié)果進(jìn)行答案判決,輸出肯定或否定含義的答案。實(shí)驗(yàn)結(jié)果表明,數(shù)據(jù)融合能有效減少索引創(chuàng)建耗時(shí),改進(jìn)TextRank的核心詞提取方法準(zhǔn)確率明顯高于TextRank,系統(tǒng)具有較為不錯(cuò)的性能。
現(xiàn)在下載
VIP會(huì)員,AET專家下載不扣分;重復(fù)下載不扣分,本人上傳資源不扣分。