基于爬蟲和TFIDF-NB算法的微博情感分析
所屬分類:技術論文
上傳者:aetmagazine
文檔大小:544 K
標簽: 微博輿情 網絡爬蟲 情感分類
所需積分:0分積分不夠怎么辦?
文檔介紹:針對微博網絡輿情信息量大、無規(guī)則、隨機變化的特點,提出TFIDF-NB(Term Frequency Inverse Document Frequency-Naive Bayes)用于微博情感分析,設計與實現(xiàn)了一個基于Scrapy框架的微博評論爬蟲,將某熱點事件的若干條微博評論進行爬取并存進數據庫,然后進行文本分割、LDA(Latent Dirichlet Allocation)主題聚類,最后使用TFIDF-NB算法進行情感分類。實驗結果表明,TFIDF-NB算法平均準確率高于線性支持向量機算法和K近鄰算法,在精確率和召回率方面高于K近鄰算法,具有較好的情感分類效果。
現(xiàn)在下載
VIP會員,AET專家下載不扣分;重復下載不扣分,本人上傳資源不扣分。