一種用于大規(guī)模數(shù)據(jù)集的決策樹(shù)采樣策略
所屬分類(lèi):技術(shù)論文
上傳者:aet
文檔大小:203 K
所需積分:0分積分不夠怎么辦?
文檔介紹:為提高大規(guī)模數(shù)據(jù)集生成樹(shù)的準(zhǔn)確率,提出一種預(yù)生成一棵基于這個(gè)數(shù)據(jù)集的決策樹(shù),采用廣度優(yōu)先遍歷將其劃分為滿足預(yù)定義的限制的數(shù)據(jù)集,再對(duì)各數(shù)據(jù)集按照一定比例進(jìn)行隨機(jī)采樣,最后將采樣結(jié)果整合為目標(biāo)數(shù)據(jù)集的數(shù)據(jù)采樣方法.通過(guò)對(duì)一UCI數(shù)據(jù)集進(jìn)行采樣,并用現(xiàn)有決策樹(shù)算法實(shí)驗(yàn)證明,該采樣方法優(yōu)于傳統(tǒng)隨機(jī)采樣方法,基于該采樣方法的生成樹(shù)準(zhǔn)確率有所提高.
現(xiàn)在下載
VIP會(huì)員,AET專(zhuān)家下載不扣分;重復(fù)下載不扣分,本人上傳資源不扣分。