基于Hadoop集群的多表并行關(guān)聯(lián)算法及應(yīng)用
所屬分類:技術(shù)論文
上傳者:aet
文檔大小:362 K
所需積分:0分積分不夠怎么辦?
文檔介紹: 針對(duì)因特網(wǎng)環(huán)境下并行數(shù)據(jù)庫(kù)實(shí)現(xiàn)多個(gè)大數(shù)據(jù)表關(guān)聯(lián)存在的計(jì)算瓶頸,基于 Hadoop集群設(shè)計(jì)了一個(gè)并行關(guān)聯(lián)多個(gè)大數(shù)據(jù)表的簡(jiǎn)便算法MR_Join。以商業(yè)網(wǎng)站凡客誠(chéng)品的銷售數(shù)據(jù)為例進(jìn)行實(shí)驗(yàn),驗(yàn)證算法的可行性并做出應(yīng)用實(shí)例。實(shí)驗(yàn)結(jié)果表明,MR_Join算法可以有效地實(shí)現(xiàn)大數(shù)據(jù)表的快速關(guān)聯(lián),具有顯著的并行效率。
現(xiàn)在下載
VIP會(huì)員,AET專家下載不扣分;重復(fù)下載不扣分,本人上傳資源不扣分。