| 基于Hadoop集群的多表并行關(guān)聯(lián)算法及應(yīng)用 | |
| 所屬分類:技術(shù)論文 | |
| 上傳者:aet | |
| 文檔大小:362 K | |
| 所需積分:0分積分不夠怎么辦? | |
| 文檔介紹: 針對(duì)因特網(wǎng)環(huán)境下并行數(shù)據(jù)庫(kù)實(shí)現(xiàn)多個(gè)大數(shù)據(jù)表關(guān)聯(lián)存在的計(jì)算瓶頸,基于 Hadoop集群設(shè)計(jì)了一個(gè)并行關(guān)聯(lián)多個(gè)大數(shù)據(jù)表的簡(jiǎn)便算法MR_Join。以商業(yè)網(wǎng)站凡客誠(chéng)品的銷售數(shù)據(jù)為例進(jìn)行實(shí)驗(yàn),驗(yàn)證算法的可行性并做出應(yīng)用實(shí)例。實(shí)驗(yàn)結(jié)果表明,MR_Join算法可以有效地實(shí)現(xiàn)大數(shù)據(jù)表的快速關(guān)聯(lián),具有顯著的并行效率。 | |
| 現(xiàn)在下載 | |
| VIP會(huì)員,AET專家下載不扣分;重復(fù)下載不扣分,本人上傳資源不扣分。 | |
Copyright ? 2005-2024 華北計(jì)算機(jī)系統(tǒng)工程研究所版權(quán)所有 京ICP備10017138號(hào)-2