一種基于狀態(tài)預(yù)測(cè)的多線程數(shù)據(jù)過(guò)濾算法
所屬分類:技術(shù)論文
上傳者:wwei
文檔大小:3605 K
標(biāo)簽: 正則表達(dá)式匹配 狀態(tài)預(yù)測(cè) 數(shù)據(jù)過(guò)濾
所需積分:0分積分不夠怎么辦?
文檔介紹:數(shù)據(jù)過(guò)濾算法在大數(shù)據(jù)處理領(lǐng)域有著重要的作用?;谡齽t表達(dá)式匹配技術(shù)的數(shù)據(jù)過(guò)濾算法憑借強(qiáng)大的特征表達(dá)能力適合于處理大規(guī)模復(fù)雜數(shù)據(jù)。然而,傳統(tǒng)的正則表達(dá)式匹配過(guò)程為串行匹配,造成性能低,無(wú)法滿足現(xiàn)代數(shù)據(jù)處理的需求。針對(duì)傳統(tǒng)正則表達(dá)式匹配性能低的問(wèn)題,提出一種基于多線程和狀態(tài)預(yù)測(cè)的正則表達(dá)式加速匹配算法,稱之為μFA:基于向量指令執(zhí)行字符值比較,獲取可直接跳過(guò)的信任字符數(shù)。同時(shí),基于多線程加速和狀態(tài)猜測(cè)技術(shù),實(shí)現(xiàn)字符串的分段匹配處理,通過(guò)圈定字符危險(xiǎn)區(qū)域,研判各分段最終匹配結(jié)果的正確性。實(shí)驗(yàn)結(jié)果表明,μFA算法的吞吐率是原始DFA算法的10.12~91.36倍、ßFA算法的1.08~2.97倍。
現(xiàn)在下載
VIP會(huì)員,AET專家下載不扣分;重復(fù)下載不扣分,本人上傳資源不扣分。