一種基于狀態(tài)預測的多線程數(shù)據(jù)過濾算法
所屬分類:技術論文
上傳者:wwei
文檔大?。?span>3605 K
標簽: 正則表達式匹配 狀態(tài)預測 數(shù)據(jù)過濾
所需積分:0分積分不夠怎么辦?
文檔介紹:數(shù)據(jù)過濾算法在大數(shù)據(jù)處理領域有著重要的作用?;谡齽t表達式匹配技術的數(shù)據(jù)過濾算法憑借強大的特征表達能力適合于處理大規(guī)模復雜數(shù)據(jù)。然而,傳統(tǒng)的正則表達式匹配過程為串行匹配,造成性能低,無法滿足現(xiàn)代數(shù)據(jù)處理的需求。針對傳統(tǒng)正則表達式匹配性能低的問題,提出一種基于多線程和狀態(tài)預測的正則表達式加速匹配算法,稱之為μFA:基于向量指令執(zhí)行字符值比較,獲取可直接跳過的信任字符數(shù)。同時,基于多線程加速和狀態(tài)猜測技術,實現(xiàn)字符串的分段匹配處理,通過圈定字符危險區(qū)域,研判各分段最終匹配結果的正確性。實驗結果表明,μFA算法的吞吐率是原始DFA算法的10.12~91.36倍、ßFA算法的1.08~2.97倍。
現(xiàn)在下載
VIP會員,AET專家下載不扣分;重復下載不扣分,本人上傳資源不扣分。