ßFA:一種基于向量指令集的高性能數(shù)據(jù)處理算法
所屬分類:技術(shù)論文
上傳者:wwei
文檔大?。?span>3357 K
標簽: 正則表達式匹配 向量指令集 高性能數(shù)據(jù)處理
所需積分:0分積分不夠怎么辦?
文檔介紹:正則表達式匹配技術(shù)在數(shù)據(jù)清洗、解析提取等數(shù)據(jù)處理任務(wù)方面發(fā)揮重大作用。然而,由于匹配過程中存在數(shù)據(jù)強依賴關(guān)系和內(nèi)存訪問不可預(yù)測等問題,造成匹配性能較低。針對此問題,提出一種基于向量指令集的高性能正則表達式數(shù)據(jù)處理算法,稱之為ßFA:通過向量指令一次性從內(nèi)存讀出若干連續(xù)字符,并與最常被訪問狀態(tài)對應(yīng)的非信任字符集進行向量匹配,利用內(nèi)置函數(shù)定位首個非信任字符的位置,獲得可直接跳過的字符數(shù),從而實現(xiàn)匹配性能的加速。實驗結(jié)果表明,ßFA算法的吞吐率優(yōu)于原始DFA算法和αFA算法,是原始DFA算法的4.67~60倍以及ɑFA算法的4.37~7.82倍。
現(xiàn)在下載
VIP會員,AET專家下載不扣分;重復(fù)下載不扣分,本人上傳資源不扣分。