ßFA:一種基于向量指令集的高性能數(shù)據(jù)處理算法
所屬分類:技術(shù)論文
上傳者:wwei
文檔大小:3357 K
標(biāo)簽: 正則表達(dá)式匹配 向量指令集 高性能數(shù)據(jù)處理
所需積分:0分積分不夠怎么辦?
文檔介紹:正則表達(dá)式匹配技術(shù)在數(shù)據(jù)清洗、解析提取等數(shù)據(jù)處理任務(wù)方面發(fā)揮重大作用。然而,由于匹配過程中存在數(shù)據(jù)強(qiáng)依賴關(guān)系和內(nèi)存訪問不可預(yù)測等問題,造成匹配性能較低。針對此問題,提出一種基于向量指令集的高性能正則表達(dá)式數(shù)據(jù)處理算法,稱之為ßFA:通過向量指令一次性從內(nèi)存讀出若干連續(xù)字符,并與最常被訪問狀態(tài)對應(yīng)的非信任字符集進(jìn)行向量匹配,利用內(nèi)置函數(shù)定位首個非信任字符的位置,獲得可直接跳過的字符數(shù),從而實(shí)現(xiàn)匹配性能的加速。實(shí)驗(yàn)結(jié)果表明,ßFA算法的吞吐率優(yōu)于原始DFA算法和αFA算法,是原始DFA算法的4.67~60倍以及ɑFA算法的4.37~7.82倍。
現(xiàn)在下載
VIP會員,AET專家下載不扣分;重復(fù)下載不扣分,本人上傳資源不扣分。