基于代碼嵌入的二進制代碼相似性分析方法
所屬分類:技術論文
上傳者:zhoubin333
文檔大小:2820 K
標簽: 代碼表示 代碼嵌入模型 代碼搜索
所需積分:0分積分不夠怎么辦?
文檔介紹:代碼嵌入利用神經(jīng)網(wǎng)絡模型將二進制函數(shù)的代碼表示轉(zhuǎn)化為向量,在漏洞搜索等應用中展現(xiàn)了優(yōu)勢?,F(xiàn)有的方法將函數(shù)表示為匯編指令序列、控制流圖的拓撲結構或若干路徑,都沒有克服不同編譯環(huán)境導致控制流圖結構變化的干擾。為此,設計了基于基本塊樹(Basic Block Tree, BBT)的代碼表示以及構建了對應的代碼嵌入模型BBTree。首先,二進制函數(shù)被表示為一系列BBT,每個BBT被處理為指令序列;其次,BBTree利用LSTM和BiGRU將基于BBT的代碼表示轉(zhuǎn)化為向量;最后,通過計算向量間的距離去高效衡量對應函數(shù)的相似性。在代碼搜索中,BBTree的平均準確率比主流工具提升了24.8%;在漏洞搜索中,BBTree的平均召回率比主流工具提升了26.1%。
現(xiàn)在下載
VIP會員,AET專家下載不扣分;重復下載不扣分,本人上傳資源不扣分。