引用格式:嚴(yán)彥勝,李京. 基于深度強(qiáng)化學(xué)習(xí)的以太坊 MEV 交易防護(hù)與交易排序優(yōu)化[J].網(wǎng)絡(luò)安全與數(shù)據(jù)治理,2025,44(7):20-26.
引言
隨著區(qū)塊鏈技術(shù)的廣泛應(yīng)用,尤其是以太坊在去中心化金融(DeFi)領(lǐng)域的快速發(fā)展,最大可提取價(jià)值(Maximal Extractable Value,MEV)交易問題逐漸成為影響網(wǎng)絡(luò)公平性、安全性和效率的重要挑戰(zhàn)[1]。MEV 由礦工或排序者通過操控交易順序獲得額外利潤,表現(xiàn)形式包括前置攻擊(FrontRunning)、三明治攻擊(Sandwich Attack)等[2]。這些交易模式不僅對(duì)普通用戶造成經(jīng)濟(jì)損失,還推高整體交易成本,加劇網(wǎng)絡(luò)擁堵,破壞區(qū)塊鏈生態(tài)的穩(wěn)定性與公正性[3]。
MEV的產(chǎn)生主要源于區(qū)塊鏈交易順序的可操控性、交易信息的公開性、Gas競價(jià)機(jī)制以及DeFi交易的復(fù)雜性。現(xiàn)有的交易排序方法主要包括先來先服務(wù)(FIFO)排序和Gas競價(jià)排序。FIFO排序雖然具有較高的公平性,但缺乏Gas費(fèi)用優(yōu)化,無法有效防范MEV交易[4]。Gas競價(jià)排序根據(jù)交易支付的Gas費(fèi)用決定執(zhí)行順序,導(dǎo)致Gas競價(jià)競爭加劇,使得MEV交易通過支付高額Gas費(fèi)用獲得優(yōu)先執(zhí)行權(quán),從而進(jìn)一步破壞交易公平性[5]。
與現(xiàn)有采用啟發(fā)式排序策略或基于靜態(tài)規(guī)則的排序機(jī)制相比,本文方法引入強(qiáng)化學(xué)習(xí)框架,具有更強(qiáng)的自適應(yīng)能力,能夠在不同交易負(fù)載和攻擊場(chǎng)景下動(dòng)態(tài)調(diào)整排序策略。同時(shí),相較于現(xiàn)有基于強(qiáng)化學(xué)習(xí)的研究[6-8]主要聚焦于合約交互或交易分類問題,本文首次將深度Q網(wǎng)絡(luò)(Deep QNetwork,DQN)應(yīng)用于交易排序優(yōu)化,并構(gòu)建專門的狀態(tài)-動(dòng)作空間及獎(jiǎng)勵(lì)函數(shù),直接面向 MEV 抑制目標(biāo)進(jìn)行學(xué)習(xí)。
本文的主要貢獻(xiàn)如下:
(1)提出基于 DQN 的交易排序優(yōu)化方法,動(dòng)態(tài)調(diào)整交易執(zhí)行順序,以降低 MEV 交易的影響,提高交易公平性。
(2)優(yōu)化 Gas 費(fèi)用,通過強(qiáng)化學(xué)習(xí)減少 Gas 競價(jià)排序帶來的交易成本膨脹問題。
(3)構(gòu)建完整的實(shí)驗(yàn)框架,在Geth (Go-Ethereum)本地私有鏈環(huán)境下復(fù)現(xiàn)真實(shí)交易處理流程,并結(jié)合 Flashbots MEV-Explore 數(shù)據(jù)集進(jìn)行實(shí)驗(yàn)驗(yàn)證。
實(shí)驗(yàn)結(jié)果表明,所提出的 DQN 排序策略相比傳統(tǒng)方法將 MEV 提取率降低至 13% 以下,平均 Gas 費(fèi)用較基準(zhǔn)策略降低約 33.1%,并顯著提升低 Gas 交易的執(zhí)行公平性,公平性指數(shù)達(dá)到 0.78,遠(yuǎn)高于傳統(tǒng)策略。
本文詳細(xì)內(nèi)容請(qǐng)下載:
http://ihrv.cn/resource/share/2000006610
作者信息:
嚴(yán)彥勝,李京
(中國科學(xué)技術(shù)大學(xué)計(jì)算機(jī)科學(xué)與技術(shù)學(xué)院,安徽合肥230026)