中文引用格式: 徐振,張望,李興亮,等. 基于SAE特征優(yōu)選和Bagging集成學(xué)習(xí)的油藏初期產(chǎn)能預(yù)測[J]. 電子技術(shù)應(yīng)用,2026,52(3):84-90.
英文引用格式: Xu Zhen,Zhang Wang,Li Xingliang,et al. Prediction of initial reservoir productivity based on SAE feature optimization and Bagging ensemble learning[J]. Application of Electronic Technique,2026,52(3):84-90.
引言
油藏是我國的戰(zhàn)略資源,在國家經(jīng)濟(jì)發(fā)展中起著舉足輕重的作用。油藏初期產(chǎn)能的準(zhǔn)確預(yù)測對于企業(yè)投資決策、合理開采方案制訂以及生產(chǎn)環(huán)節(jié)優(yōu)化等具有重要意義[1]。自六十年代以來,我國油藏初期產(chǎn)能預(yù)測經(jīng)歷了數(shù)值模擬法、機(jī)器學(xué)習(xí)法和深度學(xué)習(xí)法3個階段[2]。數(shù)值模擬法通過對與油藏初期產(chǎn)量相關(guān)的參數(shù)進(jìn)行分解,進(jìn)而建立一系列模型對參數(shù)相互之間的關(guān)系進(jìn)行描述,最終獲得油藏初期產(chǎn)量的解析表達(dá)式,具有原理清晰、可解釋性強(qiáng)和計算簡單等優(yōu)勢[3],但由于儲層非均質(zhì)性、生產(chǎn)以及工程等非線性因素難以采用準(zhǔn)確的數(shù)學(xué)模型進(jìn)行描述,導(dǎo)致數(shù)值模擬法的預(yù)測精度有限[4]。近年來,隨著我國油氣田數(shù)字化、信息化程度的提升,油氣田產(chǎn)業(yè)積累了大量的地質(zhì)數(shù)據(jù)、生產(chǎn)數(shù)據(jù)和工程數(shù)據(jù)等,數(shù)據(jù)驅(qū)動的機(jī)器學(xué)習(xí)類方法得到了科研人員的廣泛關(guān)注。機(jī)器學(xué)習(xí)法以線性回歸(Linear Regression, LR)、支持向量回歸(Support Vector Regression, SVR)和人工神經(jīng)網(wǎng)絡(luò)等方法為代表[5],能夠從歷史數(shù)據(jù)中自動挖掘出與油藏產(chǎn)量有關(guān)參數(shù)之間隱藏的規(guī)律性信息和變化趨勢信息,從而在降低建模難度的同時提升對非線性數(shù)據(jù)的適應(yīng)性[6]。文獻(xiàn)[7]利用自回歸移動平均模型(ARMA)對水驅(qū)油藏井組內(nèi)產(chǎn)油量和注水量之間的關(guān)系進(jìn)行建模表征;文獻(xiàn)[8]篩選了井深、氣體飽和度和滲透率等8個參數(shù)作為頁巖氣產(chǎn)量的主控因素,并采用SVR模型對8個參數(shù)與頁巖氣產(chǎn)量之間的關(guān)系進(jìn)行建模,獲得了較高的預(yù)測精度;文獻(xiàn)[9]將ANN引入油氣產(chǎn)量預(yù)測領(lǐng)域,分析了ANN和SVR在面對非線性油氣數(shù)據(jù)時的性能差異,證明了ANN在油藏初期產(chǎn)量預(yù)測領(lǐng)域具有較高的潛能。相對于數(shù)值模擬方法,機(jī)器學(xué)習(xí)方法不需要復(fù)雜的理論推導(dǎo),且能夠根據(jù)數(shù)據(jù)中隱含的地質(zhì)、工程和生產(chǎn)信息自動學(xué)習(xí)和調(diào)整,因此具有更高的靈活性和數(shù)據(jù)適應(yīng)性。然而油氣數(shù)據(jù)本質(zhì)上是一種隨時間變化的時間序列,而機(jī)器學(xué)習(xí)類方法對時間不敏感,建模過程中忽略了時間維度對產(chǎn)量變化的影響,因此預(yù)測過程中會出現(xiàn)預(yù)測偏差[10]。以長短時記憶神經(jīng)網(wǎng)絡(luò)(Long Short-Term Memory Network, LSTM)和卷積神經(jīng)網(wǎng)絡(luò)(Convolutional Neural Network, CNN)為代表的深度學(xué)習(xí)方法能夠有效挖掘數(shù)據(jù)中隱含的周期性和趨勢性時間信息,同時能夠提取更高階、更豐富的特征對油藏產(chǎn)量與工程參數(shù)之間的復(fù)雜關(guān)系進(jìn)行描述[11-12],文獻(xiàn)[13]考慮道頁巖氣開發(fā)過程中高密度鉆井條件限制,建立LSTM模型對頁巖氣產(chǎn)量的時序關(guān)系進(jìn)行描述并將其應(yīng)用至加拿大Alberta地區(qū)的頁巖氣產(chǎn)量預(yù)測;文獻(xiàn)[14]提出一種麻雀搜索算法優(yōu)化的時域卷積神經(jīng)網(wǎng)絡(luò)(TCN)的預(yù)測模型,解決了水驅(qū)油田單井產(chǎn)量波動大、預(yù)測困難的問題。深度學(xué)習(xí)方法雖然能夠獲得較高的預(yù)測準(zhǔn)確度,但是需要大量的訓(xùn)練數(shù)據(jù)用于模型參數(shù)尋優(yōu),數(shù)據(jù)依賴性將強(qiáng)且運(yùn)算量較大,限制了該類方法在實(shí)際中的應(yīng)用[15]。
當(dāng)前已有研究均是采用單一模型進(jìn)行油藏初期產(chǎn)能預(yù)測,近年來集成學(xué)習(xí)理論的發(fā)展表明,單個模型的預(yù)測性能必然存在局限性,通過將多個模型進(jìn)行集成能夠有效提升對復(fù)雜非線性問題的建模分析能力。基于此,本文提出一種基于稀疏自編碼器(Sparse Auto-Encoder, SAE)和集成學(xué)習(xí)的油藏初期產(chǎn)能預(yù)測模型。首先利用SAE進(jìn)行主控因素選擇,實(shí)現(xiàn)數(shù)據(jù)降維的同時降低后續(xù)預(yù)測模型的復(fù)雜度;然后分別建立LR、SVR和LSTM 3種預(yù)測模型進(jìn)行產(chǎn)量預(yù)測,最后利用Bagging集成學(xué)習(xí)對3種方法的預(yù)測結(jié)果進(jìn)行綜合集成從而獲得最終的油藏初期產(chǎn)能預(yù)測結(jié)果。通過某特低滲油田實(shí)際數(shù)據(jù)對所提方法的性能進(jìn)行驗證。
本文詳細(xì)內(nèi)容請下載:
http://ihrv.cn/resource/share/2000007009
作者信息:
徐振1,張望1,李興亮1,龍軍2
(1.中國石油吐哈油田分公司,新疆 哈密 839000;
2.深圳鵬銳信息技術(shù)股份有限公司,廣東 深圳 518000)

