《電子技術(shù)應(yīng)用》
您所在的位置:首頁 > 人工智能 > 设计应用 > 基于SAE特征优选和Bagging集成学习的油藏初期产能预测
基于SAE特征优选和Bagging集成学习的油藏初期产能预测
电子技术应用
徐振1,张望1,李兴亮1,龙军2
1.中国石油吐哈油田分公司;2.深圳鹏锐信息技术股份有限公司
摘要: 油藏初期产能受地质、工程和开发等多种因素影响,是一种复杂的非线性变化时间序列,传统采用单一模型进行预测的方法预测精度较低,数据适应能力较弱。提出一种基于稀疏自编码器(Sparse Auto-Encoder, SAE)和集成学习的油藏初期产能预测模型。首先利用SAE对影响初期产量的多种因素进行分析,自动提取含油饱和度、射孔段有效厚度、压裂加砂量、加砂强度和能量保持状态5维特征作为主控因素,然后分别采用线性回归(Linear Regression, LR)、支持向量回归(Support Vector Regression, SVR)和长短时记忆神经网络(Long Short-Term Memory, LSTM)3种方法建立预测模型进行初产预测,最后利用Bagging集成学习对3种方法的预测结果进行综合集成,从而获得最终的油藏初期产能预测结果。采用某特低渗油田实际数据开展验证试验,结果表明相对于单一LR、SVR和LSTM方法,所提方法的预测精度更高,数据适应能更强,具有较高的应用前景。
中圖分類號:TP18;TE341 文獻(xiàn)標(biāo)志碼:A DOI: 10.16157/j.issn.0258-7998.256701
中文引用格式: 徐振,張望,李興亮,等. 基于SAE特征優(yōu)選和Bagging集成學(xué)習(xí)的油藏初期產(chǎn)能預(yù)測[J]. 電子技術(shù)應(yīng)用,2026,52(3):84-90.
英文引用格式: Xu Zhen,Zhang Wang,Li Xingliang,et al. Prediction of initial reservoir productivity based on SAE feature optimization and Bagging ensemble learning[J]. Application of Electronic Technique,2026,52(3):84-90.
Prediction of initial reservoir productivity based on SAE feature optimization and Bagging ensemble learning
Xu Zhen1,Zhang Wang1,Li Xingliang1,Long Jun2
1.Petrochina Tuha Oilfield Branch;2.Shenzhen Pengrui Information Technology Co., Ltd.
Abstract: The initial productivity of oil reservoir is affected by many factors such as geology, engineering and development, which is a complex nonlinear time series. The traditional prediction method using a single model has low prediction accuracy and weak data adaptability. A prediction model of initial reservoir productivity based on sparse auto encoder (SAE) and ensemble learning is proposed. Firstly, SAE is used to analyze various factors affecting the initial production, and the five-dimensional characteristics of oil saturation, effective thickness of perforated interval, fracturing sand addition, sand addition intensity and energy retention state are automatically extracted as the main control factors. Then, the prediction models are established by using linear regression (LR), support vector regression (SVR) and long short-term memory neural network (LSTM) to predict the initial production. Finally, Bagging ensemble learning is used to comprehensively integrate the prediction results of the three methods, so as to obtain the final prediction results of the initial production of the reservoir. Using the actual data of an ultra-low permeability oilfield to carry out the verification test, the results show that compared with the single LR, SVR and LSTM methods, the proposed method has higher prediction accuracy, stronger data adaptability and higher application prospect.
Key words : sparse autoencoder;feature selection;integrated learning;productivity prediction;support vector regression

引言

油藏是我國的戰(zhàn)略資源,在國家經(jīng)濟(jì)發(fā)展中起著舉足輕重的作用。油藏初期產(chǎn)能的準(zhǔn)確預(yù)測對于企業(yè)投資決策、合理開采方案制訂以及生產(chǎn)環(huán)節(jié)優(yōu)化等具有重要意義[1]。自六十年代以來,我國油藏初期產(chǎn)能預(yù)測經(jīng)歷了數(shù)值模擬法、機(jī)器學(xué)習(xí)法和深度學(xué)習(xí)法3個階段[2]。數(shù)值模擬法通過對與油藏初期產(chǎn)量相關(guān)的參數(shù)進(jìn)行分解,進(jìn)而建立一系列模型對參數(shù)相互之間的關(guān)系進(jìn)行描述,最終獲得油藏初期產(chǎn)量的解析表達(dá)式,具有原理清晰、可解釋性強(qiáng)和計算簡單等優(yōu)勢[3],但由于儲層非均質(zhì)性、生產(chǎn)以及工程等非線性因素難以采用準(zhǔn)確的數(shù)學(xué)模型進(jìn)行描述,導(dǎo)致數(shù)值模擬法的預(yù)測精度有限[4]。近年來,隨著我國油氣田數(shù)字化、信息化程度的提升,油氣田產(chǎn)業(yè)積累了大量的地質(zhì)數(shù)據(jù)、生產(chǎn)數(shù)據(jù)和工程數(shù)據(jù)等,數(shù)據(jù)驅(qū)動的機(jī)器學(xué)習(xí)類方法得到了科研人員的廣泛關(guān)注。機(jī)器學(xué)習(xí)法以線性回歸(Linear Regression, LR)、支持向量回歸(Support Vector Regression, SVR)和人工神經(jīng)網(wǎng)絡(luò)等方法為代表[5],能夠從歷史數(shù)據(jù)中自動挖掘出與油藏產(chǎn)量有關(guān)參數(shù)之間隱藏的規(guī)律性信息和變化趨勢信息,從而在降低建模難度的同時提升對非線性數(shù)據(jù)的適應(yīng)性[6]。文獻(xiàn)[7]利用自回歸移動平均模型(ARMA)對水驅(qū)油藏井組內(nèi)產(chǎn)油量和注水量之間的關(guān)系進(jìn)行建模表征;文獻(xiàn)[8]篩選了井深、氣體飽和度和滲透率等8個參數(shù)作為頁巖氣產(chǎn)量的主控因素,并采用SVR模型對8個參數(shù)與頁巖氣產(chǎn)量之間的關(guān)系進(jìn)行建模,獲得了較高的預(yù)測精度;文獻(xiàn)[9]將ANN引入油氣產(chǎn)量預(yù)測領(lǐng)域,分析了ANN和SVR在面對非線性油氣數(shù)據(jù)時的性能差異,證明了ANN在油藏初期產(chǎn)量預(yù)測領(lǐng)域具有較高的潛能。相對于數(shù)值模擬方法,機(jī)器學(xué)習(xí)方法不需要復(fù)雜的理論推導(dǎo),且能夠根據(jù)數(shù)據(jù)中隱含的地質(zhì)、工程和生產(chǎn)信息自動學(xué)習(xí)和調(diào)整,因此具有更高的靈活性和數(shù)據(jù)適應(yīng)性。然而油氣數(shù)據(jù)本質(zhì)上是一種隨時間變化的時間序列,而機(jī)器學(xué)習(xí)類方法對時間不敏感,建模過程中忽略了時間維度對產(chǎn)量變化的影響,因此預(yù)測過程中會出現(xiàn)預(yù)測偏差[10]。以長短時記憶神經(jīng)網(wǎng)絡(luò)(Long Short-Term Memory Network, LSTM)和卷積神經(jīng)網(wǎng)絡(luò)(Convolutional Neural Network, CNN)為代表的深度學(xué)習(xí)方法能夠有效挖掘數(shù)據(jù)中隱含的周期性和趨勢性時間信息,同時能夠提取更高階、更豐富的特征對油藏產(chǎn)量與工程參數(shù)之間的復(fù)雜關(guān)系進(jìn)行描述[11-12],文獻(xiàn)[13]考慮道頁巖氣開發(fā)過程中高密度鉆井條件限制,建立LSTM模型對頁巖氣產(chǎn)量的時序關(guān)系進(jìn)行描述并將其應(yīng)用至加拿大Alberta地區(qū)的頁巖氣產(chǎn)量預(yù)測;文獻(xiàn)[14]提出一種麻雀搜索算法優(yōu)化的時域卷積神經(jīng)網(wǎng)絡(luò)(TCN)的預(yù)測模型,解決了水驅(qū)油田單井產(chǎn)量波動大、預(yù)測困難的問題。深度學(xué)習(xí)方法雖然能夠獲得較高的預(yù)測準(zhǔn)確度,但是需要大量的訓(xùn)練數(shù)據(jù)用于模型參數(shù)尋優(yōu),數(shù)據(jù)依賴性將強(qiáng)且運(yùn)算量較大,限制了該類方法在實(shí)際中的應(yīng)用[15]。

當(dāng)前已有研究均是采用單一模型進(jìn)行油藏初期產(chǎn)能預(yù)測,近年來集成學(xué)習(xí)理論的發(fā)展表明,單個模型的預(yù)測性能必然存在局限性,通過將多個模型進(jìn)行集成能夠有效提升對復(fù)雜非線性問題的建模分析能力。基于此,本文提出一種基于稀疏自編碼器(Sparse Auto-Encoder, SAE)和集成學(xué)習(xí)的油藏初期產(chǎn)能預(yù)測模型。首先利用SAE進(jìn)行主控因素選擇,實(shí)現(xiàn)數(shù)據(jù)降維的同時降低后續(xù)預(yù)測模型的復(fù)雜度;然后分別建立LR、SVR和LSTM 3種預(yù)測模型進(jìn)行產(chǎn)量預(yù)測,最后利用Bagging集成學(xué)習(xí)對3種方法的預(yù)測結(jié)果進(jìn)行綜合集成從而獲得最終的油藏初期產(chǎn)能預(yù)測結(jié)果。通過某特低滲油田實(shí)際數(shù)據(jù)對所提方法的性能進(jìn)行驗證。


本文詳細(xì)內(nèi)容請下載:

http://ihrv.cn/resource/share/2000007009


作者信息:

徐振1,張望1,李興亮1,龍軍2

(1.中國石油吐哈油田分公司,新疆 哈密 839000;

2.深圳鵬銳信息技術(shù)股份有限公司,廣東  深圳 518000)

2.jpg

此內(nèi)容為AET網(wǎng)站原創(chuàng),未經(jīng)授權(quán)禁止轉(zhuǎn)載。