文獻(xiàn)標(biāo)志碼:A
DOI: 10.16157/j.issn.0258-7998.233921
引用格式: 崔燾,張昊楠,阮福明,等. 基于強(qiáng)化Q學(xué)習(xí)的海上地震勘探航線自動(dòng)規(guī)劃方法[J]. 電子技術(shù)應(yīng)用,2023,49(11):105-110.
【引言】
海上地震勘探航線規(guī)劃作為綜合導(dǎo)航系統(tǒng)的重要組成部分,一直是各家石油公司的研究重點(diǎn)。由于海上地震勘探的特殊作業(yè)環(huán)境,除洋流、障礙物、水下環(huán)境和漁業(yè)等因素的干擾外,拖纜船在工區(qū)內(nèi)的航線規(guī)劃往往來(lái)自于工作人員的現(xiàn)場(chǎng)決策,受限于人員工作經(jīng)驗(yàn)等因素,拖纜作業(yè)實(shí)際施工效率較低,直接導(dǎo)致工區(qū)采集成本的增加。拖纜法地震勘探作為海上地震勘探的重要方法,當(dāng)前國(guó)內(nèi)外各主要石油公司都非常重視對(duì)拖纜地震勘探相關(guān)技術(shù)的研究,以提高作業(yè)效率,探索海上地震勘探新技術(shù)與新方法。
多年來(lái),人們將機(jī)器學(xué)習(xí)應(yīng)用于醫(yī)學(xué)、軍事等各種行業(yè),但是其應(yīng)用于石油物探領(lǐng)域是近年來(lái)才發(fā)展起來(lái)的,并取得了良好效果。2020年,何健等人利用隨機(jī)森林方法預(yù)測(cè)裂縫發(fā)育帶,證明隨機(jī)森林方法對(duì)裂縫帶預(yù)測(cè)結(jié)果準(zhǔn)確度較高[1]。2021年,楊午陽(yáng)等人提出一種基于U-Net深度學(xué)習(xí)網(wǎng)絡(luò)的地震數(shù)據(jù)斷層檢測(cè)方法,取得了良好效果[2] 。
近幾年,強(qiáng)化學(xué)習(xí)(Reinforcement Learning, RL)作為機(jī)器學(xué)習(xí)的重要組成部分,被廣泛應(yīng)用于解決路徑規(guī)劃等優(yōu)化策略問(wèn)題。2018年,王程博等人提出一種基于強(qiáng)化Q學(xué)習(xí)(Q-Learning)的無(wú)人駕駛船舶路徑規(guī)劃模型,有效地在未知環(huán)境中規(guī)劃出較優(yōu)路徑及成功避讓多個(gè)障礙物[3]。2019年,封佳祥等人提出一種多任務(wù)約束條件下基于強(qiáng)化學(xué)習(xí)的水面無(wú)人艇路徑規(guī)劃方法,實(shí)現(xiàn)了完成多任務(wù)約束條件下的無(wú)人艇路徑規(guī)劃[4]。Q-Learning是一種基于Q值迭代的無(wú)模型強(qiáng)化學(xué)習(xí)方法,如今被廣泛應(yīng)用于各個(gè)領(lǐng)域[5]。2020年,胡學(xué)敏等人提出基于深度時(shí)空Q網(wǎng)絡(luò)的定向?qū)Ш阶詣?dòng)駕駛運(yùn)動(dòng)規(guī)劃方法來(lái)實(shí)現(xiàn)定向?qū)Ш降哪康腫6]。2021年,周彬等人提出了基于導(dǎo)向強(qiáng)化Q學(xué)習(xí)的無(wú)人機(jī)路徑規(guī)劃方法,實(shí)現(xiàn)無(wú)人機(jī)的自主導(dǎo)航和快速路徑規(guī)劃[7]。2022年,楊秀霞等人提出一種基于階段Q學(xué)習(xí)的機(jī)器人路徑規(guī)劃方法,使得機(jī)器人在復(fù)雜環(huán)境中能夠迅速找到無(wú)碰撞路徑[8]。
作為一種新技術(shù),Q-Learning方法在解決路徑規(guī)劃問(wèn)題過(guò)程中取得了良好效果。該方法引入石油物探領(lǐng)域解決海上地震勘探航線規(guī)劃,將會(huì)顯著提升物探船的作業(yè)效率。
文章詳細(xì)內(nèi)容下載請(qǐng)點(diǎn)擊:基于強(qiáng)化Q學(xué)習(xí)的海上地震勘探航線自動(dòng)規(guī)劃方法AET-電子技術(shù)應(yīng)用-最豐富的電子設(shè)計(jì)資源平臺(tái) (chinaaet.com)
【作者信息】
崔燾1,2,張昊楠1,2,阮福明1,2,崔世峰1,2,張少鵬1,2
(1.中海油田服務(wù)股份有限公司物探事業(yè)部, 天津 300459;2.海洋油氣勘探國(guó)家工程研究中心, 北京 100028)