文獻標志碼:A
DOI: 10.16157/j.issn.0258-7998.233921
引用格式: 崔燾,張昊楠,阮福明,等. 基于強化Q學習的海上地震勘探航線自動規(guī)劃方法[J]. 電子技術應用,2023,49(11):105-110.
【引言】
海上地震勘探航線規(guī)劃作為綜合導航系統(tǒng)的重要組成部分,一直是各家石油公司的研究重點。由于海上地震勘探的特殊作業(yè)環(huán)境,除洋流、障礙物、水下環(huán)境和漁業(yè)等因素的干擾外,拖纜船在工區(qū)內的航線規(guī)劃往往來自于工作人員的現(xiàn)場決策,受限于人員工作經驗等因素,拖纜作業(yè)實際施工效率較低,直接導致工區(qū)采集成本的增加。拖纜法地震勘探作為海上地震勘探的重要方法,當前國內外各主要石油公司都非常重視對拖纜地震勘探相關技術的研究,以提高作業(yè)效率,探索海上地震勘探新技術與新方法。
多年來,人們將機器學習應用于醫(yī)學、軍事等各種行業(yè),但是其應用于石油物探領域是近年來才發(fā)展起來的,并取得了良好效果。2020年,何健等人利用隨機森林方法預測裂縫發(fā)育帶,證明隨機森林方法對裂縫帶預測結果準確度較高[1]。2021年,楊午陽等人提出一種基于U-Net深度學習網(wǎng)絡的地震數(shù)據(jù)斷層檢測方法,取得了良好效果[2] 。
近幾年,強化學習(Reinforcement Learning, RL)作為機器學習的重要組成部分,被廣泛應用于解決路徑規(guī)劃等優(yōu)化策略問題。2018年,王程博等人提出一種基于強化Q學習(Q-Learning)的無人駕駛船舶路徑規(guī)劃模型,有效地在未知環(huán)境中規(guī)劃出較優(yōu)路徑及成功避讓多個障礙物[3]。2019年,封佳祥等人提出一種多任務約束條件下基于強化學習的水面無人艇路徑規(guī)劃方法,實現(xiàn)了完成多任務約束條件下的無人艇路徑規(guī)劃[4]。Q-Learning是一種基于Q值迭代的無模型強化學習方法,如今被廣泛應用于各個領域[5]。2020年,胡學敏等人提出基于深度時空Q網(wǎng)絡的定向導航自動駕駛運動規(guī)劃方法來實現(xiàn)定向導航的目的[6]。2021年,周彬等人提出了基于導向強化Q學習的無人機路徑規(guī)劃方法,實現(xiàn)無人機的自主導航和快速路徑規(guī)劃[7]。2022年,楊秀霞等人提出一種基于階段Q學習的機器人路徑規(guī)劃方法,使得機器人在復雜環(huán)境中能夠迅速找到無碰撞路徑[8]。
作為一種新技術,Q-Learning方法在解決路徑規(guī)劃問題過程中取得了良好效果。該方法引入石油物探領域解決海上地震勘探航線規(guī)劃,將會顯著提升物探船的作業(yè)效率。
文章詳細內容下載請點擊:基于強化Q學習的海上地震勘探航線自動規(guī)劃方法AET-電子技術應用-最豐富的電子設計資源平臺 (chinaaet.com)
【作者信息】
崔燾1,2,張昊楠1,2,阮福明1,2,崔世峰1,2,張少鵬1,2
(1.中海油田服務股份有限公司物探事業(yè)部, 天津 300459;2.海洋油氣勘探國家工程研究中心, 北京 100028)