《電子技術(shù)應(yīng)用》
您所在的位置:首頁 > 其他 > 設(shè)計(jì)應(yīng)用 > 基于強(qiáng)化學(xué)習(xí)的特征工程算法研究
基于強(qiáng)化學(xué)習(xí)的特征工程算法研究
2021年電子技術(shù)應(yīng)用第7期
謝 斌1,2,林珊玲2,3,林志賢1,2,郭太良1,2
1.福州大學(xué) 物理與信息工程學(xué)院,福建 福州350116; 2.中國福建光電信息科學(xué)與技術(shù)創(chuàng)新實(shí)驗(yàn)室,福建 福州350116;3.福州大學(xué) 先進(jìn)制造學(xué)院,福建 泉州362200
摘要: 特征工程可以自動(dòng)地處理和生成那些判別性高的特征,而無需人為的操作。特征工程在機(jī)器學(xué)習(xí)中是不可避免的一環(huán),也是至關(guān)重要的一環(huán)。提出一種基于強(qiáng)化學(xué)習(xí)(RL)的方法,將特征工程作為一個(gè)馬爾可夫決策過程(MDP),在上限置信區(qū)間算法(UCT)的基礎(chǔ)上提出一個(gè)近似的方法求解二分類數(shù)值數(shù)據(jù)的特征工程問題,來自動(dòng)獲得最佳的變換策略。在5個(gè)公開的數(shù)據(jù)集上驗(yàn)證所提出方法的有效性,F(xiàn)Score平均提高了9.032%,同時(shí)與其他用有限元變換進(jìn)行特征工程的方法進(jìn)行比較。該方法確實(shí)可以得到判別性高的特征,提高模型的學(xué)習(xí)能力,得到更高的精度。
中圖分類號: TP391
文獻(xiàn)標(biāo)識(shí)碼: A
DOI:10.16157/j.issn.0258-7998.201173
中文引用格式: 謝斌,林珊玲,林志賢,等. 基于強(qiáng)化學(xué)習(xí)的特征工程算法研究[J].電子技術(shù)應(yīng)用,2021,47(7):29-32,43.
英文引用格式: Xie Bin,Lin Shanling,Lin Zhixian,et al. Research on feature engineering algorithm based on reinforcement learning[J]. Application of Electronic Technique,2021,47(7):29-32,43.
Research on feature engineering algorithm based on reinforcement learning
Xie Bin1,2,Lin Shanling2,3,Lin Zhixian1,2,Guo Tailiang1,2
1.School of Physics and Information Engineering,F(xiàn)uzhou University,F(xiàn)uzhou 350116,China; 2.China Fujian Optoelectronic Information Science and Technology Innovation Laboratory,F(xiàn)uzhou 350116,China; 3.School of Advanced Manufacturing, Fuzhou University,Quanzhou 362200,China
Abstract: Feature engineering can automatically process and generate those highly discriminative features without human operation. Feature engineering is an inevitable and crucial part of machine learning. The article proposes a method based on reinforcement learning(RL), taking feature engineering as a Markov decision process(MDP), and proposes an approximate method based on the upper limit confidence interval algorithm(UCT) to solve the feature engineering of binary numerical data problem to automatically obtain the best transformation strategy. The effectiveness of the proposed method is verified on five public data sets. The FScore of the five public data sets is improved by an average of 9.032%. It is also compared with other papers that use finite element transformation for feature engineering. This method can indeed obtain highly discriminative features, improve the learning ability of the model, and obtain higher accuracy.
Key words : feature engineering;reinforcement learning;machine learning

0 引言

    機(jī)器學(xué)習(xí)廣泛應(yīng)用于人們的日常生活中,其中預(yù)測分析廣泛應(yīng)用于多個(gè)領(lǐng)域的決策,包括欺詐檢測[1-2]、在線廣告[3-4]、風(fēng)險(xiǎn)管理、市場營銷等。預(yù)測模型是采用監(jiān)督學(xué)習(xí)算法來進(jìn)行預(yù)測,通過歷史數(shù)據(jù)進(jìn)行訓(xùn)練分類或者回歸模型來預(yù)測未知的結(jié)果,以起到?jīng)Q策的作用。數(shù)據(jù)的表示方法對于模型的準(zhǔn)確度十分重要,原始的數(shù)據(jù)空間往往難以表達(dá)數(shù)據(jù)。因此,在模型構(gòu)建之前對數(shù)據(jù)進(jìn)行適當(dāng)?shù)奶幚砑稗D(zhuǎn)換是必不可少的。

    特征工程的主要目的就是改變預(yù)測建模的特征以更好地適應(yīng)算法的訓(xùn)練,通過生成那些判別性高的特征來提高模型訓(xùn)練的準(zhǔn)確度。在現(xiàn)實(shí)中,特征工程是由數(shù)據(jù)科學(xué)家手動(dòng)和根據(jù)領(lǐng)域知識(shí)來進(jìn)行的,這一過程往往是十分繁瑣且耗時(shí)的[5],而且很容易產(chǎn)生錯(cuò)誤和偏差。




本文詳細(xì)內(nèi)容請下載:http://ihrv.cn/resource/share/2000003649。




作者信息:

謝  斌1,2,林珊玲2,3,林志賢1,2,郭太良1,2

(1.福州大學(xué) 物理與信息工程學(xué)院,福建 福州350116;

2.中國福建光電信息科學(xué)與技術(shù)創(chuàng)新實(shí)驗(yàn)室,福建 福州350116;3.福州大學(xué) 先進(jìn)制造學(xué)院,福建 泉州362200)




wd.jpg

此內(nèi)容為AET網(wǎng)站原創(chuàng),未經(jīng)授權(quán)禁止轉(zhuǎn)載。