《電子技術(shù)應(yīng)用》
您所在的位置:首頁 > 嵌入式技術(shù) > 設(shè)計(jì)應(yīng)用 > 基于改進(jìn)EMD的運(yùn)動想象腦電信號識別算法研究
基于改進(jìn)EMD的運(yùn)動想象腦電信號識別算法研究
2016年微型機(jī)與應(yīng)用第09期
于路,薄華
(上海海事大學(xué) 信息工程學(xué)院,上海 201306)
摘要: 針對現(xiàn)有的單一特征提取算法對運(yùn)動想象腦電信號識別率不高的問題,提出一種以相關(guān)系數(shù)改進(jìn)的經(jīng)驗(yàn)?zāi)B(tài)分解(EMD)的特征提取算法。對已有的BCI競賽數(shù)據(jù)中C3、C4兩個(gè)通道腦電數(shù)據(jù)進(jìn)行預(yù)處理,之后通過EMD對腦電信號進(jìn)行分解,得到IMF分量。通過計(jì)算原始信號與各階IMF分量之間的相關(guān)系數(shù),選擇具有較大相關(guān)系數(shù)的IMF作為特征,由這些IMF分量的能量特征和平均幅值差來組成腦電信號的特征。使用支撐矢量機(jī)分類器(SVM)對左右手運(yùn)動想象腦電信號進(jìn)行分類。實(shí)驗(yàn)結(jié)果表明,基于相關(guān)系數(shù)改進(jìn)的EMD腦電信號的處理方法明顯優(yōu)于只用EMD的腦電處理方法,得到的最高正確識別率為88.57%。從而證明了該方法的有效性。
Abstract:
Key words :

  于路,薄華

 ?。ㄉ虾:J麓髮W(xué) 信息工程學(xué)院,上海 201306)

  摘要:針對現(xiàn)有的單一特征提取算法對運(yùn)動想象腦電信號識別率不高的問題,提出一種以相關(guān)系數(shù)改進(jìn)的經(jīng)驗(yàn)?zāi)B(tài)分解(EMD)的特征提取算法。對已有的BCI競賽數(shù)據(jù)中C3、C4兩個(gè)通道腦電數(shù)據(jù)進(jìn)行預(yù)處理,之后通過EMD對腦電信號進(jìn)行分解,得到IMF分量。通過計(jì)算原始信號與各階IMF分量之間的相關(guān)系數(shù),選擇具有較大相關(guān)系數(shù)的IMF作為特征,由這些IMF分量的能量特征和平均幅值差來組成腦電信號的特征。使用支撐矢量機(jī)分類器(SVM)對左右手運(yùn)動想象腦電信號進(jìn)行分類。實(shí)驗(yàn)結(jié)果表明,基于相關(guān)系數(shù)改進(jìn)的EMD腦電信號的處理方法明顯優(yōu)于只用EMD的腦電處理方法,得到的最高正確識別率為88.57%。從而證明了該方法的有效性。

  關(guān)鍵詞: 腦電信號;經(jīng)驗(yàn)?zāi)B(tài)分解;相關(guān)系數(shù);特征提取

0引言

  頭皮腦電(Electroenc EphaloGraph,EEG)信號是一種產(chǎn)生機(jī)理相當(dāng)復(fù)雜且非常微弱的隨機(jī)信號,它反映了大腦阻止的腦電活動及大腦的功能狀態(tài)。不同的思維狀態(tài)在大腦皮層有不同的反映[1]。

  腦機(jī)接口(BrainComputer Interface,BCI)不依賴于大腦外周神經(jīng)與肌肉系統(tǒng),是大腦與計(jì)算機(jī)或其他電子設(shè)備之間建立可直接交流和控制的通道,可以有效增強(qiáng)身體嚴(yán)重殘疾的患者與外界交流或控制外部環(huán)境的能力,提高患者的生活質(zhì)量,同時(shí)也在娛樂電競等領(lǐng)域有著巨大的應(yīng)用前景[2-5]。

  目前EEG特征提取的常用方法有FFT、SFT、AR[5]、AAR[6]、ICA、小波分析[7]、特定頻帶的功率譜等方法。經(jīng)典的FFT在分析確定信號和平穩(wěn)信號時(shí)發(fā)揮了重要作用,但利用FFT分析突變信號的頻譜存在局限性。SFT在一定程度上克服了標(biāo)準(zhǔn)FFT不具有局部分析能力的缺陷,在某些信號處理中發(fā)揮了一定的作用,但也存在不可克服的缺陷。SFT是時(shí)間窗內(nèi)信號特征的平均,時(shí)間窗內(nèi)信號越短,獲得的時(shí)間分辨率就越高。根據(jù)信號測不準(zhǔn)原理,時(shí)間局域化性質(zhì)和頻率局域化性質(zhì)是矛盾的。AAR模型參數(shù)隨每一樣本點(diǎn)的輸入而改變,因而更好地反映了大腦的狀態(tài)。但是,該方法更適合分析平穩(wěn)信號,對包含高度非平穩(wěn)信號的運(yùn)動想象EEG,該模型達(dá)不到理想效果。小波變換和小波包變換分解信號時(shí),要預(yù)先設(shè)好分層數(shù)和小波函數(shù),不具備對信號自適應(yīng)的分解能力。因此需要采用一種非線性分析的方法,該方法同時(shí)具有對信號自適應(yīng)的分解能力,能通過度量腦電信號的復(fù)雜度來反映腦電的特征。本文中采用的是用相關(guān)系數(shù)改進(jìn)經(jīng)驗(yàn)?zāi)B(tài)分解的腦電信號處理方法,可以獲得一系列固有模態(tài)函數(shù)分量(Intrinsic Mode Function,IMF)。將這種方法應(yīng)用到腦電信號的處理過程中能得到較好的效果。

1EMD算法

  經(jīng)驗(yàn)?zāi)J椒纸馑惴?Empirical Mode Decomposition,EMD)[8]是一種自適應(yīng)的數(shù)據(jù)處理或挖掘方法,非常適合非線性非平穩(wěn)的時(shí)間序列。其本質(zhì)是通過數(shù)據(jù)的時(shí)間尺度來獲得本征波動模式,然后分解數(shù)據(jù)。這種分解過程可以形象地稱之為“篩選(sifting)”過程。

  在理論上,EMD可以應(yīng)用于任何類型的時(shí)間序列(信號)的分解,因而在處理非平穩(wěn)及非線性數(shù)據(jù)上,比之前的方法具有更明顯的優(yōu)勢。所以,EMD[9-10]方法一經(jīng)提出就在不同的工程領(lǐng)域得到了迅速有效的應(yīng)用。

  該方法的關(guān)鍵是它能使復(fù)雜信號分解為有限個(gè)本征模函數(shù),所分解出來的各IMF分量包含了原信號的不同時(shí)間尺度的局部特征信號。EMD分解方法基于以下假設(shè)條件:

  (1)數(shù)據(jù)至少有兩個(gè)極值,一個(gè)最大值和一個(gè)最小值;

  (2)數(shù)據(jù)的局部時(shí)域特性是由極值點(diǎn)間的時(shí)間尺度來唯一確定;

  (3)如果數(shù)據(jù)沒有極值點(diǎn)但有拐點(diǎn),則可以通過對數(shù)據(jù)微分一次或多次求得極值,然后再通過積分來獲得分解結(jié)果。

  設(shè)原始信號為X(t),EMD算法的計(jì)算步驟如下:

 ?。?)找出原數(shù)據(jù)序列X(t)的所有極大值點(diǎn)和極小值點(diǎn),將其用三次樣條函數(shù)擬合為原序列的上、下包絡(luò)線,分別為u(t)和v(t),可得包絡(luò)線的平均值m11:

  m11=1/2(u(t)+v(t))(1)

 ?。?)將原數(shù)據(jù)序列減去包絡(luò)平均值m11,得到一個(gè)減去低頻的新序列h11:

  h11=X(t)-m11(t)(2)

 ?。?)h11不一定是平穩(wěn)數(shù)據(jù)序列,用h11(t)代替原始信號X(t),重復(fù)上述過程k次,直到所得包絡(luò)趨近于零,這樣可以得到第一個(gè)本征模函數(shù)(IMF)。分量c1=h1k(t),它表示信號數(shù)據(jù)序列最高頻率的成分。

 ?。?)用X(t)減去c1,得到一個(gè)去掉高頻成分的新數(shù)據(jù)序列r1;對r1再進(jìn)行上述分解,得到第二個(gè)本征模函數(shù)(IMF)分量c2;如此重復(fù):

  r2=r1-c2

  r3=r2-c3

  …

  rn=rn-1-cn

  (5)當(dāng)?shù)趎個(gè)剩余量rn已成為單調(diào)函數(shù),無法再分解IMF時(shí),整個(gè)EMD分解過程完成。原始信號可以表示為將一個(gè)頻率不規(guī)則的波化為多個(gè)單一頻率的波與殘波相加的形式。即:

  X(t)=∑ci+rn(3)

  然而腦電信號其背景噪聲很強(qiáng),在對腦電信號進(jìn)行EMD分解時(shí),通常不能將信號與噪聲徹底分開,在每一個(gè)輸出的軌道之中,或多或少都摻雜著一些噪聲,選擇合適的IMF分量顯得尤為重要。這里引入相關(guān)系數(shù)的概念,借此權(quán)衡各個(gè)IMF的有效性。

2運(yùn)動想象腦電信號識別算法

  2.1基于相關(guān)系數(shù)的特征提取

  相關(guān)系數(shù)是用以反映變量之間相關(guān)關(guān)系密切程度的統(tǒng)計(jì)指標(biāo)。相關(guān)系數(shù)是按積差方法進(jìn)行計(jì)算,同樣以兩變量與各自平均值的離差為基礎(chǔ),通過兩個(gè)離差相乘來反映兩變量之間的相關(guān)程度。是判斷特征選取的一個(gè)方法。

  相關(guān)系數(shù)的定義:假設(shè)有兩個(gè)隨機(jī)變量X和Y,則它們的相關(guān)系數(shù)為:

  r=Cov(X,Y)σXσY

  =E[{X-E(X)}{Y-E(Y)}][E{X-E(X)2}]12[E{Y-E(Y)}2]12(4)

  其中,Cov(X,Y)為隨機(jī)變量X與Y的協(xié)方差函數(shù),σX、σY分別指X、Y的標(biāo)準(zhǔn)差,E(X)、E(Y)為兩者的平均值。相關(guān)系數(shù)r的取值范圍是[-1,1],表示變量之間相關(guān)程度的高低,r的絕對值越大,說明這兩個(gè)變量之間相關(guān)程度越高。r>0表示正相關(guān),r<0表示負(fù)相關(guān),特殊地,r=1稱為完全正相關(guān),r=-1稱為完全負(fù)相關(guān),r=0稱為不相關(guān)。

  對原信號進(jìn)行EMD分解后,得到n階IMF分量和殘波。根據(jù)各個(gè)IMF分量與原信號的相關(guān)系數(shù)來選擇更合適的IMF分量。設(shè)原信號序列為X(n),信號的IMF分量為Yi(n),其中i表示第i個(gè)IMF分量,則相關(guān)系數(shù)的定義如下:

  5.png

  使用EMD分解原信號得到IMF分量后,在眾多分量中包含的有用信息各不相同,同時(shí)包含了噪聲。為了得到更好的特征,提高左右腦電信號的分辨率,本文通過相關(guān)系數(shù)選擇合適的分量。分別取各階IMF分量的能量單獨(dú)作為該信號的特征,因?yàn)槊拷M腦電信號只取一個(gè)IMF分量,所以這里只考慮能量特征。計(jì)算公式如下:

  El=∑ni=1[c(i)2](6)

  其中,El對應(yīng)了第l個(gè)IMF分量的能量,c(i)表示該分量中的第i個(gè)數(shù)值,n表示該分量的長度。本文中n為140。

  一組信號可得到唯一能量特征。表1給出各階IMF分量與原信號之間的相關(guān)系數(shù),及只取相應(yīng)能量特征作為腦電信號的特征后的左右手腦電信號識別率。

001.jpg

  由表1可知,IMF2分量與原信號的相關(guān)系數(shù)最大,最適合進(jìn)行特征提取。各階IMF分量以與原信號的相關(guān)系數(shù)從大到小排列,分別為IMF2、IMF1、IMF3、IMF4和IMF5。當(dāng)IMF分量與原信號的相關(guān)系數(shù)越大時(shí),采用該分量作為條件提取特征得到的信號識別率越高,從而該IMF分量比其他IMF分量更適合進(jìn)行特征提取。

  然而只用單一的IMF分量并不能達(dá)到很高的識別率。這里考慮使用多個(gè)IMF分量進(jìn)行特征選取。當(dāng)選取多個(gè)IMF分量時(shí),除能量特征外,腦電信號的特征還包括平均幅度差。

  在進(jìn)行EMD算法分解時(shí),得到的各階IMF分量是從高頻到低頻的腦電信號分解,所以可以看出,同階不同通道信號之間有時(shí)幅值波動相差過大,因此此處定義平均幅度差作為一個(gè)特征值,計(jì)算公式如下:

  7.png

  其中,ci是第i個(gè)IMF分量,cj表示第j個(gè)分量(i≠j),n為信號的長度,這里n為140。分別計(jì)算不同IMF分量個(gè)數(shù)來提取特征時(shí)的腦電信號分類正確率,如表2所示。

002.jpg 

  表2中,分量順序根據(jù)與原信號的相關(guān)系數(shù)從大到小排列,分別是:IMF2、IMF1、IMF3、IMF4、IMF5。分量選取從第一個(gè)開始取,如當(dāng)IMF分量個(gè)數(shù)為2時(shí),所取分量為IMF2、IMF1。實(shí)驗(yàn)數(shù)據(jù)表明,取前3個(gè)分量達(dá)到了最好的分類效果。當(dāng)所取IMF分量個(gè)數(shù)過多時(shí),信號包含的無效信息比例也會同時(shí)增加,對分類會造成更大的影響,且前3個(gè)分量包含了原始信號約90%的能量,故能達(dá)到較好效果。

  2.2本文算法

  本文選擇的腦電信號識別算法是基于相關(guān)系數(shù)改進(jìn)的EMD算法。EMD算法是一種非線性分析方法,同時(shí)具有對信號自適應(yīng)的分解能力,能通過度量腦電信號的復(fù)雜度來反映腦電的特征。對得到的腦電數(shù)據(jù)進(jìn)行預(yù)處理后,進(jìn)行EMD分解從而得到IMF分量和余量。但是腦電信號中仍然包含了無用信息,在使用EMD算法進(jìn)行分解過程中,無法將噪聲信號徹底分解出來。故采用基于相關(guān)系數(shù)改進(jìn)的EMD算法,選擇與原信號相關(guān)系數(shù)最大的3個(gè)IMF分量:IMF1、IMF2、IMF3。由這3個(gè)分量可以得到3個(gè)能量特征和兩個(gè)平均幅度差特征,送入SVM[1112]進(jìn)行分類。在SVM過程中先用訓(xùn)練數(shù)據(jù)得出訓(xùn)練模型,再用測試數(shù)據(jù)得到實(shí)驗(yàn)結(jié)果。本文算法的具體步驟如下:

 ?。?)對腦電信號進(jìn)行預(yù)處理;

 ?。?)從訓(xùn)練數(shù)據(jù)中取一組信號中1 s的腦電數(shù)據(jù)進(jìn)行EMD算法分解;

 ?。?)計(jì)算各階IMF分量與原信號的相關(guān)系數(shù),選出3個(gè)相關(guān)系數(shù)最大的IMF分量;

 ?。?)由IMF分量得到能量特征和平均幅度差;

 ?。?)將數(shù)據(jù)特征送入SVM進(jìn)行訓(xùn)練;

 ?。?)載入測試數(shù)據(jù)得到結(jié)果,從而得出實(shí)驗(yàn)結(jié)論。

3實(shí)驗(yàn)分析

  3.1實(shí)驗(yàn)數(shù)據(jù)

  本文實(shí)驗(yàn)數(shù)據(jù)采用奧地利格拉茲工業(yè)大學(xué)腦機(jī)接口研究中心提供的運(yùn)動想象腦電數(shù)據(jù)(Data setⅢ)[13]。該數(shù)據(jù)集的受試主體為25歲女性,主體以放松狀態(tài)坐在顯示器前,顯示器呈現(xiàn)提示信息。根據(jù)出現(xiàn)的左右線索想象左右手運(yùn)動,從而得到反饋數(shù)據(jù),其中左右線索的順序是隨機(jī)的。

  實(shí)驗(yàn)共得到280次長度為9 s的腦電數(shù)據(jù),140次為訓(xùn)練樣本(70 次想象左手運(yùn)動,70 次想象右手運(yùn)動),另140次作為測試樣本。在前2 s主體保持放松,在第2 s屏幕出現(xiàn)十字光標(biāo),持續(xù)時(shí)間1 s,提示實(shí)驗(yàn)即將開始。第3 s 屏幕出現(xiàn)左右箭頭,主體根據(jù)提示信息想象左右手運(yùn)動,即該數(shù)據(jù)的有效時(shí)間段為4 s~9 s。

  該信號的采集頻率為128 Hz,再經(jīng)過0.5~30 Hz的帶通濾波器。實(shí)驗(yàn)采用Ag/AgCl電極,通過C3、Cz、C4三個(gè)通道獲得反饋數(shù)據(jù),其中,C3、C4電極位于大腦的初級感覺皮層運(yùn)動功能區(qū),能反映主體在想象左右手運(yùn)動時(shí)大腦狀態(tài)的變化,Cz作為參考電極。實(shí)際分析時(shí)只采用了 C3、C4 這 2 個(gè)通道的數(shù)據(jù)。

  3.2實(shí)驗(yàn)分析

  實(shí)驗(yàn)數(shù)據(jù)為280組長度為9 s的腦電數(shù)據(jù),其中4~9 s為有效時(shí)間區(qū)間,但是考慮信號的有效性,選擇4~8 s的腦電數(shù)據(jù)作為實(shí)驗(yàn)數(shù)據(jù)。以一個(gè)通道的1 s數(shù)據(jù)作為一小段數(shù)據(jù)進(jìn)行EMD分解,得到IMF分量后,計(jì)算各階IMF分量與原始信號的相關(guān)系數(shù),按照相關(guān)系數(shù)由大到小選取最大的3階IMF分量進(jìn)行特征提取。對于一組一個(gè)通道中1 s的數(shù)據(jù)包含3個(gè)能量特征和2個(gè)平均幅值差,則一組數(shù)據(jù)一共包含40個(gè)特征。采用十折交叉驗(yàn)證法將訓(xùn)練數(shù)據(jù)的特征采樣送入SVM,并確定SVM的核參數(shù)。將測試數(shù)據(jù)提取特征后送入SVM的分類模型進(jìn)行分類。分類結(jié)果如表3所示。

003.jpg

  從表3可以看出,采用結(jié)合相關(guān)系數(shù)的EMD特征提取方式能獲得更高的識別率。其中訓(xùn)練集的識別率達(dá)到92.86%,測試集的分類正確率達(dá)到88.57%,這個(gè)結(jié)果非常接近BCI大賽中第一名的分類結(jié)果。由此改進(jìn)后的EMD算法更加適合腦電特征提取。

  4結(jié)束語

  本文提出通過相關(guān)系數(shù)來改進(jìn)EMD對腦電信號特征的提?。?4]。通過分析EMD分量與原信號之間的相關(guān)系數(shù)來確定相應(yīng)的特征組成特征向量,輸入SVM分類器中,從而實(shí)現(xiàn)左右手運(yùn)動想象腦電信號的分類。研究結(jié)果表明,采用相關(guān)系數(shù)改進(jìn)的EMD提取腦電特征的正確率明顯高于僅采用EMD的腦電特征提取方法。因此,基于相關(guān)系數(shù)改進(jìn)的EMD算法在運(yùn)動想象腦電信號的識別研究中具有很高的應(yīng)用價(jià)值。

  參考文獻(xiàn)

 ?。?] 徐寶國,何樂生,宋愛國.基于腦電信號的人機(jī)交互實(shí)驗(yàn)平臺的設(shè)計(jì)和應(yīng)用[J].電子測量與儀器學(xué)報(bào),2008, 22(1):8185.

 ?。?] 高上凱. 淺談腦機(jī)接口的發(fā)展現(xiàn)狀與挑戰(zhàn)[J]. 中國生物醫(yī)學(xué)工程學(xué)報(bào), 2007. 26(6):801803.

  [3] 王斐,張育中,寧廷會,等.腦—機(jī)接口研究進(jìn)展[J].智能系統(tǒng)學(xué)報(bào),2011,6(3):189199.

 ?。?] TANAKA K,MATSUNAGA K,WANG H.Electroencephalogrambased control of an electric wheelchair[J].IEEE Transactions on Robotics,2005,21( 4) : 762766.

  [5] 張毅,楊柳,李敏,等.基于AR 和SVM的運(yùn)動想象腦電信號識別[J].華中科技大學(xué)學(xué)報(bào)(自然科學(xué)版),2011,39(Z2):103106.

 ?。?] 徐寶國,宋愛國.單次運(yùn)動想象腦電的特征提取和分類[J].東南大學(xué)學(xué)報(bào)(自然科學(xué)版),2007,37(4):629633.

  [7] 李明愛,王蕊,郝冬梅.想象左右手運(yùn)動的腦電特征提取及分類研究[J].中國生物醫(yī)學(xué)工程學(xué)報(bào),2009,28(2):166170.

 ?。?] 張小莉,張歆,孫進(jìn)才.基于經(jīng)驗(yàn)?zāi)B(tài)分解的目標(biāo)特征提取與選擇[J].西北工業(yè)大學(xué)學(xué)報(bào),2006,24(4):453456.

  [9] 余煒,韓強(qiáng),馬晶晶,等.基于EMD和SVM的腦電信號處理方法[J].昆明理工大學(xué)學(xué)報(bào)(自然科學(xué)版),2012,37(6):3842.

 ?。?0] 金晶,王行愚,張秀,等.基于能量特征的左右手運(yùn)動想象鬧心好的識別方法[J].科學(xué)通報(bào),2001,46(3):257263.

 ?。?1] 安文娟. Fisher和支持向量綜合分類器[D]. 大連:遼寧師范大學(xué), 2010.

 ?。?2] 李金華.基于SVM的多類文本分類研究[D]. 青島:山東科技大學(xué),2010.

 ?。?3] Sun Shiliang, Zhang Changshui.Adaptive feature extraction for EEG signal classification[J]. Medical & Biological Engineering & Computing,2006,44(10):931935.

  [14] RAKOTOMAMONJY A, GUIGUE V. BCI competition III: dataset IIensemble of SVERP for BCI P300 speller[J].IEEE Transactions on Biomedical Engineering, 2008, 55 (3):11471154 .


此內(nèi)容為AET網(wǎng)站原創(chuàng),未經(jīng)授權(quán)禁止轉(zhuǎn)載。