王旭文
(南京郵電大學(xué) 通信與信息工程學(xué)院,江蘇 南京 210003)
摘要:復(fù)雜度理論已成為研究生理電信號(hào)的熱點(diǎn),而符號(hào)轉(zhuǎn)移熵是一種反映系統(tǒng)混亂程度的非線性指標(biāo)。文章在原有多變量轉(zhuǎn)移熵的基礎(chǔ)上提出了多變量符號(hào)轉(zhuǎn)移熵,對(duì)傳統(tǒng)時(shí)間序列靜態(tài)劃分方法做出了改進(jìn),即將時(shí)間序列使用動(dòng)態(tài)自適應(yīng)分割的方式進(jìn)行符號(hào)化。應(yīng)用該算法對(duì)正常人和冠心病患者的心電信號(hào)進(jìn)行分析,在實(shí)驗(yàn)中選取最佳的導(dǎo)聯(lián)對(duì),結(jié)果表明該算法能夠顯著區(qū)分正常人和冠心病患者,對(duì)原始心電時(shí)間序列疊加上高斯噪聲后依然可靠有效。
關(guān)鍵詞:生理電信號(hào);多變量符號(hào)轉(zhuǎn)移熵;動(dòng)態(tài)自適應(yīng)分割
中圖分類號(hào):TN911.23文獻(xiàn)標(biāo)識(shí)碼:ADOI: 10.19358/j.issn.16747720.2016.23.017
引用格式:王旭文. 基于多變量符號(hào)轉(zhuǎn)移熵的心電信號(hào)研究[J].微型機(jī)與應(yīng)用,2016,35(23):59-61,68.
0引言
人體最重要的生理信號(hào)就是電信號(hào),電信號(hào)會(huì)隨著時(shí)間的變化而產(chǎn)生瞬時(shí)的變化,這是因?yàn)槿梭w的生理狀態(tài)和病理狀態(tài)是不同的。符號(hào)轉(zhuǎn)移熵作為一個(gè)生理電信號(hào)特征,在生理電活動(dòng)信號(hào)的特征提取與分析中發(fā)揮了越來(lái)越重要的作用[1]。
從臨床醫(yī)學(xué)方面來(lái)說(shuō),心電信號(hào)是心臟電活動(dòng)體表的綜合反映,因此,臨床心電圖檢驗(yàn)對(duì)于檢測(cè)和診斷心臟疾病有著十分重要的意義,并且對(duì)生命信息科學(xué)也有著十分重要的研究?jī)r(jià)值。
本文首先提出多變量符號(hào)轉(zhuǎn)移熵算法,該算法主要用來(lái)分析心電信號(hào)的多變量符號(hào)轉(zhuǎn)移熵值,采用自適應(yīng)動(dòng)態(tài)化方法劃分時(shí)間序列[2]。然后通過(guò)正常人與冠心病患者的心電數(shù)據(jù)對(duì)比,傳統(tǒng)算法與所提算法對(duì)比,以及疊加與不疊加高斯噪聲對(duì)比,表明所提算法具有良好性能[3]。
1多變量符號(hào)轉(zhuǎn)移熵
1.1多變量轉(zhuǎn)移熵
測(cè)量時(shí)間序列復(fù)雜性的一種主要方法就是熵,熵具有使用簡(jiǎn)單、計(jì)算速度快、抗噪性能好等優(yōu)勢(shì)。轉(zhuǎn)移熵是基于選擇信息理論測(cè)量,它共享了一些有用的互信息之間的性質(zhì),同時(shí)還將動(dòng)力學(xué)信息傳輸考慮在內(nèi)。但它涉及到無(wú)窮向量,很難可靠地估計(jì)高維變量。針對(duì)這個(gè)問題提出了多變量轉(zhuǎn)移熵算法:給定一個(gè)平穩(wěn)多元離散時(shí)間隨機(jī)過(guò)程X,其子過(guò)程為Y,Z,W…,在時(shí)間t時(shí)刻的值為Xt,Yt…。它們的過(guò)去時(shí)刻過(guò)程定義為X-t=(Xt-1,Xt-2,…)和Y-t=(Yt-1,Yt-2,…),并把Y-t作為X-t的一個(gè)子集。轉(zhuǎn)移熵ITEX->Y=I(Y-t;Zt|X-t\Y-t)是在已知條件X-t\Y-t下,Y-t到Zt的不確定度。在多變量轉(zhuǎn)移熵的公式中存在兩個(gè)無(wú)限維的成分:X-t和X-t\Y-t。
1.2原始序列符號(hào)化
符號(hào)動(dòng)力學(xué)是研究符號(hào)動(dòng)力系統(tǒng)的一種復(fù)雜抽象的數(shù)學(xué)理論。在符號(hào)動(dòng)力學(xué)系統(tǒng)中,系統(tǒng)的狀態(tài)可以表示成有限個(gè)抽象符號(hào)的無(wú)窮序列。
符號(hào)時(shí)間序列分析方法是指把原始的時(shí)間序列轉(zhuǎn)化成由若干個(gè)符號(hào)組成的時(shí)間序列,然后進(jìn)行分析的一種“粗略”方法[4]。在把原始時(shí)間序列符號(hào)化的進(jìn)程中,時(shí)間序列會(huì)不可避免地失去一部分細(xì)節(jié)信息。盡管失去了一部分的細(xì)節(jié)信息,原始時(shí)間序列的動(dòng)力學(xué)特征還是保存了下來(lái)。在計(jì)算中使用符號(hào)化后的符號(hào)序列來(lái)代替原始的時(shí)間序列,會(huì)極大地提高計(jì)算數(shù)值的速度。
對(duì)原始時(shí)間序列進(jìn)行符號(hào)化分析的過(guò)程中,最關(guān)鍵的是采取什么樣的方式來(lái)對(duì)原始時(shí)間序列的值劃分相應(yīng)的符號(hào)區(qū)域,然后把原始時(shí)間序列轉(zhuǎn)化成符號(hào)序列,有些符號(hào)動(dòng)力學(xué)分析方法首先采用靜態(tài)范圍來(lái)劃分符號(hào)區(qū)域,然后再進(jìn)行符號(hào)的轉(zhuǎn)化。
因?yàn)槎嘧兞哭D(zhuǎn)移熵算法對(duì)其中的參數(shù)有比較高的協(xié)調(diào)性要求,而且對(duì)噪聲也是比較敏感的,因此又引入了基于符號(hào)化技術(shù)的新辦法,形成多變量符號(hào)轉(zhuǎn)移熵[5],即將序列X轉(zhuǎn)換成符號(hào)序列S=s1,s2,…,si,…,sn,si∈A(A=0,1,2,3),序列Y轉(zhuǎn)換成符號(hào)序列J=j1,j2,…,ji,…,jn,ji∈A(A=0,1,2,3),序列Z轉(zhuǎn)換成符號(hào)序列K=k1,k2,…,ki,…,kn,ki∈A(A=0,1,2,3)。
1.3改進(jìn)的多變量符號(hào)轉(zhuǎn)移熵
在過(guò)去的20年,許多傳統(tǒng)的算法都可以用來(lái)估計(jì)時(shí)間序列的復(fù)雜性,如維度和Lyapunov指數(shù)等。這些算法雖然都能夠正確地估計(jì)復(fù)雜性,但是它們通常都需要很長(zhǎng)的數(shù)據(jù)集來(lái)統(tǒng)計(jì)結(jié)果,不便于在臨床上研究和應(yīng)用。
使用動(dòng)態(tài)自適應(yīng)的方法來(lái)劃分原始時(shí)間序列能夠更精確地捕捉時(shí)間序列中的動(dòng)力學(xué)特征。動(dòng)態(tài)自適應(yīng)劃分方法如下:
對(duì)于一個(gè)N點(diǎn)的時(shí)間序列u:u={u(i):1≤i≤N}。對(duì)于時(shí)間序列u(i),在時(shí)間序列中嵌入m維相空間:
其中m是嵌入維數(shù),L是時(shí)間延遲。當(dāng)時(shí)間延遲L選取為1時(shí),m維向量的個(gè)數(shù)是N-m+1。對(duì)于任意一個(gè)m維向量,基本尺度BS是通過(guò)m維向量相鄰兩點(diǎn)之間差值的均方根計(jì)算的:
基于基本尺度,劃分的標(biāo)準(zhǔn)可以看做α×BS(i)。將任一m維向量X(i)轉(zhuǎn)換成符號(hào)化序列S(X(i))=s(i),s(i+1),…,s(i+m-1),s∈A,A∈(0,1,2,3)。符號(hào)轉(zhuǎn)換過(guò)程為:
其中,i=1,2,3,…,N-m+1,k=0,1,2,…,m-1。x是m維矢量X(i)的均值,BS(i)是第i個(gè)m維矢量的基本尺度,符號(hào)0,1,2,3用來(lái)標(biāo)志所有的區(qū)域,這個(gè)值沒有劃分的意義。α是一個(gè)特殊的參數(shù),在將原始時(shí)間序列轉(zhuǎn)化為符號(hào)序列期間,如果α的值過(guò)大,那么將會(huì)丟失詳細(xì)信息,不能捕捉動(dòng)態(tài)信息;若是α值過(guò)小,會(huì)使時(shí)間序列受到比較明顯的噪聲影響。在本文中,α值的選擇使用的是Wessel測(cè)試的方法。示意圖如圖1所示。
改進(jìn)的多變量符號(hào)轉(zhuǎn)移熵是指原始時(shí)間序列使用動(dòng)態(tài)自適應(yīng)進(jìn)行劃分,然后對(duì)符號(hào)化后的序列,利用多變量符號(hào)轉(zhuǎn)移熵進(jìn)行分析[6]。
2基于改進(jìn)算法的心電信號(hào)分析
2.1實(shí)驗(yàn)數(shù)據(jù)
使用從醫(yī)院臨床診斷中采集得到的正常人與冠心病患者的原始心電信號(hào)的時(shí)間序列。該庫(kù)中記錄了包括12個(gè)導(dǎo)聯(lián)信號(hào)(Ⅰ,Ⅱ,Ⅲ,aVR,aVL,aVF,V1,V2,V3,V4,V5,V6)的多參數(shù)腦電數(shù)據(jù),該信號(hào)的記錄長(zhǎng)度均大于1 min,采樣周期為512 Hz。
從正常人的心電數(shù)據(jù)和冠心病患者的心電數(shù)據(jù)中分別隨機(jī)選取20個(gè)人的心電數(shù)據(jù)。選用的數(shù)據(jù)是分別從正常人心電和冠心病患者心電數(shù)據(jù)中取aVL、aVF、I 3個(gè)導(dǎo)聯(lián)信號(hào),即在已知I的條件下,計(jì)算aVL→aVF的多變量符號(hào)轉(zhuǎn)移熵(由實(shí)驗(yàn)證實(shí),aVL、aVF、I導(dǎo)聯(lián)具有較好的區(qū)分度,故選擇aVL、aVF、I導(dǎo)聯(lián)作為研究對(duì)象)。將這兩組數(shù)據(jù)分別記為樣本“正常”及樣本“冠心”。
2.2實(shí)驗(yàn)方法
首先讀取各組原始數(shù)據(jù)中有效的心電時(shí)間序列,對(duì)原始心電數(shù)據(jù)進(jìn)行符號(hào)化處理,然后對(duì)符號(hào)化后的時(shí)間序列計(jì)算其多變量符號(hào)轉(zhuǎn)移熵值,對(duì)計(jì)算出來(lái)的結(jié)果使用SPSS統(tǒng)計(jì)分析軟件進(jìn)行顯著性查驗(yàn)來(lái)驗(yàn)證該算法的有效性[7]。
2.3實(shí)驗(yàn)結(jié)果與分析
從“正?!迸c“冠心”樣本中對(duì)每個(gè)個(gè)體的腦電信號(hào)序列每隔一個(gè)周期取一個(gè)點(diǎn),取出全部的心電時(shí)間序列。對(duì)已經(jīng)取出的心電時(shí)間序列,取長(zhǎng)度為L(zhǎng)=160的原始心電時(shí)間序列來(lái)計(jì)算心電數(shù)據(jù)的多變量符號(hào)熵。
對(duì)每個(gè)時(shí)間原始序列作符號(hào)化處理,計(jì)算每組時(shí)間序列長(zhǎng)度為160的多變量符號(hào)轉(zhuǎn)移熵值,并把計(jì)算的每個(gè)個(gè)體中的各個(gè)多變量符號(hào)轉(zhuǎn)移熵值取平均作為這個(gè)個(gè)體最終的符號(hào)轉(zhuǎn)移熵值。最后對(duì)這20個(gè)正常人和20個(gè)冠心病患者的多變量符號(hào)轉(zhuǎn)移熵值進(jìn)行平均,得到轉(zhuǎn)移熵值。結(jié)果如圖2所示。
由圖2知正常人和冠心病患者在不同的導(dǎo)聯(lián)組下心電信號(hào)的多變量符號(hào)轉(zhuǎn)移熵的結(jié)果比較(橫軸坐標(biāo)表示的含義是:1—Ⅲ-> aVR |I, 2—aVL ->aVF|I, 3—V1-> V2|I, 4—V3-> V4|I, 5—V5-> V6|I)。在5組導(dǎo)聯(lián)信號(hào)中,計(jì)算正常人與冠心病患者心電信號(hào)的多變量符號(hào)轉(zhuǎn)移熵中導(dǎo)聯(lián)aVL和導(dǎo)聯(lián)aVF在導(dǎo)聯(lián)I條件下多變量符號(hào)轉(zhuǎn)移熵值的差值最大,由此可見信號(hào)區(qū)分度最好,所以取aVL和aVF以及I導(dǎo)聯(lián)組數(shù)據(jù)作為分析對(duì)象。
對(duì)正常人與冠心病患者的心電信號(hào)的多變量符號(hào)轉(zhuǎn)移熵值進(jìn)行基本研究后,根據(jù)平均值與方差繪制成圖,如圖3所示。
使用SPSS統(tǒng)計(jì)分析軟件對(duì)提出的算法的準(zhǔn)確性及有效性進(jìn)行進(jìn)一步驗(yàn)證,將計(jì)算結(jié)果進(jìn)行獨(dú)立T檢驗(yàn)分析[8]。結(jié)果如表1所示。
由表1可知,t=3.163,Sig=0.003<0.05, 這說(shuō)明正常人與冠心病患者心電信號(hào)的多變量符號(hào)轉(zhuǎn)移熵的差異性非常顯著,該算法可以有效地區(qū)分正常人與冠心病患者。
對(duì)樣本“正常”和“冠心”的心電數(shù)據(jù)采用傳統(tǒng)符號(hào)化計(jì)算的多變量符號(hào)轉(zhuǎn)移熵和改進(jìn)的多變量符號(hào)轉(zhuǎn)移熵比較,分析對(duì)比結(jié)果如圖4所示。
圖4表明無(wú)論是正常人還是冠心病患者,改進(jìn)算法的熵值均大于傳統(tǒng)算法的熵值,而且可以有效區(qū)分正常人和冠心病患者,說(shuō)明改進(jìn)的多變量符號(hào)轉(zhuǎn)移熵在心電信號(hào)上優(yōu)于傳統(tǒng)的多變量符號(hào)轉(zhuǎn)移熵。
對(duì)原始的心電時(shí)間序列疊加上高斯白噪聲后[9],使用改進(jìn)多變量符號(hào)轉(zhuǎn)移熵算法計(jì)算正常人及冠心病患者心電信號(hào)的多變量符號(hào)轉(zhuǎn)移熵值,與未疊加高斯噪聲的多變量符號(hào)轉(zhuǎn)移熵值對(duì)比,結(jié)果如圖5所示。
由圖5可知,疊加上高斯白噪聲后正常人及冠心病患者的多變量符號(hào)轉(zhuǎn)移熵值并沒有太大的變化,這說(shuō)明改進(jìn)的多變量符號(hào)轉(zhuǎn)移熵算法穩(wěn)健性高。
3結(jié)論
本文提出的多變量符號(hào)轉(zhuǎn)移熵算法,目的是為了計(jì)算電信號(hào)原始時(shí)間序列的多變量符號(hào)轉(zhuǎn)移熵值,來(lái)區(qū)分正常人及患者。應(yīng)用多變量符號(hào)轉(zhuǎn)移熵在心電信號(hào)上,能實(shí)現(xiàn)預(yù)想的效果,對(duì)心電信號(hào)的研究及臨床輔助診斷都有很大的幫助。
但是,該算法還有很多的不足和改進(jìn)空間。一方面,多變量符號(hào)轉(zhuǎn)移熵可以應(yīng)用在更廣泛的生理信號(hào)領(lǐng)域,比如腦電信號(hào);另一方面,理論研究還需要與實(shí)際臨床醫(yī)學(xué)疾病的診斷和醫(yī)治進(jìn)行更為密切的結(jié)合,進(jìn)一步提高算法和研究的實(shí)際應(yīng)用價(jià)值及可操作性。
參考文獻(xiàn)
?。?] 王俊. ECG 信號(hào)的非線性特性研究[D].南京:南京大學(xué), 2005.
?。?] WESSEL N, ZIEHMANN C, KURTHS J, et al. Shortterm forecasting of lifethreatening cardiac arrhythmias based on symbolic dynamics and finitetime growth rates[J]. Physical Review E Statistical Physics Plasmas Fluids & Related Interdisciplinary Topics, 2000, 61(1):733-741.
?。?] 宋愛玲, 黃曉林, 司峻峰,等. 符號(hào)動(dòng)力學(xué)在心率變異性分析中的參數(shù)選擇[J]. 物理學(xué)報(bào),2011,60(2):120-127.
?。?] 曹雪虹,張宗橙.信息論與編碼[M].北京:清華大學(xué)出版社,2004.
[5] 井曉茹.基于符號(hào)轉(zhuǎn)移熵和平均能量耗散的睡眠分期分析[D].南京:南京郵電大學(xué),2012.
?。?] FERNANDO L D S.EEG and MEG:relevance to neuroscience[J]. Neuron, 2013, 80(5):1112-1128.
?。?] FEIGE B, VODERHOLZER U, RIEMANN D, et al. Independent sleep EEG slowwave and spindle band dynamics associated with 4 weeks of continuous application of shorthalf life hypnotics in healthy subjects[J]. Scandinavian Journal of Public Health, 1999, 110(11):1965-1974.
[8] 陳志云, 袁華萍, 李敬紅,等. 動(dòng)態(tài)心電圖學(xué)在現(xiàn)代診療中的進(jìn)展[J]. 中國(guó)醫(yī)學(xué)文摘:內(nèi)科學(xué), 2004(1):100-101.
?。?] 陳天華, 韓力群, 鄭彧. 心電信號(hào)噪聲的數(shù)字濾波研究[J]. 微計(jì)算機(jī)信息, 2008,24(18):252-254.