王旭文
(南京郵電大學 通信與信息工程學院,江蘇 南京 210003)
摘要:復雜度理論已成為研究生理電信號的熱點,而符號轉移熵是一種反映系統(tǒng)混亂程度的非線性指標。文章在原有多變量轉移熵的基礎上提出了多變量符號轉移熵,對傳統(tǒng)時間序列靜態(tài)劃分方法做出了改進,即將時間序列使用動態(tài)自適應分割的方式進行符號化。應用該算法對正常人和冠心病患者的心電信號進行分析,在實驗中選取最佳的導聯(lián)對,結果表明該算法能夠顯著區(qū)分正常人和冠心病患者,對原始心電時間序列疊加上高斯噪聲后依然可靠有效。
關鍵詞:生理電信號;多變量符號轉移熵;動態(tài)自適應分割
中圖分類號:TN911.23文獻標識碼:ADOI: 10.19358/j.issn.16747720.2016.23.017
引用格式:王旭文. 基于多變量符號轉移熵的心電信號研究[J].微型機與應用,2016,35(23):59-61,68.
0引言
人體最重要的生理信號就是電信號,電信號會隨著時間的變化而產(chǎn)生瞬時的變化,這是因為人體的生理狀態(tài)和病理狀態(tài)是不同的。符號轉移熵作為一個生理電信號特征,在生理電活動信號的特征提取與分析中發(fā)揮了越來越重要的作用[1]。
從臨床醫(yī)學方面來說,心電信號是心臟電活動體表的綜合反映,因此,臨床心電圖檢驗對于檢測和診斷心臟疾病有著十分重要的意義,并且對生命信息科學也有著十分重要的研究價值。
本文首先提出多變量符號轉移熵算法,該算法主要用來分析心電信號的多變量符號轉移熵值,采用自適應動態(tài)化方法劃分時間序列[2]。然后通過正常人與冠心病患者的心電數(shù)據(jù)對比,傳統(tǒng)算法與所提算法對比,以及疊加與不疊加高斯噪聲對比,表明所提算法具有良好性能[3]。
1多變量符號轉移熵
1.1多變量轉移熵
測量時間序列復雜性的一種主要方法就是熵,熵具有使用簡單、計算速度快、抗噪性能好等優(yōu)勢。轉移熵是基于選擇信息理論測量,它共享了一些有用的互信息之間的性質,同時還將動力學信息傳輸考慮在內(nèi)。但它涉及到無窮向量,很難可靠地估計高維變量。針對這個問題提出了多變量轉移熵算法:給定一個平穩(wěn)多元離散時間隨機過程X,其子過程為Y,Z,W…,在時間t時刻的值為Xt,Yt…。它們的過去時刻過程定義為X-t=(Xt-1,Xt-2,…)和Y-t=(Yt-1,Yt-2,…),并把Y-t作為X-t的一個子集。轉移熵ITEX->Y=I(Y-t;Zt|X-t\Y-t)是在已知條件X-t\Y-t下,Y-t到Zt的不確定度。在多變量轉移熵的公式中存在兩個無限維的成分:X-t和X-t\Y-t。
1.2原始序列符號化
符號動力學是研究符號動力系統(tǒng)的一種復雜抽象的數(shù)學理論。在符號動力學系統(tǒng)中,系統(tǒng)的狀態(tài)可以表示成有限個抽象符號的無窮序列。
符號時間序列分析方法是指把原始的時間序列轉化成由若干個符號組成的時間序列,然后進行分析的一種“粗略”方法[4]。在把原始時間序列符號化的進程中,時間序列會不可避免地失去一部分細節(jié)信息。盡管失去了一部分的細節(jié)信息,原始時間序列的動力學特征還是保存了下來。在計算中使用符號化后的符號序列來代替原始的時間序列,會極大地提高計算數(shù)值的速度。
對原始時間序列進行符號化分析的過程中,最關鍵的是采取什么樣的方式來對原始時間序列的值劃分相應的符號區(qū)域,然后把原始時間序列轉化成符號序列,有些符號動力學分析方法首先采用靜態(tài)范圍來劃分符號區(qū)域,然后再進行符號的轉化。
因為多變量轉移熵算法對其中的參數(shù)有比較高的協(xié)調性要求,而且對噪聲也是比較敏感的,因此又引入了基于符號化技術的新辦法,形成多變量符號轉移熵[5],即將序列X轉換成符號序列S=s1,s2,…,si,…,sn,si∈A(A=0,1,2,3),序列Y轉換成符號序列J=j1,j2,…,ji,…,jn,ji∈A(A=0,1,2,3),序列Z轉換成符號序列K=k1,k2,…,ki,…,kn,ki∈A(A=0,1,2,3)。
1.3改進的多變量符號轉移熵
在過去的20年,許多傳統(tǒng)的算法都可以用來估計時間序列的復雜性,如維度和Lyapunov指數(shù)等。這些算法雖然都能夠正確地估計復雜性,但是它們通常都需要很長的數(shù)據(jù)集來統(tǒng)計結果,不便于在臨床上研究和應用。
使用動態(tài)自適應的方法來劃分原始時間序列能夠更精確地捕捉時間序列中的動力學特征。動態(tài)自適應劃分方法如下:
對于一個N點的時間序列u:u={u(i):1≤i≤N}。對于時間序列u(i),在時間序列中嵌入m維相空間:
其中m是嵌入維數(shù),L是時間延遲。當時間延遲L選取為1時,m維向量的個數(shù)是N-m+1。對于任意一個m維向量,基本尺度BS是通過m維向量相鄰兩點之間差值的均方根計算的:
基于基本尺度,劃分的標準可以看做α×BS(i)。將任一m維向量X(i)轉換成符號化序列S(X(i))=s(i),s(i+1),…,s(i+m-1),s∈A,A∈(0,1,2,3)。符號轉換過程為:
其中,i=1,2,3,…,N-m+1,k=0,1,2,…,m-1。x是m維矢量X(i)的均值,BS(i)是第i個m維矢量的基本尺度,符號0,1,2,3用來標志所有的區(qū)域,這個值沒有劃分的意義。α是一個特殊的參數(shù),在將原始時間序列轉化為符號序列期間,如果α的值過大,那么將會丟失詳細信息,不能捕捉動態(tài)信息;若是α值過小,會使時間序列受到比較明顯的噪聲影響。在本文中,α值的選擇使用的是Wessel測試的方法。示意圖如圖1所示。
改進的多變量符號轉移熵是指原始時間序列使用動態(tài)自適應進行劃分,然后對符號化后的序列,利用多變量符號轉移熵進行分析[6]。
2基于改進算法的心電信號分析
2.1實驗數(shù)據(jù)
使用從醫(yī)院臨床診斷中采集得到的正常人與冠心病患者的原始心電信號的時間序列。該庫中記錄了包括12個導聯(lián)信號(Ⅰ,Ⅱ,Ⅲ,aVR,aVL,aVF,V1,V2,V3,V4,V5,V6)的多參數(shù)腦電數(shù)據(jù),該信號的記錄長度均大于1 min,采樣周期為512 Hz。
從正常人的心電數(shù)據(jù)和冠心病患者的心電數(shù)據(jù)中分別隨機選取20個人的心電數(shù)據(jù)。選用的數(shù)據(jù)是分別從正常人心電和冠心病患者心電數(shù)據(jù)中取aVL、aVF、I 3個導聯(lián)信號,即在已知I的條件下,計算aVL→aVF的多變量符號轉移熵(由實驗證實,aVL、aVF、I導聯(lián)具有較好的區(qū)分度,故選擇aVL、aVF、I導聯(lián)作為研究對象)。將這兩組數(shù)據(jù)分別記為樣本“正?!奔皹颖尽肮谛摹?。
2.2實驗方法
首先讀取各組原始數(shù)據(jù)中有效的心電時間序列,對原始心電數(shù)據(jù)進行符號化處理,然后對符號化后的時間序列計算其多變量符號轉移熵值,對計算出來的結果使用SPSS統(tǒng)計分析軟件進行顯著性查驗來驗證該算法的有效性[7]。
2.3實驗結果與分析
從“正?!迸c“冠心”樣本中對每個個體的腦電信號序列每隔一個周期取一個點,取出全部的心電時間序列。對已經(jīng)取出的心電時間序列,取長度為L=160的原始心電時間序列來計算心電數(shù)據(jù)的多變量符號熵。
對每個時間原始序列作符號化處理,計算每組時間序列長度為160的多變量符號轉移熵值,并把計算的每個個體中的各個多變量符號轉移熵值取平均作為這個個體最終的符號轉移熵值。最后對這20個正常人和20個冠心病患者的多變量符號轉移熵值進行平均,得到轉移熵值。結果如圖2所示。
由圖2知正常人和冠心病患者在不同的導聯(lián)組下心電信號的多變量符號轉移熵的結果比較(橫軸坐標表示的含義是:1—Ⅲ-> aVR |I, 2—aVL ->aVF|I, 3—V1-> V2|I, 4—V3-> V4|I, 5—V5-> V6|I)。在5組導聯(lián)信號中,計算正常人與冠心病患者心電信號的多變量符號轉移熵中導聯(lián)aVL和導聯(lián)aVF在導聯(lián)I條件下多變量符號轉移熵值的差值最大,由此可見信號區(qū)分度最好,所以取aVL和aVF以及I導聯(lián)組數(shù)據(jù)作為分析對象。
對正常人與冠心病患者的心電信號的多變量符號轉移熵值進行基本研究后,根據(jù)平均值與方差繪制成圖,如圖3所示。
使用SPSS統(tǒng)計分析軟件對提出的算法的準確性及有效性進行進一步驗證,將計算結果進行獨立T檢驗分析[8]。結果如表1所示。
由表1可知,t=3.163,Sig=0.003<0.05, 這說明正常人與冠心病患者心電信號的多變量符號轉移熵的差異性非常顯著,該算法可以有效地區(qū)分正常人與冠心病患者。
對樣本“正常”和“冠心”的心電數(shù)據(jù)采用傳統(tǒng)符號化計算的多變量符號轉移熵和改進的多變量符號轉移熵比較,分析對比結果如圖4所示。
圖4表明無論是正常人還是冠心病患者,改進算法的熵值均大于傳統(tǒng)算法的熵值,而且可以有效區(qū)分正常人和冠心病患者,說明改進的多變量符號轉移熵在心電信號上優(yōu)于傳統(tǒng)的多變量符號轉移熵。
對原始的心電時間序列疊加上高斯白噪聲后[9],使用改進多變量符號轉移熵算法計算正常人及冠心病患者心電信號的多變量符號轉移熵值,與未疊加高斯噪聲的多變量符號轉移熵值對比,結果如圖5所示。
由圖5可知,疊加上高斯白噪聲后正常人及冠心病患者的多變量符號轉移熵值并沒有太大的變化,這說明改進的多變量符號轉移熵算法穩(wěn)健性高。
3結論
本文提出的多變量符號轉移熵算法,目的是為了計算電信號原始時間序列的多變量符號轉移熵值,來區(qū)分正常人及患者。應用多變量符號轉移熵在心電信號上,能實現(xiàn)預想的效果,對心電信號的研究及臨床輔助診斷都有很大的幫助。
但是,該算法還有很多的不足和改進空間。一方面,多變量符號轉移熵可以應用在更廣泛的生理信號領域,比如腦電信號;另一方面,理論研究還需要與實際臨床醫(yī)學疾病的診斷和醫(yī)治進行更為密切的結合,進一步提高算法和研究的實際應用價值及可操作性。
參考文獻
[1] 王俊. ECG 信號的非線性特性研究[D].南京:南京大學, 2005.
?。?] WESSEL N, ZIEHMANN C, KURTHS J, et al. Shortterm forecasting of lifethreatening cardiac arrhythmias based on symbolic dynamics and finitetime growth rates[J]. Physical Review E Statistical Physics Plasmas Fluids & Related Interdisciplinary Topics, 2000, 61(1):733-741.
?。?] 宋愛玲, 黃曉林, 司峻峰,等. 符號動力學在心率變異性分析中的參數(shù)選擇[J]. 物理學報,2011,60(2):120-127.
?。?] 曹雪虹,張宗橙.信息論與編碼[M].北京:清華大學出版社,2004.
?。?] 井曉茹.基于符號轉移熵和平均能量耗散的睡眠分期分析[D].南京:南京郵電大學,2012.
?。?] FERNANDO L D S.EEG and MEG:relevance to neuroscience[J]. Neuron, 2013, 80(5):1112-1128.
?。?] FEIGE B, VODERHOLZER U, RIEMANN D, et al. Independent sleep EEG slowwave and spindle band dynamics associated with 4 weeks of continuous application of shorthalf life hypnotics in healthy subjects[J]. Scandinavian Journal of Public Health, 1999, 110(11):1965-1974.
[8] 陳志云, 袁華萍, 李敬紅,等. 動態(tài)心電圖學在現(xiàn)代診療中的進展[J]. 中國醫(yī)學文摘:內(nèi)科學, 2004(1):100-101.
?。?] 陳天華, 韓力群, 鄭彧. 心電信號噪聲的數(shù)字濾波研究[J]. 微計算機信息, 2008,24(18):252-254.