摘 要: 三支決策、粗糙集、集對(duì)分析以及模式識(shí)別理論都是處理模糊和不確定性知識(shí)的有效理論。分析三支決策與粗糙集、集對(duì)分析、模式識(shí)別的相似和想通之處,并將它們相互滲透,為今后三支決策理論的進(jìn)一步發(fā)展和完善奠定理論基礎(chǔ)。
關(guān)鍵詞: 三支決策;粗糙集;集對(duì)分析;模式識(shí)別;不確定性
三支決策理論是姚一豫等人在粗糙集[1]和決策粗糙集[2]基礎(chǔ)上提出的新的決策理論。2012年10月召開(kāi)的中國(guó)粗糙集與軟計(jì)算會(huì)議上,姚一豫教授系統(tǒng)地介紹了三支決策理論的背景、框架、模型及應(yīng)用。“三支決策理論與應(yīng)用”[3]標(biāo)志著三支決策由粗糙集的三個(gè)區(qū)間的語(yǔ)義解釋逐步發(fā)展為在一種不確定或不完整信息條件下的決策理論。許多學(xué)者研究和拓展了三支決策理論,并將其應(yīng)用于多個(gè)學(xué)科領(lǐng)域。2013年在漳州舉辦的中國(guó)rough集與軟計(jì)算學(xué)術(shù)會(huì)議上還專(zhuān)門(mén)開(kāi)設(shè)了三支決策討論班,來(lái)自各地的專(zhuān)家學(xué)者討論了三支決策的研究新進(jìn)展及其未來(lái)的發(fā)展方向。三支決策用接受、拒絕和不承諾表示決策的三種類(lèi)型。與此理論研究的不確定信息的處理相關(guān)的理論還有誕生于20世紀(jì)20年代、在60年代初迅速發(fā)展成一門(mén)學(xué)科的模式識(shí)別理論[4]和1989年我國(guó)學(xué)者趙克勤首次提出的集對(duì)分析理論[5]。模式識(shí)別過(guò)程是從樣本空間到類(lèi)別空間的一個(gè)映射過(guò)程,也就是將觀察目標(biāo)與已有模式相比較、配準(zhǔn),判斷其類(lèi)屬的過(guò)程。集對(duì)分析是以集對(duì)及其聯(lián)系度的基本概念,刻畫(huà)和研究系統(tǒng)中廣泛存在著的確定性與不確定性及其轉(zhuǎn)化規(guī)律的一種系統(tǒng)分析技術(shù)。本文針對(duì)三支決策、粗糙集、集對(duì)分析、模式識(shí)別4種理論的基本思想、對(duì)確定性和不確定性的處理、已有的研究方向、應(yīng)用領(lǐng)域幾個(gè)方面進(jìn)行綜述,總結(jié)和展望三支決策理論與其他理論可以相互借鑒、相互滲透的地方。
1 基本思想
1.1 粗糙集
三支決策最初的提出是為了對(duì)粗糙集的3個(gè)區(qū)間給出一個(gè)合理的語(yǔ)義解釋。因此首先介紹粗糙集的基本思想。
給定一個(gè)知識(shí)庫(kù)K=(U,R),其中R為U上的一個(gè)等價(jià)關(guān)系。如果某個(gè)實(shí)體X可以用一些R基本范疇的并表示,則X是R可定義的;如果實(shí)體X不能用一些R基本范疇的并表示,則X是R不可定義的。R不可定義集又稱(chēng)作粗糙集。對(duì)于無(wú)法用一個(gè)精確集定義的粗糙集,可以用兩個(gè)精確集來(lái)進(jìn)行近似定義。同時(shí)把這兩個(gè)精確集稱(chēng)為粗糙集的上近似集和下近似集[2]:
下近似:RX=∪{Y∈U/R|Y?哿X}
上近似:RX=∪{Y∈U/R|Y∩X≠?椎}
其中posR(X)=RX稱(chēng)為X的R正域,negR(X)=U-RX稱(chēng)為X的R負(fù)域,bnR(X)=RX-RX稱(chēng)為X的R邊界域。根據(jù)定義,在知識(shí)R劃分下,posR(X)中的元素一定屬于X;negR(X)中的元素一定不屬于X;bnR(X)中的元素不能準(zhǔn)確判斷是否屬于X。
定理1:(1)X是R可定義集當(dāng)且僅當(dāng)RX=RX;
(2)X是R粗糙集當(dāng)且僅當(dāng)RX≠RX。
1.2 三支決策
三支決策理論的基本思想是在實(shí)體評(píng)價(jià)函數(shù)上引入兩個(gè)閾值,并構(gòu)造所需要的3個(gè)域。設(shè)U是有限、非空實(shí)體集或者決策方案集;C是有限條件集,條件集可能包含指標(biāo)、目標(biāo)或約束。決策任務(wù)是基于給定條件對(duì)每一個(gè)實(shí)體x∈U作出相應(yīng)決策。條件集C給出了決策的依據(jù),通過(guò)構(gòu)造評(píng)價(jià)函數(shù)給出決策。當(dāng)信息不確定或者不完整時(shí),可能無(wú)法確定實(shí)體是否屬于滿(mǎn)足條件,也就是評(píng)價(jià)函數(shù)是對(duì)實(shí)體滿(mǎn)足條件的一種估計(jì)而非精確值。由于這種估計(jì)的不確定性,采用二值決策可能比較困難,在評(píng)價(jià)函數(shù)值既不很高也不很低時(shí),不論是接受或拒絕都不合理。此時(shí)引入三支決策,給定閾值?琢和?茁:
(1)當(dāng)評(píng)價(jià)函數(shù)值大于或等于?琢?xí)r,接受該實(shí)體;
(2)當(dāng)評(píng)價(jià)函數(shù)值小于或等于?茁時(shí),拒絕該實(shí)體;
(3)當(dāng)評(píng)價(jià)函數(shù)值在?琢和?茁之間時(shí),既不拒絕也不接受,選擇不承諾決策。
在決策中,信息不足或獲取信息需要一定代價(jià)時(shí),可以給出接受、拒絕和不承諾的三支決策-粗糙集是典型的三支決策模型,粗糙集模型的正域、負(fù)域和邊界域可以解釋為接受、拒絕和不承諾三種決策的結(jié)果。
1.3 集對(duì)分析
集對(duì)是具有一定聯(lián)系的兩個(gè)集合組成的對(duì)子。集對(duì)分析的核心思想是把確定不確定視作一個(gè)確定-不確定系統(tǒng),在這個(gè)系統(tǒng)中確定性與不確定性相互聯(lián)系、相互影響、相互制約,并在一定條件下相互轉(zhuǎn)換,確定與不確定性關(guān)系用同異反聯(lián)系度來(lái)描述。
給定兩個(gè)集合A和B,并設(shè)這兩個(gè)集合組成集對(duì),表示為H=(A,B),在某個(gè)具體的問(wèn)題(記為W)背景下,對(duì)集對(duì)H的特性展開(kāi)分析,共得到N個(gè)特性,其中有S個(gè)為集對(duì)H中兩個(gè)集合A和B共同具有;在P個(gè)特性上集合A和B相對(duì)立;在其余的F=N-S-P個(gè)特性上既不相互對(duì)立,又不為這兩個(gè)集合所共同具有, 則稱(chēng)比值:S/N為這兩個(gè)集合在問(wèn)題W下的同一度;F/N為這兩個(gè)集合在問(wèn)題W下的差異度;P/N為這兩個(gè)集合在問(wèn)題W下的對(duì)立度;并用下式加以統(tǒng)一表示。
模式是指通過(guò)觀察可以區(qū)別其相同與否的事物。將所要觀察的目標(biāo)與已經(jīng)存在的模式進(jìn)行比較、配準(zhǔn)并判斷其類(lèi)屬的過(guò)程是模式識(shí)別的過(guò)程。模式識(shí)別的過(guò)程是人類(lèi)認(rèn)知、判別的過(guò)程,在人類(lèi)活動(dòng)中占有非常重要的地位。隨著計(jì)算機(jī)科學(xué)的發(fā)展,人們逐漸可以借助計(jì)算機(jī)來(lái)實(shí)現(xiàn)模擬人的模式識(shí)別過(guò)程[6-7]。雖然使用模式識(shí)別的主體不同,但原理基本相同,都是將要觀察的目標(biāo)與已經(jīng)存在的模式進(jìn)行配比分析。
模式識(shí)別使用的方法因源數(shù)據(jù)類(lèi)型不同而相應(yīng)不同,但最終目標(biāo)都是將樣本歸類(lèi)到相似程度最大的標(biāo)本類(lèi)里。模式識(shí)別的基本步驟有:信息預(yù)處理、特征提取和選擇、分類(lèi)決策。常見(jiàn)的模式識(shí)別方法[8]如表1所示。
三支決策是決策粗糙集的語(yǔ)義擴(kuò)展[1],粗糙集中的正域、負(fù)域、邊界域與集對(duì)分析的同異反聯(lián)系度可以互相轉(zhuǎn)換[5],而模式識(shí)別理論涉及的識(shí)別和判別決策可以使用粗糙集和三支決策的原理進(jìn)行分析決策。
2 確定性和不確定性
從哲學(xué)的觀點(diǎn)看,不確定是相對(duì)于確定而言的,沒(méi)有了確定也就沒(méi)有了不確定,反之亦然。
粗糙集的不確定性體現(xiàn)在:當(dāng)X不能用R基本范疇的并表示時(shí),則X是R不可定義的。但卻可以使用兩個(gè)精確集將不可定義集進(jìn)行近似定義。由這兩個(gè)精確集作差得到的邊界域是粗糙集粗糙程度的體現(xiàn)。等價(jià)關(guān)系R的劃分越細(xì),邊界域中能被劃分到正域或負(fù)域的部分越多,邊界越清晰,集合的粗糙程度越?。坏葍r(jià)關(guān)系R的劃分越粗糙,邊界越粗糙,集合的粗糙程度也越大。
三支決策的不確定性與粗糙集類(lèi)似。粗糙集的正域、負(fù)域和邊界域可以解釋為接受、拒絕和不承諾的三種決策的結(jié)果。當(dāng)無(wú)法使用接受或拒絕規(guī)則時(shí),采取不承諾決策。已知的信息越充分,接受和拒絕決策的可能性越大,不承諾決策的可能性就越??;已知信息越少,接受和拒絕決策的可能性越小,不承諾決策的可能性就越大。
而集對(duì)分析對(duì)不確定的態(tài)度是客觀承認(rèn)、系統(tǒng)描述、定量刻畫(huà)、具體分析。具體體現(xiàn)在首先集對(duì)分析對(duì)不確定性采取“客觀承認(rèn)”的態(tài)度;其次把事物的確定性和不確定性作為一個(gè)系統(tǒng)來(lái)加以處理, u=a+bi+cj, i∈[-1,1],a+b+c=1;再次對(duì)確定不確定系統(tǒng)作同異反定量描述;最后對(duì)不確定系數(shù)i根據(jù)不同情況作不同的取值。對(duì)集合的特征提取越多,能確定的相同或相反的屬性越多,相異屬性越少,聯(lián)系度的量化更精確;特征提取越少,能確定的相同或相反的屬性越少,相異屬性越多,聯(lián)系度的量化更粗糙。
而模式識(shí)別過(guò)程中重要的一點(diǎn)是特征選擇和提取。特征選擇越多,對(duì)事物的了解越清晰,歸類(lèi)正確的可能性越大;特征選擇越少,對(duì)事物的了解越模糊,歸類(lèi)正確的可能性越小。
4種理論中不確定性的程度都依賴(lài)于所掌握的“知識(shí)”的程度。
3 研究方向
對(duì)粗糙集、三支決策、集對(duì)分析、模式識(shí)別現(xiàn)有研究方向的探析便于找出它們相互交融的地方,同時(shí)避免科研工作的重復(fù)。
粗糙集模型擴(kuò)展是粗糙集理論研究的一個(gè)重要方向。經(jīng)典粗糙集是基于等價(jià)關(guān)系劃分?jǐn)?shù)據(jù)的,進(jìn)一步研究非等價(jià)關(guān)系,得到了“基于非等價(jià)關(guān)系的鄰域粗糙集模型”;同時(shí)擴(kuò)展劃分概念得到“基于粒的擴(kuò)展粗糙集模型”;對(duì)粗糙集中近似算子擴(kuò)展得到基于子系統(tǒng)的擴(kuò)展模型;進(jìn)一步研究基于統(tǒng)計(jì)信息的概率粗糙集模型,如0.5-概率粗糙集模型、可變精度粗糙集模型、參數(shù)化粗糙集模型和貝葉斯粗糙集模型。這些方面常常不是單獨(dú)出現(xiàn),還可以進(jìn)行交叉、綜合。
三支決策理論已經(jīng)進(jìn)行了的工作是對(duì)理論的完善,如用博弈粗糙集模型給出了決策閾值的選取方法;將三支決策應(yīng)用于代價(jià)敏感問(wèn)題分類(lèi)、半監(jiān)督學(xué)習(xí)、政策分析等具體問(wèn)題中;同時(shí)還研究了決策粗糙集下的三支決策理論和應(yīng)用以及雙論域決策粗糙集的理論和應(yīng)用。
集對(duì)分析是非常年輕的學(xué)科,目前的研究著重于對(duì)其數(shù)學(xué)性質(zhì)探析、對(duì)聯(lián)系度有效性的改進(jìn)、與其他不確定性方法的關(guān)系和互補(bǔ)。最終目的是使集對(duì)分析表示的確定和不確定性的聯(lián)系更客觀、更有效。
模式識(shí)別理論和方法的研究主要集中在研究生物體如何感知對(duì)象以及研究如何用計(jì)算機(jī)實(shí)現(xiàn)模式識(shí)別這兩個(gè)方面。在數(shù)學(xué)上,選擇合適的判別函數(shù)和分類(lèi)器是值得長(zhǎng)期思考的問(wèn)題。常見(jiàn)的模式識(shí)別方法如:模板匹配、統(tǒng)計(jì)模式識(shí)別、句法(結(jié)構(gòu))模式識(shí)別、模糊模式識(shí)別、人工神經(jīng)元網(wǎng)絡(luò)模式識(shí)別。
將論域進(jìn)行擴(kuò)展,將確定與不確定進(jìn)行對(duì)比分析,使決策更具客觀有效性是研究的熱點(diǎn)。
4 應(yīng)用領(lǐng)域
粗糙集在知識(shí)獲取(如數(shù)據(jù)預(yù)處理、屬性約簡(jiǎn)、規(guī)則生成、數(shù)據(jù)依賴(lài)關(guān)系獲取)上有成功的應(yīng)用;知識(shí)的不確定性度量也是其應(yīng)用的重要方面;還有面向領(lǐng)域的數(shù)據(jù)驅(qū)動(dòng)的數(shù)據(jù)挖掘、海量數(shù)據(jù)挖掘;而在計(jì)算機(jī)領(lǐng)域常見(jiàn)的應(yīng)用是基于數(shù)據(jù)的決策與分析、機(jī)器學(xué)習(xí)、模式識(shí)別等。
三支決策理論的提出是基于決策粗糙集模型,但也可用于傳統(tǒng)粗糙集模型、博弈粗糙集模型和構(gòu)造性神經(jīng)網(wǎng)絡(luò),還可用于分類(lèi)、聚類(lèi)、規(guī)則學(xué)習(xí)等數(shù)據(jù)分析模型。
集對(duì)分析主要用于決策、預(yù)測(cè)、數(shù)據(jù)融合、不確定性推理、產(chǎn)品設(shè)計(jì)、網(wǎng)絡(luò)計(jì)劃、綜合評(píng)價(jià)等。
模式識(shí)別主要應(yīng)用在數(shù)據(jù)挖掘、文獻(xiàn)分類(lèi)、財(cái)政預(yù)測(cè)、多媒體數(shù)據(jù)庫(kù)的組織和檢索、生物(人臉、指紋識(shí)別)、醫(yī)學(xué)(醫(yī)學(xué)圖像分析)、地質(zhì)、能源、氣象(天氣預(yù)報(bào))、化工、冶金、航空、工業(yè)產(chǎn)品檢測(cè)中。
在不確定信息下有分類(lèi)和決策的地方正是這4種理論大展身手的地方。
研究后發(fā)現(xiàn)了一個(gè)有趣的現(xiàn)象——將粗糙集、三支決策、集對(duì)分析、模式識(shí)別進(jìn)行對(duì)比分析的過(guò)程恰恰是這4種理論都存在的經(jīng)典的對(duì)比分析的過(guò)程。這些研究和應(yīng)用各具特色,又互有交叉。正所謂站在巨人的肩膀上才能望得更遠(yuǎn),對(duì)已有知識(shí)對(duì)比分析的需求無(wú)處不在,也正是這種需求才推動(dòng)了它們之間相互借鑒、相互促進(jìn),科學(xué)理論才能發(fā)展得更快更完善。
參考文獻(xiàn)
[1] 張文修, 吳偉志, 梁吉業(yè),等.粗糙集理論與方法[M].北京:科學(xué)出版社, 2001.
[2] YAO Y Y, WONG S K M, LINGRAS P. A decision-theoretic rough set model[C]. The 5th International Sympo-sium on Methodologies for Intelligent Systems,1990.
[3] 賈修一,商林等.三支決策理論與應(yīng)用[M].南京:南京大學(xué)出版社,2012.
[4] 孫亮,禹晶.模式識(shí)別原理[M].北京:北京工業(yè)大學(xué)出版社,2009.
[5] 趙克勤.集對(duì)分析及其初步應(yīng)用[M].杭州:浙江科學(xué)技術(shù)出版社,2000.
[6] 王敏妲.語(yǔ)音識(shí)別技術(shù)的研究與發(fā)展[J].微型機(jī)與應(yīng)用,2009,28(23):1-6.
[7] 童剛,朱鴻博.圖像處理在紅綠燈判別中的應(yīng)用[J].微型機(jī)與應(yīng)用,2013,32(4):88-90.
[8] 蔣云良,徐從富.集對(duì)分析理論及其應(yīng)用研究進(jìn)展[J].計(jì)算機(jī)科學(xué),2006,33(1):205-209.