《電子技術(shù)應(yīng)用》
您所在的位置:首頁 > 其他 > 業(yè)界動(dòng)態(tài) > 基于案例與規(guī)則集成推理的公共衛(wèi)生疫情預(yù)警系統(tǒng)的應(yīng)用研究

基于案例與規(guī)則集成推理的公共衛(wèi)生疫情預(yù)警系統(tǒng)的應(yīng)用研究

2008-07-09
作者:劉雙印, 徐龍琴, 謝仕義, 涂

??? 摘??要: 分析了基于規(guī)則推理" title="規(guī)則推理">規(guī)則推理和案例推理" title="案例推理">案例推理的人工智能推理技術(shù)存在的一些問題及推理過程,提出了技術(shù)優(yōu)勢(shì)互補(bǔ)的集成推理方案,設(shè)計(jì)了集成推理的系統(tǒng)結(jié)構(gòu)和工作流程,并引入到疫情預(yù)警" title="疫情預(yù)警">疫情預(yù)警信息系統(tǒng)中,對(duì)疫情案例的表示、案例庫組織結(jié)構(gòu)、案例檢索、案例適配與系統(tǒng)學(xué)習(xí)等部分關(guān)鍵技術(shù)進(jìn)行了探討,最后在湛江市城市公共衛(wèi)生" title="公共衛(wèi)生">公共衛(wèi)生疫情預(yù)警系統(tǒng)" title="預(yù)警系統(tǒng)">預(yù)警系統(tǒng)中得以驗(yàn)證。
????關(guān)鍵詞: 疫情預(yù)警? 規(guī)則推理? 案例推理? 公共衛(wèi)生

?

??? 現(xiàn)實(shí)世界中存在的大量不確定因素(如自然災(zāi)害、恐怖事件、交通事故、疫情爆發(fā)等)引起的突發(fā)事件對(duì)人們正常的生活構(gòu)成了嚴(yán)重的威脅,如2003年的SARS疫情危機(jī)和2004的高致病性禽流感H5N1疫情給我國(guó)的經(jīng)濟(jì)建設(shè)、社會(huì)穩(wěn)定造成了極大的損害。所以,預(yù)警系統(tǒng)的建設(shè)得到各國(guó)政府組織的高度重視,如日本常設(shè)了部一級(jí)的危機(jī)管理中心;印度專門設(shè)有危機(jī)管理小組。我國(guó)針對(duì)地震、臺(tái)風(fēng)、公共衛(wèi)生等已建立了應(yīng)急系統(tǒng)。這些系統(tǒng)大多數(shù)是基于規(guī)則推理RBR(Rule-Based Reasoning)的系統(tǒng)。這種模式存在知識(shí)獲取的“瓶頸”問題,系統(tǒng)建立和維護(hù)困難,不具有自動(dòng)的學(xué)習(xí)能力,而且不能利用另一重要的知識(shí)資源——以往的成功經(jīng)驗(yàn)或典型案例數(shù)據(jù)。而基于案例推理CBR(Case-Based Reasoning)是一種類比推理方法,它可以方便地利用過去的成功經(jīng)驗(yàn)或案例數(shù)據(jù)來求解與之相似的新的問題。對(duì)于很少或不能形成通用規(guī)則的問題領(lǐng)域,采用CBR最為有效。然而,CBR雖然克服了RBR知識(shí)獲取的“瓶頸”問題,但CBR不適用于當(dāng)前存在的領(lǐng)域知識(shí),并且決策過程有時(shí)顯得過于牽強(qiáng)(intuitively)[1-2]。
  本文將基于規(guī)則與基于案例集成推理技術(shù)、專家系統(tǒng)和數(shù)據(jù)挖掘等技術(shù)結(jié)合起來,構(gòu)造一套R(shí)BR與CBR集成的決策推理方案,并應(yīng)用于公共衛(wèi)生疫情預(yù)警系統(tǒng)中。利用兩種推理各自的推理優(yōu)勢(shì),形成優(yōu)勢(shì)互補(bǔ)系統(tǒng),消除了RBR和CBR結(jié)果之間的沖突,提高了系統(tǒng)求解問題的效率,增強(qiáng)了系統(tǒng)對(duì)不良結(jié)構(gòu)問題的適應(yīng)性,實(shí)現(xiàn)了經(jīng)驗(yàn)豐富領(lǐng)域的推理。針對(duì)疫情爆發(fā),建立一套科學(xué)高效的公共衛(wèi)生疫情預(yù)警系統(tǒng),增強(qiáng)突發(fā)事件中實(shí)施疫情控制和醫(yī)療救治工作的快速反應(yīng)能力,減輕突發(fā)公共衛(wèi)生事件對(duì)居民健康、生命安全造成的威脅和財(cái)產(chǎn)損失,具有重要的經(jīng)濟(jì)價(jià)值和社會(huì)意義。
1 基于案例與規(guī)則集成推理的技術(shù)概述
1.1 基于規(guī)則推理技術(shù)
??? ?RBR適合應(yīng)用于對(duì)領(lǐng)域有充分認(rèn)識(shí),能以完備和健全的形式表示領(lǐng)域理論的場(chǎng)合,它是一種鏈?zhǔn)酵评?,其?jiǎn)單的推理可能觸發(fā)多條規(guī)則[3]。許多成功的專家系統(tǒng)都采用產(chǎn)生式系統(tǒng)的典型結(jié)構(gòu),用產(chǎn)生式規(guī)則表達(dá)知識(shí)。通常,產(chǎn)生式系統(tǒng)由下面幾個(gè)基本部分組成:
????(1)事實(shí)庫(也稱綜合數(shù)據(jù)庫):存儲(chǔ)有關(guān)問題的狀態(tài)、性質(zhì)等事實(shí)的敘述性知識(shí)。
??? (2)規(guī)則集(或稱“規(guī)則庫”):存儲(chǔ)有關(guān)問題的狀態(tài)轉(zhuǎn)移、性質(zhì)變化等規(guī)則的過程性知識(shí),可描述成:IF條件THEN結(jié)論。條件可以是任意子句的邏輯組合,結(jié)論可以是多個(gè)子結(jié)論或操作的組合。
??? (3)控制器:根據(jù)有關(guān)問題的控制性知識(shí),選擇控制策略,將規(guī)則與事實(shí)進(jìn)行匹配,控制利用知識(shí)推理求解問題的過程。
???? 產(chǎn)生式規(guī)則的優(yōu)點(diǎn)是知識(shí)表示自然、通用靈活,易于模塊化和結(jié)構(gòu)化,但這種模式存在知識(shí)獲取的“瓶頸”問題。
1.2 基于案例推理技術(shù)
??? ?CBR是一種類比推理方法,它可以方便地利用過去的成功經(jīng)驗(yàn)或案例數(shù)據(jù)來求解與之相似的新問題?;诎咐评淼南到y(tǒng)設(shè)計(jì)技術(shù)可以被歸納為五個(gè)部分:案例檢索、案例匹配、案例修改、案例學(xué)習(xí)和案例維護(hù)?;窘忸}步驟如下:
??? (1)案例檢索:根據(jù)當(dāng)前的問題通過一系列的搜索和相似度的計(jì)算,將案例庫中的案例過濾,取出與目標(biāo)案例相似的若干案例組成相關(guān)案例集。
  (2)案例匹配:從檢索出的案例集中提取最佳案例,即從已檢索出的相關(guān)案例集中抽取特征最為相似的案例或案例片斷,用相似度表征待解問題和相關(guān)案例集中案例的相似程度。根據(jù)相似度,判斷已經(jīng)存在的解決方案是否符合當(dāng)前問題的求解需要,以便調(diào)整案例集的解決方案,從而獲得待解問題的建議方案。
  (3)案例修改:根據(jù)案例庫中已存案例與待解問題之間的差異,若用戶對(duì)系統(tǒng)給出的方案不滿意,推理系統(tǒng)將就此方案進(jìn)行修改或重新設(shè)計(jì)后再提交給用戶。如果用戶認(rèn)為差異太大,則求解過程終止。
  (4)案例學(xué)習(xí):對(duì)當(dāng)前問題的解進(jìn)行評(píng)價(jià)分析,若認(rèn)為求解結(jié)果有價(jià)值,則將新解保存到案例庫中,擴(kuò)充案例庫的案例種類與數(shù)量,并進(jìn)一步地從新問題的解中提取淺層規(guī)則知識(shí)或修改深層模型知識(shí);否則,重新匹配和修正。
  (5)案例維護(hù):求解方案經(jīng)過實(shí)際應(yīng)用后,根據(jù)實(shí)際應(yīng)用效果和一定的策略,分析新案例的經(jīng)驗(yàn)和知識(shí)是否有保留的價(jià)值,若有則按一定的存儲(chǔ)策略將其納入案例庫中,實(shí)現(xiàn)案例庫的不斷更新、完善。
  案例推理技術(shù)借鑒以往的經(jīng)驗(yàn),更符合領(lǐng)域?qū)<液驮O(shè)計(jì)人員的設(shè)計(jì)思維過程。它也存在前面所講的優(yōu)缺點(diǎn)。

1.3 以CBR和RBR集成推理的系統(tǒng)結(jié)構(gòu)?
 ? 由于CBR與RBR各有缺陷,它們無論是作為兩種推理方式還是作為知識(shí)表示方式都不能相互替代。這是因?yàn)榘咐蠠o法充分表達(dá)編碼歸納后的規(guī)則,案例中包含的分布廣泛的粗知識(shí)也極難或不可能提取歸納為規(guī)則。如果將CBR和RBR集成在一起,就能夠克服兩種推理體系各自的缺點(diǎn),增強(qiáng)系統(tǒng)的靈活性和綜合推理能力[4]。CBR和RBR集成的最通用方式有二種:第一種是以RBR為主導(dǎo),CBR后置補(bǔ)充的(RC)混合模型;第二種是以CBR為前導(dǎo),RBR后置補(bǔ)充的(CR)混合模型。其他的組合方式都是以這兩種方式為基礎(chǔ)組成的。
  對(duì)于已經(jīng)在相關(guān)領(lǐng)域建立了較完善的RBR系統(tǒng),由于對(duì)該領(lǐng)域知識(shí)的理解仍是很不充足的弱理論領(lǐng)域,使用第一種方式有較好的效果。而對(duì)于領(lǐng)域知識(shí)模型、案例和RBR系統(tǒng)己充分建立但還要求系統(tǒng)有很高實(shí)時(shí)性和效率的情況,則宜采用第二種方式[2]。在實(shí)際應(yīng)用中,應(yīng)該根據(jù)領(lǐng)域的不同特點(diǎn)和實(shí)際情況,靈活地選擇不同的集成方式。根據(jù)公共衛(wèi)生疫情的特征,本文選擇以CBR為前導(dǎo),RBR后置補(bǔ)充的(CR)推理模式,實(shí)現(xiàn)在豐富而精確的知識(shí)庫基礎(chǔ)上的高效推理。其集成推理的系統(tǒng)結(jié)構(gòu)如圖1所示。圖中,規(guī)則庫和案例庫共同構(gòu)成了專家系統(tǒng)的知識(shí)庫。

????????????????????????????
  (1)人機(jī)交互界面:完成人機(jī)交互、問題表示、結(jié)果顯示和和系統(tǒng)的總體控制,即分析用戶提交的問題并加以分解綜合后轉(zhuǎn)化成系統(tǒng)可以理解的知識(shí)表示形式送至學(xué)習(xí)機(jī)。
  (2)案例庫:是CBR的核心。提供支持問題求解的一組案例,它是問題求解經(jīng)驗(yàn)的集合。案例源的豐富程度是問題求解的關(guān)鍵。因此,必須利用豐富領(lǐng)域知識(shí)建立較為完善的案例庫。在組織案例庫時(shí)本文采用兩層結(jié)構(gòu),第一層為典型案例庫,第二層為被分類的子案例庫,且第二層中的每一個(gè)子案例庫對(duì)應(yīng)著典型案例庫中的一個(gè)典型案例。這樣可有效提高案例檢索效率。
  (3)規(guī)則庫:用于存儲(chǔ)領(lǐng)域?qū)<艺J(rèn)可的各應(yīng)用領(lǐng)域的主要規(guī)則知識(shí)和技術(shù)指標(biāo),是以規(guī)則的形式表示的、正確的、能夠完全表達(dá)領(lǐng)域的知識(shí),相當(dāng)于傳統(tǒng)產(chǎn)生式系統(tǒng)中的知識(shí)庫,是系統(tǒng)綜合數(shù)據(jù)庫的基礎(chǔ)。對(duì)問題定義和案例適配提供背景知識(shí),同時(shí)也提供查詢和咨詢服務(wù)。
  (4)學(xué)習(xí)機(jī):主要負(fù)責(zé)創(chuàng)建和維護(hù)案例庫,包括啟用解釋模塊調(diào)用RBR來完成由規(guī)則到案例的實(shí)際的推理過程。
  (5)推理機(jī):根據(jù)問題,利用知識(shí)庫中的知識(shí),用集成的CBR和RBR推理規(guī)則進(jìn)行推理,求得問題的解。推理機(jī)是本系統(tǒng)的核心模塊之一。
1.4 以CBR和RBR集成推理的系統(tǒng)模塊協(xié)同工作過程
  采用集成推理的系統(tǒng)各模塊協(xié)同工作過程如下:在推理時(shí),通常把人們以往的經(jīng)驗(yàn)儲(chǔ)存成一個(gè)個(gè)案例形成的案例庫。當(dāng)新問題出現(xiàn)時(shí),通過搜索算法可直接在案例庫中搜索,找到合適案例作為新問題處理的參考,即實(shí)案例重用;如果找到的案例不滿意或沒有結(jié)果,此時(shí)就啟動(dòng)學(xué)習(xí)機(jī)內(nèi)部的解釋模塊到規(guī)則庫中檢索相關(guān)知識(shí),得到基于規(guī)則推理的結(jié)果以備進(jìn)行間接匹配。若經(jīng)過修改后的案例間接匹配成功,得到問題的解,經(jīng)過案例評(píng)價(jià)機(jī)構(gòu)評(píng)價(jià)后,認(rèn)為問題的解有價(jià)值,便可保存在案例庫中以備下次使用,即實(shí)現(xiàn)了案例自學(xué)習(xí)。若在推理過程中有不止一個(gè)舊案例與新的輸入案例相匹配,此時(shí)還要啟用評(píng)價(jià)機(jī)構(gòu),以便于對(duì)匹配情況做出裁決,從中選出最佳匹配。案例集成推理的控制流程圖如圖2所示。

?????????????????????????
2 基于CBR和RBR集成推理的公共衛(wèi)生疫情預(yù)警系統(tǒng)主要實(shí)現(xiàn)技術(shù)
2.1案例的表示
  案例的表示過程即是將權(quán)威領(lǐng)域?qū)<业闹R(shí)轉(zhuǎn)化為計(jì)算機(jī)系統(tǒng)可以識(shí)別的信息過程。案例是知識(shí)表示的一種模式,它將專家的知識(shí)與經(jīng)驗(yàn)用描述案例的數(shù)據(jù)結(jié)構(gòu)和眾多的案例表示出來,實(shí)際上它就是專家求解問題的一個(gè)具體例子[2]。適當(dāng)?shù)闹R(shí)表示方法有助于提高在案例庫中檢索到與當(dāng)前欲求解問題相似案例的精度和速度。本文采用面向?qū)ο蟮幕诳蚣芊ǖ闹R(shí)表示方法來表示疫情預(yù)警案例,因?yàn)榭蚣芊ǖ闹R(shí)表示方法適合于將某特定時(shí)期的疫情預(yù)警指標(biāo)、行為知識(shí)和專家經(jīng)驗(yàn)等有機(jī)地結(jié)合起來。而且采用框架法的知識(shí)結(jié)構(gòu)描述方法,將所搜集到的疫情案例存放到一系列相互關(guān)聯(lián)的數(shù)據(jù)庫中,利用關(guān)系數(shù)據(jù)庫的索引技術(shù),可以方便地建立案例索引。借鑒相關(guān)參考文獻(xiàn)所建立的疫情預(yù)警案例結(jié)構(gòu)框架如表1所示。

???????????????????????????????
2.2 案例庫的組織
  對(duì)案例庫進(jìn)行組織索引是為了方便案例庫的檢索,因此如何組織案例庫取決于系統(tǒng)所采取的檢索策略。如果在設(shè)計(jì)時(shí)不采取有效的檢索策略,將直接影響案例檢索效率和系統(tǒng)響應(yīng)時(shí)間。本系統(tǒng)對(duì)案例庫組織時(shí)采用兩層結(jié)構(gòu),第一層為典型案例庫,第二層為被分類的子案例庫,且第二層中的每一個(gè)子案例庫對(duì)應(yīng)著典型案例庫中的一個(gè)典型案例。具體地說,首先對(duì)案例進(jìn)行分類,每一類組成一個(gè)較小的子案例庫并在其中選出一個(gè)典型案例,作為對(duì)該類案例的索引,所有類的典型案例構(gòu)成一個(gè)典型案例庫。檢索時(shí),先在典型案例庫中找到最相近的典型案例(此步驟相當(dāng)于對(duì)新問題進(jìn)行分類,看它屬于哪一類案例),然后在最相似的典型案例所對(duì)應(yīng)的那類案例中進(jìn)行進(jìn)一步的檢索,案例庫的兩層結(jié)構(gòu)可以更方便地檢索案例。
2.3 案例的檢索和匹配
  案例檢索是指從案例庫中尋找與新問題相似的案例的過程,案例的匹配檢索是實(shí)現(xiàn)案例推理的關(guān)鍵步驟。查找以案例類別為第一檢索條件,以案例特征為第二檢索條件,在案例庫中查找出可能與新問題有關(guān)的舊案例,形成候選案例集合,使以后匹配過程僅在候選案例集中進(jìn)行。可提高案例檢索效率的常用檢索方法有:最近相鄰策略、歸納推理策略、知識(shí)引導(dǎo)策略和模板檢索策略[2],這些方法可以單獨(dú)或聯(lián)合地運(yùn)用。本文檢索采用的策略為目前常用的最近相鄰策略[5]對(duì)案例進(jìn)行匹配。
2.4 案例適配
  從檢索出的案例集中提取最佳案例,即從已檢索出的相關(guān)案例集中抽取特征最為相似的案例或案例片斷,用相似度表征待解問題和相關(guān)案例集中案例的相似程度。根據(jù)相似度,判斷已經(jīng)存在的解決方案是否符合當(dāng)前問題的求解需要,以便調(diào)整案例集的解決方案,從而獲得待解問題的建議方案。然而,大多數(shù)情況因?yàn)橄到y(tǒng)知識(shí)不夠豐富,檢索到的案例并不能滿足問題的求解,這就需要學(xué)習(xí)機(jī)進(jìn)行學(xué)習(xí)。本系統(tǒng)采用轉(zhuǎn)換型的適配策略(transformational adaptation)和參數(shù)調(diào)整(parameter adjustment)適配技術(shù)。其基本思想是:比較檢索到的案例與新問題所關(guān)心屬性的差異,從而將解決方案適當(dāng)?shù)卣{(diào)整。
2.5 集成推理系統(tǒng)自學(xué)習(xí)
  集成推理系統(tǒng)的優(yōu)點(diǎn)在于其自學(xué)習(xí)的能力,即系統(tǒng)在運(yùn)行過程中能夠不斷地將新問題及解決方案作為新的案例加入到案例庫中豐富系統(tǒng)。但如果這種行為不加以控制,案例庫中的案例質(zhì)量就會(huì)下降;同時(shí)案例庫的規(guī)模就會(huì)膨脹,降低系統(tǒng)的推理效率[6]。故本系統(tǒng)采用相似度δ進(jìn)行評(píng)價(jià)控制:δ=(δ1t,δ2t,δ3t,…,δnt)式中,n為舊案例數(shù),δit為新案例與舊案例的相似度。如果所有δit均小于某一設(shè)定閥門時(shí),則認(rèn)為有價(jià)值,送入案例庫;否則,被認(rèn)為是無價(jià)值案例,將該案例丟棄。
3 基于CBR和RBR集成推理的公共衛(wèi)生疫情預(yù)警系統(tǒng)應(yīng)用
  下面以湛江市城市公共衛(wèi)生預(yù)警系統(tǒng)為例闡述該系統(tǒng)的應(yīng)用,案例和規(guī)則放在SQL數(shù)據(jù)庫中?,F(xiàn)在取其中疫情預(yù)測(cè)分析模塊為例,工作過程描述如下:
  把在湛江市石頭村2005年7~11月各月份的鼠疫調(diào)查數(shù)據(jù),如疫情地區(qū)、疫情名稱、疫情癥狀、起始時(shí)間、發(fā)病人數(shù)等,經(jīng)過特征抽取轉(zhuǎn)換成機(jī)器可以識(shí)別的案例輸入系統(tǒng),點(diǎn)擊預(yù)測(cè)按鈕,可在2005年份7~11月各個(gè)月份的發(fā)病數(shù)基礎(chǔ)上進(jìn)行預(yù)測(cè)計(jì)算,便可得到鼠疫在2005年12月份的發(fā)病數(shù)預(yù)測(cè)值。疫情預(yù)測(cè)分析界面圖如圖3所示。

????????????????????
??? 此外,系統(tǒng)還可根據(jù)疫情的屬性與空間數(shù)據(jù)庫相關(guān)聯(lián),實(shí)現(xiàn)疫情預(yù)警信息分布地圖呈現(xiàn)給用戶,并及時(shí)通報(bào)疫情信息,做好應(yīng)對(duì)方案,可有效防止疫情的蔓延。
  目前國(guó)內(nèi)已建立起為數(shù)不多的公共衛(wèi)生疫情預(yù)警系統(tǒng),多數(shù)是基于規(guī)則推理的系統(tǒng),系統(tǒng)建立和維護(hù)困難,并且不具有自學(xué)習(xí)能力。本文將基于案例推理與基于規(guī)則推理的兩種技術(shù)相結(jié)合,研究出智能高效的公共衛(wèi)生疫情預(yù)警系統(tǒng),這不僅使系統(tǒng)的建立和維護(hù)變得容易,且提高了系統(tǒng)的運(yùn)行效率,呈現(xiàn)出更強(qiáng)的智能化特征。提高對(duì)公共衛(wèi)生疫情的預(yù)防能力、增強(qiáng)在疫情爆發(fā)中的組織搶險(xiǎn)和快速反應(yīng)能力以及推進(jìn)公共衛(wèi)生疫情預(yù)警系統(tǒng)的科學(xué)化和智能化具有重要意義。該系統(tǒng)已投入使用,有一定的應(yīng)用推廣價(jià)值。
參考文獻(xiàn)
[1]?YANG Hao, WEN Flu, ALAN Clin. Procase: A casedbased process planning system for machining of rotational
?parts[J]. Journal of Intelligent Manufacturing.1994,(5):441-430.
[2]?CSER L. Three kinds of case-based learning sheet rnanufacturin[J]. Computer in Industry,1991,(17):195-206.
[3]?蔡自興,徐光祐.人工智能及其應(yīng)用[M]. 北京:清華大學(xué)出版社,2003.
[4]?張建華,劉仲英.案例推理和規(guī)則推理結(jié)合的緊急預(yù)案信息系統(tǒng)[J]. 同濟(jì)大學(xué)學(xué)報(bào),2002,30(7):890-894.
[5]?SCHAAF J W. Fish and shrink: A next step towards efficient case retrieval in large scaled case bases[A].
?Advances in Case-based Reasoning[C].Lausanne: Third?European Workshop, 1996:362-376.

本站內(nèi)容除特別聲明的原創(chuàng)文章之外,轉(zhuǎn)載內(nèi)容只為傳遞更多信息,并不代表本網(wǎng)站贊同其觀點(diǎn)。轉(zhuǎn)載的所有的文章、圖片、音/視頻文件等資料的版權(quán)歸版權(quán)所有權(quán)人所有。本站采用的非本站原創(chuàng)文章及圖片等內(nèi)容無法一一聯(lián)系確認(rèn)版權(quán)者。如涉及作品內(nèi)容、版權(quán)和其它問題,請(qǐng)及時(shí)通過電子郵件或電話通知我們,以便迅速采取適當(dāng)措施,避免給雙方造成不必要的經(jīng)濟(jì)損失。聯(lián)系電話:010-82306118;郵箱:aet@chinaaet.com。