摘 要: 對計算機(jī)硬件故障的診斷維修進(jìn)行深入分析歸納,總結(jié)了計算機(jī)硬件故障維修特點,給出硬件故障診斷系統(tǒng)的框架。運用計算機(jī)硬件故障歷史數(shù)據(jù)建立案例庫,在案例檢索中采用最近相鄰法計算相似度,給出相似度的計算實例,建立了故障診斷系統(tǒng)。
關(guān)鍵詞: 案例推理; 硬件; 維修
基于案例推理CBR(Case-Based Reasoning)最早由美國耶魯大學(xué)Roger Schank教授在其1982年的著作《Dynamic Memory》中提出,是根據(jù)故障機(jī)的表現(xiàn)與特征而得到歷史記憶中的源案例,并由源案例指導(dǎo)解決故障機(jī)求解的一種策略[1]。主要包括表示與存儲、檢索與匹配、重用與修改、學(xué)習(xí)與評價4部分。
目前,中國的計算機(jī)用戶接近2億,而維修技師普遍缺乏。計算機(jī)各種硬件故障中,主板故障率較高。據(jù)2010年法國硬件網(wǎng)站Hardware.fr統(tǒng)計,以華碩為例,硬件故障達(dá)到2.49%,該品牌部分型號(如P5ND)達(dá)到7.8%。可見計算機(jī)故障數(shù)量巨大。這些故障的解決全靠數(shù)量嚴(yán)重不足的計算機(jī)維修人員及其經(jīng)驗,使得維修出錯率及成本居高不下。在計算機(jī)故障診斷中引入CBR方法,可有效提高診斷準(zhǔn)確率,減少維修人員數(shù)量,降低對維修人員經(jīng)驗上的要求,進(jìn)而降低成本,提高維修質(zhì)量。
1 系統(tǒng)總體結(jié)構(gòu)
維修經(jīng)驗在維修技師的知識構(gòu)成中占有十分重要的地位,而這又往往是一些維修技師所缺乏的。構(gòu)建診斷系統(tǒng)可幫助維修人員建立案例庫,為缺乏經(jīng)驗的維修人員提供參考,提高故障定位的準(zhǔn)確率。
在參考整個計算機(jī)故障診斷過程的基礎(chǔ)上,把系統(tǒng)的工作過程定義為以下4步:
(1)維修技師將計算機(jī)故障值輸入系統(tǒng);
(2)系統(tǒng)根據(jù)得到的故障值,判斷它屬于何種故障類型,給出故障單元部位建議及進(jìn)一步檢測部位和檢測建議;
(3)維修技師將檢測到的參數(shù)、數(shù)據(jù)輸入系統(tǒng);
(4)系統(tǒng)根據(jù)輸入的參數(shù)和數(shù)據(jù),檢索出之前最為類似的案例,并給出維修方案供維修人員參考。
圖1描述了這一過程。在系統(tǒng)設(shè)計中,把系統(tǒng)案例庫分成兩個部分:確定故障大范圍的類型庫和具體到小范圍甚至到元件級別的維修庫。類型庫是指針對某些故障現(xiàn)象,大致將其劃分到某一單元電路,是對某一類故障的抽象;維修庫是在單元電路內(nèi)具體故障元件的確定,是元件級維修建議的基礎(chǔ)。
2 系統(tǒng)的建立
2.1設(shè)備故障案例表示方式
案例表示是對故障現(xiàn)象的具體情況盡可能地完整描述,是CBR運行的基礎(chǔ)。在系統(tǒng)設(shè)計中,把案例信息表示成故障信息表。這里,故障信息表有兩個:(1)故障部位表,由故障名稱、故障現(xiàn)象、故障部位和檢測建議組成;(2)檢測項目表,由檢測項目、檢測值、權(quán)重組成。以不開機(jī)故障為例,故障部位表設(shè)計結(jié)構(gòu)如表1所示,檢測項目表如表2所示。
2.2 案例庫的建立
利用以往計算機(jī)硬件故障的歷史數(shù)據(jù)建立案例庫,根據(jù)上述案例的框架表示方法,單個案例可以采用SQL Server的關(guān)系型數(shù)據(jù)庫技術(shù),通過設(shè)計一張主表和一系列關(guān)聯(lián)表來存儲相關(guān)知識。即案例由n個可能產(chǎn)生的故障單元組成,每個單元里面又有多個需要檢測的部位。將這些單元內(nèi)檢測項目用一個表來描述,如上述南橋檢測項目表示如下:檢測編號(varchar)、檢測項目(varchar)、檢測值(varchar)、權(quán)重(float)、詳細(xì)說明(varchar)、備注(varchar)。
檢測項目的檢測值有兩種情況:一種是用文字表述,如“<80 ?贅”,“燙手(無法忍受)”等;另一種是具體值,如“3.3 V”,“80 ?贅”。這些值可通過測量得到,看其落入哪一區(qū)間,從而得到診斷結(jié)果。
由于每一檢測值的可能程度不一樣,因此必須考慮它們的權(quán)重。權(quán)重的確定通??梢圆扇《喾N方法,如專家主觀確定法、GUM(Good-Up-Matching)方法和層次分析法AHP(Analytic Hierarchy Process)。這里,選擇AHP法。
2.3 案例的檢索
案例的檢索就是在案例庫中,依據(jù)故障機(jī)的檢測值尋找與之相似的案例?;诎咐耐评磉^程本質(zhì)上是計算兩個案例相似度的過程。相似度是根據(jù)兩個案例的測量值計算出來。兩個案例的測量值越接近,其相似度越高,案例庫中案例的故障信息就越有參考價值[2]。
推理之前要輸入故障機(jī)的必要信息,即故障機(jī)的檢測值及相應(yīng)權(quán)值。然后檢索案例庫中相關(guān)案例,計算兩者的相似度,取相似度大于0的前10組案例,就能獲得有效的診斷信息。目前使用的檢索方法主要有最近相鄰法、歸納索引法和知識引導(dǎo)法等。考慮到主板故障特點,這里采用最近相鄰法進(jìn)行檢索,方法如下:
(1)輸入當(dāng)前故障機(jī)I的測量值,確定權(quán)值:
使用上述計算方法得出的案例相似度比較好地表示了案例的相似程度。案例的相似度以檢測項目結(jié)果為計算依據(jù)。這里采用的基于案例的推理過程,實際上就是根據(jù)檢測項目結(jié)果分析得到可能發(fā)生故障部件的過程。其前提是案例信息的表示,包括故障描述信息和檢測項目信息,以及檢測項目的權(quán)值。
2.4 案例的修正重用
CBR采用增量式學(xué)習(xí),能不斷地增加知識量和解題能力,這要歸因于對新案例的保存。在行業(yè)中,一般會設(shè)置一個相似度閾限(s1,s2)。即新案例與檢索到的案例相似度大于s2時,表示新案例與檢索到的案例很相似,信息量和知識含量不高,參考價值不大,不對這些案例進(jìn)行保存;如果新案例與檢索到的案例相似度小于s1,表示新案例信息量和知識含量有較大參考價值,對該案例進(jìn)行存儲[3]。
3 實例分析
由上文給出的案例表示以及案例相似度的計算方法,在案例庫中選取3個典型主板故障案例作為檢索案例,選取1個已經(jīng)發(fā)生的主板故障作為故障機(jī),假設(shè)在具體原因未知的情況下, 根據(jù)故障主板測量值與選取的3個案例進(jìn)行比較,以此來檢驗系統(tǒng)的檢索機(jī)制,見表3。
應(yīng)用上述計算方法計算出故障機(jī)與案例庫中3個案例的總體相似度分別為0.9、0.4和0.45??梢?,故障機(jī)與案例1最為相似。在實際故障維修過程中,維修人員可參考案例提供的維修方法進(jìn)行維修。
CBR是世界前沿技術(shù),其應(yīng)用還要經(jīng)過深入研究。這里將CBR應(yīng)用在計算機(jī)硬件故障維修領(lǐng)域,通過故障案例的表示,將專家的經(jīng)驗知識存儲起來;通過案例的檢索和查詢,部分替代了人的經(jīng)驗判斷;通過案例的推理,初步完成了故障的診斷。本系統(tǒng)在計算機(jī)硬件故障診斷中取得了較好的效果,提高了故障診斷的準(zhǔn)確度和效率,降低了維修人員的勞動強(qiáng)度。隨著案例庫的不斷完善,系統(tǒng)將能獲得更好的診斷效果。
參考文獻(xiàn)
[1] 朱文博,劉莎,甘屹.基于案例推理的故障診斷系統(tǒng)軟件開發(fā)[J] .上海電氣技術(shù),2010,3(3):29-33.
[2] 顧東曉.案例檢索及權(quán)重優(yōu)化方法研究及應(yīng)用[J]. 系統(tǒng)工程學(xué)報,2009,24(6):764-766.
[3] 趙勇,趙厚仁. 數(shù)據(jù)倉庫技術(shù)在飛行事故中的應(yīng)用研究[J].微計算機(jī)信息,2009,25(9):143-145.