摘? 要: 隨著醫(yī)院信息化的進(jìn)程加快,醫(yī)院信息的積累越來越豐富,為醫(yī)學(xué)研究提供了方便和研究?jī)r(jià)值。以出院病患者的隨訪記錄建立數(shù)據(jù)庫(kù),依靠數(shù)據(jù)挖掘技術(shù),篩選出有價(jià)值的信息,建立一個(gè)能夠?yàn)橐院蟮闹委熖峁┯袃r(jià)值的參考作用的醫(yī)院醫(yī)療方案庫(kù)。從而形成一個(gè)對(duì)患者更負(fù)責(zé)任的體系,完善醫(yī)院服務(wù),提高醫(yī)院診斷就醫(yī)效率。
關(guān)鍵詞: 數(shù)據(jù)挖掘;隨訪;醫(yī)療方案庫(kù)
?
1 數(shù)據(jù)挖掘
1.1? 數(shù)據(jù)挖掘概念
??? 數(shù)據(jù)挖掘[1-2]是指從數(shù)據(jù)庫(kù)中提取出隱含的人們事先未知的、潛在的有用信息和知識(shí),所提取的知識(shí)可以表示為概念規(guī)則、規(guī)律、模式等形式。它具備有效性、新穎性、潛在有用性及最終可理解性,即發(fā)現(xiàn)的知識(shí)可接受、可理解、可運(yùn)用,最好能用自然語言表達(dá)發(fā)現(xiàn)的結(jié)果。處理的原始數(shù)據(jù)可以是結(jié)構(gòu)化的,如關(guān)系數(shù)據(jù)庫(kù)中的數(shù)據(jù);也可以是半結(jié)構(gòu)化的,如文本、圖形、圖像數(shù)據(jù);甚至是分布在網(wǎng)絡(luò)上的Web數(shù)據(jù)和異構(gòu)型數(shù)據(jù)。獲取的知識(shí)可用于信息管理、查詢優(yōu)化、決策支持、過程控制等,還可以用于數(shù)據(jù)自身的維護(hù)。因此,數(shù)據(jù)挖掘是一個(gè)介于統(tǒng)計(jì)學(xué)、模式識(shí)別、人工智能、機(jī)器學(xué)習(xí)、數(shù)據(jù)庫(kù)技術(shù)以及高性能并行計(jì)算等領(lǐng)域的交叉新學(xué)科,已在經(jīng)濟(jì)、商業(yè)、金融、天文等行業(yè)得到了成功的應(yīng)用,在國(guó)際上掀起了一股空前的研究熱潮即所謂的“數(shù)據(jù)淘金潮”。我國(guó)學(xué)者在這個(gè)領(lǐng)域也已開展了很多研究,主要來自計(jì)算機(jī)科學(xué)及相關(guān)領(lǐng)域[1-3]?! ?BR>1.2? 數(shù)據(jù)挖掘過程
數(shù)據(jù)挖掘過程主要由3個(gè)階段組成:數(shù)據(jù)準(zhǔn)備、數(shù)據(jù)開采、結(jié)果表達(dá)和解釋。
(1)數(shù)據(jù)準(zhǔn)備
這個(gè)階段又可以進(jìn)一步分成3個(gè)子步驟:數(shù)據(jù)集成、數(shù)據(jù)選擇、數(shù)據(jù)預(yù)處理[2-4]。數(shù)據(jù)集成將多文件或多數(shù)據(jù)庫(kù)運(yùn)行環(huán)境中的數(shù)據(jù)進(jìn)行合并處理,解決語義模糊性、處理數(shù)據(jù)中的遺漏和清洗臟數(shù)據(jù)等;數(shù)據(jù)選擇的目的是辨別出需要分析的數(shù)據(jù)集合,縮小處理范圍,提高數(shù)據(jù)挖掘的質(zhì)量;數(shù)據(jù)預(yù)處理是為了克服目前數(shù)據(jù)挖掘工具的局限性。
(2)數(shù)據(jù)開采
在這個(gè)階段進(jìn)行實(shí)際的數(shù)據(jù)開采操作,主要包括:
?、偃绾萎a(chǎn)生假設(shè),是讓數(shù)據(jù)挖掘系統(tǒng)為用戶產(chǎn)生假設(shè),還是用戶自己對(duì)于數(shù)據(jù)倉(cāng)庫(kù)中可能包含的知識(shí)提出假設(shè)。前一種稱為發(fā)現(xiàn)型(Discovery-Driven)的數(shù)據(jù)挖掘,后一種稱為驗(yàn)證型(Verification)的數(shù)據(jù)挖掘;
?、谶x擇合適的工具;
?、弁诰蛑R(shí)的操作;
?、馨l(fā)現(xiàn)知識(shí)。
(3)結(jié)果的表達(dá)和解釋
根據(jù)最終用戶的決策目的對(duì)提取的信息進(jìn)行分析,把最有價(jià)值的信息區(qū)分出來,并且通過決策支持工具提交給決策者。因此,這一步驟的意義不僅是把結(jié)果表達(dá)出來(例如采用信息可視化方法),還要對(duì)信息進(jìn)行過濾處理。如果不能令決策者滿意,則需要重復(fù)以上數(shù)據(jù)挖掘的過程。數(shù)據(jù)挖掘過程如圖1所示。
?
?
2? 醫(yī)院隨訪現(xiàn)狀
隨訪是醫(yī)療衛(wèi)生部門為定期或不定期了解門診或出院病人在院期間醫(yī)療處理的愈后、康復(fù)情況及遠(yuǎn)期療效通常采用的一種工作手段。隨著醫(yī)療技術(shù)的日新月異,隨訪工作的開展與否已成為衡量一家醫(yī)院醫(yī)療管理是否先進(jìn)的重要指標(biāo)之一。隨訪,作為醫(yī)療及醫(yī)學(xué)信息應(yīng)用的主要內(nèi)容, 為醫(yī)院的醫(yī)療、教學(xué)、科研提供了不可多得的寶貴資料?;颊唠S訪服務(wù)將成為醫(yī)院在今后市場(chǎng)競(jìng)爭(zhēng)中的重要因素,通過為患者提供有效的服務(wù),設(shè)法吸引患者成為醫(yī)院經(jīng)營(yíng)的焦點(diǎn)之一。然而,由于各種原因,患者隨訪依然是當(dāng)前醫(yī)院管理中的薄弱環(huán)節(jié)之一。本文建立的隨訪數(shù)據(jù)庫(kù),提供全面的患者隨訪管理,完成以患者為中心的服務(wù)轉(zhuǎn)變,以為“完善醫(yī)院服務(wù),提高病人滿意度,降低病人流失率”最終目標(biāo),全面提高醫(yī)院的服務(wù)效果。
3?數(shù)據(jù)挖掘在醫(yī)院醫(yī)療中的應(yīng)用
3.1?數(shù)據(jù)挖掘在隨訪信息庫(kù)中的應(yīng)用
醫(yī)院作為一個(gè)龐大的社會(huì)服務(wù)機(jī)構(gòu),在過去若干年的時(shí)間里積累了海量的、以不同形式存儲(chǔ)的數(shù)據(jù)資料,但是如果對(duì)其中的每個(gè)數(shù)據(jù)都仔細(xì)處理是不可能的,也沒有實(shí)效和用處。本文以電子病歷系統(tǒng)的數(shù)據(jù)為原始庫(kù),接收電子病歷系統(tǒng)數(shù)據(jù),通過數(shù)據(jù)清理,建立一個(gè)隨訪信息庫(kù),用于對(duì)出院病人的跟蹤調(diào)查。在隨訪信息庫(kù)的基礎(chǔ)之上,進(jìn)一步進(jìn)行有價(jià)值的信息挖掘,建立一個(gè)醫(yī)院治療方案庫(kù),以便總結(jié)治療經(jīng)驗(yàn),對(duì)以后醫(yī)療方案的實(shí)施有重要的指導(dǎo)意義[6-8]。
3.2?原始電子病例資料庫(kù)
電子病歷包含病人的基本資料、醫(yī)生信息、檢查情況、診斷情況、醫(yī)囑、手術(shù)情況、護(hù)理信息等數(shù)據(jù)信息,隨訪病人資料主要有病人的基本資料、病人出院情況記錄、出院后的用藥記錄、病人的復(fù)診情況等。
病人的基本資料包括姓名、年齡、性別、身高、體重、血型、醫(yī)保費(fèi)用類別等;醫(yī)生信息包括科室、姓名、職稱、診療時(shí)間等;檢查情況包括主要癥狀的描述;檢查報(bào)告書包括放射、超聲波、心電圖、內(nèi)窺鏡等;醫(yī)技檢查診斷情況包括診斷依據(jù)、門診診斷、入院診斷、出院診斷等;醫(yī)囑包括日期、主治醫(yī)師姓名、臨時(shí)醫(yī)囑、長(zhǎng)期醫(yī)囑等;手術(shù)情況包括手術(shù)時(shí)間、參與人員、手術(shù)方案、手術(shù)記錄等;護(hù)理信息包括護(hù)士姓名、護(hù)理日期、護(hù)理計(jì)劃、床位設(shè)置、護(hù)理情況等。
將以上信息納入隨訪信息數(shù)據(jù)庫(kù)中,是對(duì)病案信息資源的二次開發(fā)。隨著醫(yī)院醫(yī)療工作的開展,隨訪工作量日益加大,設(shè)計(jì)完善的隨訪系統(tǒng)是科學(xué)、準(zhǔn)確地做好隨訪工作的前提和保障。根據(jù)原始電子病例資料庫(kù),運(yùn)用適當(dāng)?shù)乃惴ㄟM(jìn)行信息的清理,把對(duì)病患隨訪的無效的數(shù)據(jù)清理掉,然后通過各種隨訪手段進(jìn)行隨訪,建立起一個(gè)隨訪病人資料庫(kù)。隨訪庫(kù)建立流程如圖2所示。
3.3??隨訪病人資料
隨訪病人的基本資料應(yīng)該與醫(yī)院中的電子病例數(shù)據(jù)庫(kù)中病人的基本信息一致。病人的出院情況記錄疾病的種類、治療時(shí)間、出院時(shí)間、主治醫(yī)生以及隨訪人員編號(hào)。出院后的用藥記錄包括用藥種類、時(shí)間以及用藥效果等,病人的復(fù)診記錄包括復(fù)診時(shí)間、復(fù)診主診醫(yī)生、檢查情況、回復(fù)情況等。當(dāng)然,具體到每一個(gè)病例,不一定會(huì)包括所有的內(nèi)容,可能會(huì)涉及到新的內(nèi)容,這就需要具體情況具體分析。
醫(yī)院信息系統(tǒng)蘊(yùn)藏著海量數(shù)據(jù),全部調(diào)用既不可能,也無功效。所以通過現(xiàn)代的數(shù)據(jù)挖掘技術(shù)將隨訪庫(kù)和原始數(shù)據(jù)庫(kù)結(jié)合,進(jìn)行數(shù)據(jù)分析、清理和挖掘,得出具有代表性和指導(dǎo)意義的病例,并將其添加到治療方案庫(kù)當(dāng)中,逐漸形成一個(gè)大規(guī)模的、有價(jià)值的醫(yī)院治療指導(dǎo)信息庫(kù),使得以后其他病例有所借鑒,最終形成信息的共享?;卺t(yī)院數(shù)據(jù)倉(cāng)庫(kù)的數(shù)據(jù)挖掘功能如圖3所示。
?
?
通過醫(yī)院原始的信息庫(kù)建立一個(gè)隨訪庫(kù),對(duì)患者進(jìn)行跟蹤隨訪,記錄出院后的數(shù)據(jù),收集病人的隨訪數(shù)據(jù),然后通過對(duì)隨訪數(shù)據(jù)庫(kù)進(jìn)行數(shù)據(jù)挖掘,建立起一個(gè)有價(jià)值和指導(dǎo)意義的醫(yī)院醫(yī)療庫(kù)。醫(yī)生通過查閱醫(yī)院醫(yī)療庫(kù)中信息資料,可以了解某種疾病或某種手術(shù)方案以及以往病人的治療情況,并結(jié)合自己的臨床經(jīng)驗(yàn),形成治療某種疾病可選擇的手術(shù)方案。最終,提高醫(yī)療療效,達(dá)到提高醫(yī)療質(zhì)量的目的。
參考文獻(xiàn)
[1]?范明,孟小峰. 數(shù)據(jù)挖掘概念與技術(shù)[ M].北京:機(jī)械工業(yè)出版社,2001.
[2]?康曉東. 基于數(shù)據(jù)倉(cāng)庫(kù)的數(shù)據(jù)挖掘技術(shù)[M].北京:機(jī)械工業(yè)出版社,2004.
[3]?普通高等學(xué)校本科專業(yè)目錄和專業(yè)介紹[M].北京:高等教育出版社,1997.
[4]?范明,范宏建. 數(shù)據(jù)挖掘?qū)д揫M].北京:人民郵電出版社.2006.
[5]?JIAWei Han, MICHELINE K.Data mining concepts and techniques[M].China Machine Press,2005.
[6]?LECH P,SHUSAKU T,TSAU Y. Rough set method and applicaions: new deverlopments in knowledge discovery in information systems[M].Physica-Verlag,2000.
[7]?谷建軍,王洪國(guó),丁艷輝.粗糙理論及其在數(shù)據(jù)歸約中的應(yīng)用[J].信息技術(shù)與信息,2006(3).
[8]?傘冶,葉玉玲.粗糙理論及其在智能系統(tǒng)中的應(yīng)用[J].智能系統(tǒng)學(xué)報(bào),2007,4(2).