公務(wù)員期刊網(wǎng) 論文中心 正文

醫(yī)院數(shù)據(jù)挖掘管理運用

前言:想要寫出一篇引人入勝的文章?我們特意為您整理了醫(yī)院數(shù)據(jù)挖掘管理運用范文,希望能給你帶來靈感和參考,敬請閱讀。

醫(yī)院數(shù)據(jù)挖掘管理運用

1數(shù)據(jù)挖掘技術(shù)綜述

1.1數(shù)據(jù)挖掘的概念

數(shù)據(jù)挖掘(DataMining[1])是從大量的、不完全的、有噪聲的、模糊的、隨機(jī)的數(shù)據(jù)集中識別有效的、新穎的、潛在有用的,以及最終可理解的模式的非平凡過程。數(shù)據(jù)挖掘可粗略地理解為三部分:數(shù)據(jù)準(zhǔn)備(DataPreparation)、數(shù)據(jù)挖掘,以及結(jié)果的解釋評估(InterpretationandEvaluation)。將數(shù)據(jù)挖掘技術(shù)應(yīng)用到醫(yī)學(xué)信息數(shù)據(jù)庫中,可以發(fā)現(xiàn)其中的醫(yī)學(xué)診斷規(guī)則和模式,從而輔助醫(yī)生進(jìn)行疾病診斷,實現(xiàn)臨床決策支持的效果。

1.2數(shù)據(jù)挖掘的功能[2-6]

1.2.1關(guān)聯(lián)分析

數(shù)據(jù)關(guān)聯(lián)是數(shù)據(jù)庫中存在的一類重要的可被發(fā)現(xiàn)的知識。若兩個或多個變量的取值之間存在某種規(guī)律,就稱為關(guān)聯(lián)。關(guān)聯(lián)可分為簡單關(guān)聯(lián)、時序關(guān)聯(lián)、因果關(guān)聯(lián)。

1.2.2分類

分類就是找出一組能夠描述數(shù)據(jù)集合典型特征的模型(或函數(shù)),以便能夠分類識別未知數(shù)據(jù)的歸屬或類別,即將未知事例映射到某種離散類別之一。

1.2.3聚類

數(shù)據(jù)庫中的記錄可被化分為一系列有意義的子集,即聚類。

1.2.4概念描述

對含有大量數(shù)據(jù)的數(shù)據(jù)集合進(jìn)行概述性的總結(jié)并獲得簡明、準(zhǔn)確的描述,這種描述就稱為概念描述。

1.2.5預(yù)測

數(shù)據(jù)挖掘自動在大型數(shù)據(jù)庫中尋找預(yù)測性信息,以往需要進(jìn)行大量手工分析的問題如今可以迅速直接由數(shù)據(jù)本身得出結(jié)論。

1.2.6異常檢測

一個數(shù)據(jù)庫中的數(shù)據(jù)一般不可能都符合分類預(yù)測或聚類分析所獲得的模型,那些不符合大多數(shù)數(shù)據(jù)對象所構(gòu)成的規(guī)律的數(shù)據(jù)對象就被稱為異常數(shù)據(jù)。

1.3數(shù)據(jù)挖掘的過程

數(shù)據(jù)挖掘過程[7-9]是在設(shè)計者的主動參與下進(jìn)行的知識發(fā)現(xiàn)過程,是在積累了大量的數(shù)據(jù)后,從中識別出有效的、新穎的、潛在的、最終可以理解并加以有目的運用的知識。一般分為以下步驟:問題定義:清晰地定義出業(yè)務(wù)問題,認(rèn)清數(shù)據(jù)挖掘的目的是數(shù)據(jù)挖掘的重要一步。數(shù)據(jù)準(zhǔn)備:①數(shù)據(jù)理解---將數(shù)據(jù)轉(zhuǎn)換成一個分析模型。這個分析模型是針對挖掘算法建立的。②數(shù)據(jù)的選擇及簡化—是根據(jù)用戶的需要從原始數(shù)據(jù)庫中抽取的一組數(shù)據(jù)。③數(shù)據(jù)的預(yù)處理--研究數(shù)據(jù)的質(zhì)量,為進(jìn)一步的分析做準(zhǔn)備。數(shù)據(jù)挖掘:對所得到的經(jīng)過轉(zhuǎn)換的數(shù)據(jù)進(jìn)行挖掘。結(jié)果分析:解釋并評估結(jié)果。知識的優(yōu)化:將分析所得到的知識集成到業(yè)務(wù)信息系統(tǒng)的組織結(jié)構(gòu)中去。

2醫(yī)院信息系統(tǒng)中數(shù)據(jù)挖掘的研究

2.1醫(yī)療數(shù)據(jù)挖掘主要分類

2.1.1從數(shù)據(jù)挖掘的處理過程、功能模型、算法研究,可以將醫(yī)用數(shù)據(jù)挖掘按功能模型和挖掘?qū)ο髢蓚€方面進(jìn)行如下分類[10-14]。

2.1.1.1按照功能模型分類:常用的數(shù)據(jù)挖掘技術(shù)可以分成統(tǒng)計分析類、知識發(fā)現(xiàn)類、和其他類型的數(shù)據(jù)挖掘技術(shù)三大類。①統(tǒng)計分析類:統(tǒng)計是數(shù)據(jù)搜集和描述數(shù)學(xué)的一個分支。在醫(yī)療數(shù)據(jù)挖掘中的應(yīng)用如:聚類分析方法可以對DNA分析、醫(yī)學(xué)影像數(shù)據(jù)自動分析、多生理參數(shù)監(jiān)護(hù)數(shù)據(jù)分析、中醫(yī)診斷和方劑的研究、疾病危險因素分析等。②知識發(fā)現(xiàn)類:知識發(fā)現(xiàn)是用一種間接的方式從數(shù)據(jù)中抽取信息的一種技術(shù),而這些信息是隱含的、未知的,并且具有潛在應(yīng)用價值。其中可分為:a.關(guān)聯(lián)規(guī)則型知識挖掘技術(shù),是醫(yī)用數(shù)據(jù)挖掘的一種主要形式。b.神經(jīng)網(wǎng)絡(luò)型知識挖掘技術(shù)。c.遺傳算法型知識挖掘技術(shù)。d.粗糙集型知識挖掘技術(shù)。如關(guān)聯(lián)分析可以用來分析預(yù)測手術(shù)術(shù)后和藥物治療的效果,可以對某種疾病的相關(guān)發(fā)病因素進(jìn)行分析以指導(dǎo)患者如何預(yù)防該疾??;可以對帶病DNA和健康組織的DNA基因序列進(jìn)行比較,以識別出兩類基因的差別,從而得出致病因素;可以對患者的生理參數(shù)進(jìn)行分析,分析各種生理參數(shù)之間的關(guān)系進(jìn)而得出有意義預(yù)防與治療方案等。e.機(jī)器學(xué)習(xí)類,歸納學(xué)習(xí)方法又可分為決策樹、規(guī)則歸納等。如決策樹用于前庭區(qū)與頭暈有關(guān)的疾病診斷規(guī)則的提取。③其他類型:除以上陳述的數(shù)據(jù)挖掘技術(shù)外,近年來,隨著各種數(shù)據(jù)處理工具、先進(jìn)的數(shù)據(jù)庫技術(shù)與因特網(wǎng)技術(shù)的迅速發(fā)展,還出現(xiàn)了一些其他數(shù)據(jù)挖掘技術(shù)。如文本挖掘技術(shù)、Web挖掘技術(shù)、分類分析技術(shù)、地理信息系統(tǒng)與空間數(shù)據(jù)挖掘技術(shù)以及分布式數(shù)據(jù)挖掘技術(shù)等。

2.1.1.2按照挖掘?qū)ο蠓诸悾喊凑詹煌臄?shù)據(jù)類型,數(shù)據(jù)挖掘研究在時間序列數(shù)據(jù)、空間數(shù)據(jù)、文本數(shù)據(jù)、多媒體數(shù)據(jù)等方面展開。①時間序列數(shù)據(jù)(TimeSeriesData)是與時間有關(guān)的一系列數(shù)據(jù)。對時間序列數(shù)據(jù)的挖掘主要是發(fā)現(xiàn)序列中事物出現(xiàn)的周期和規(guī)律,以及不同時間序列間的同步關(guān)系。如應(yīng)用時間序列預(yù)測方法可以對醫(yī)院藥品進(jìn)、銷、存產(chǎn)生的數(shù)據(jù)進(jìn)行統(tǒng)計分析。②序列(Sequential)模式序列模式與關(guān)聯(lián)模式相仿,其目的也是為了挖掘數(shù)據(jù)之間的聯(lián)系,但是序列模式分析的側(cè)重點在于分析數(shù)據(jù)之間的前因后果。如:對醫(yī)院門診和住院患者量進(jìn)行預(yù)測,可以分析某種疾病發(fā)病率的變化趨勢,病死率預(yù)測等。③文本數(shù)據(jù)(TextData)就是我們一般的文字,如報刊雜志、設(shè)備維護(hù)手冊、故障描述等的內(nèi)容。④多媒體數(shù)據(jù)(MultimediaData)是隨著多媒體技術(shù)而日益涌現(xiàn)的聲音、圖形、圖像、超文本等數(shù)據(jù)。應(yīng)用領(lǐng)域例如針對大量CT、MR圖像的存儲和查詢問題而興起的基于內(nèi)容的圖像問題。由于與傳統(tǒng)的文本數(shù)據(jù)不同,因此必須采用新的挖掘手段來發(fā)現(xiàn)內(nèi)容和形式間的內(nèi)在聯(lián)系。

2.1.2按應(yīng)用層面可醫(yī)院數(shù)據(jù)挖掘可分為診療信息挖掘和管理信息挖掘。診療應(yīng)用如:中山大學(xué)腫瘤防治中心的研究人員通過腫瘤分子信息和數(shù)據(jù)挖掘方法可以預(yù)測早期非小細(xì)胞肺癌5年內(nèi)是否死亡,這一預(yù)測的總正確率達(dá)87.2%,該技術(shù)一旦成熟,今后每個肺癌患者開刀做完手術(shù)后,可借此預(yù)測其5年存活情況,而且檢測費用遠(yuǎn)比國外的基因檢測便宜;上海同濟(jì)大學(xué)附屬醫(yī)院分析糖尿病患者肌肉組織和脂肪含量與骨密度之間的聯(lián)系,得出高肌肉和高脂肪含量可以降低患者髖骨骨折的危險性;第四軍醫(yī)大利用數(shù)據(jù)庫和數(shù)據(jù)挖掘技術(shù)建立了惡性血液病數(shù)據(jù)庫分析系統(tǒng)等。管理應(yīng)用如:北京協(xié)和醫(yī)院開展數(shù)據(jù)挖掘在臨床醫(yī)療管理上的研究,為醫(yī)院業(yè)務(wù)管理等提供支撐,并輔助領(lǐng)導(dǎo)決策;廣州南方醫(yī)院采用數(shù)據(jù)挖掘查詢系統(tǒng)查詢醫(yī)生有否開大處方,患者是否花了不該花的醫(yī)藥費,且患者有望提前治愈出院。

2.2醫(yī)療數(shù)據(jù)挖掘的應(yīng)用研究

2.2.1診療信息挖掘

診療信息挖掘主要目的是通過患者信息分析,提供有參考作用的醫(yī)療方案。①建立患者隨訪信息庫。②臨床疾病分析、輔助診斷:如:a.判別分析:用于心臟疾病的分類;用于闌尾炎4種不同類型的判別。b.人工神系統(tǒng)網(wǎng)絡(luò):用于顱內(nèi)星形膠質(zhì)細(xì)胞瘤良、惡性的影像診斷;用于肺內(nèi)孤立結(jié)節(jié)的影像鑒別診斷。c.決策樹:糖尿病分類規(guī)則建立;前庭區(qū)與頭暈有關(guān)的疾病診斷規(guī)則的提取。

2.2.2管理信息挖掘

2.2.2.1財務(wù)管理[15,16]

①患者費用構(gòu)成分析:患者費用由藥品、治療、檢查、手術(shù)、化驗等組成。利用數(shù)據(jù)挖掘技術(shù)可以分析醫(yī)院、科室乃至各個病區(qū)專科內(nèi)的患者費用構(gòu)成,從而能有針對性地控制費用比例,探究醫(yī)療費用項目結(jié)構(gòu)的合理性,使醫(yī)院管理者有針對性的控制醫(yī)療費用。②同期費用對比分析:利用數(shù)據(jù)挖掘技術(shù)可以按不同的時間對各個科室或各個病區(qū)同期的各種費用進(jìn)行對比分析,并以各種專業(yè)報表、視圖的形式反映給醫(yī)院管理者,分析變化趨勢及可能原因。③成本效益分析:利用數(shù)據(jù)挖掘技術(shù)可以把各個不同系統(tǒng)如物資設(shè)備系統(tǒng)、財務(wù)系統(tǒng)等的數(shù)據(jù)匯總到數(shù)據(jù)倉庫,然后對醫(yī)院的成本效益情況進(jìn)行全面分析,以便能真正把握醫(yī)院的經(jīng)營狀況,提高醫(yī)院的經(jīng)濟(jì)效益。例如:對醫(yī)院資金運轉(zhuǎn)情況作財務(wù)分析,了解醫(yī)院財務(wù)狀況和資金流向,分析醫(yī)院運營風(fēng)險,利用數(shù)據(jù)挖掘中的環(huán)基比和定基比技術(shù)分析醫(yī)院財務(wù)資金的增長速度,并用曲線擬合來預(yù)測未來的資金需求量,為管理者決策和促進(jìn)資源的有效配置提供依據(jù)。④醫(yī)保費用構(gòu)成分析:利用醫(yī)院業(yè)務(wù)數(shù)據(jù)結(jié)合醫(yī)保中心返還數(shù)據(jù)對醫(yī)保分科的定額結(jié)算進(jìn)行分析,指導(dǎo)醫(yī)院各科室合理、高效的利用醫(yī)保資源,在醫(yī)保定額下提供更好的醫(yī)療服務(wù)。

2.2.2.2醫(yī)療質(zhì)量管理[17-19]

①單病種分析:以ICDlO疾病分類為標(biāo)準(zhǔn),利用數(shù)據(jù)挖掘技術(shù)對單病種進(jìn)行分析,包括住院費用、住院天數(shù)、轉(zhuǎn)歸、病情、治療方案等方面,為醫(yī)療質(zhì)量管理提供依據(jù),使醫(yī)生能夠及時總結(jié)經(jīng)驗,找出最佳治療手段,既縮短了患者的就診住院時間,減輕了患者的負(fù)擔(dān),同時提高了醫(yī)療工作效率,增加了醫(yī)院經(jīng)濟(jì)效益。②手術(shù)室感染管理:a.手術(shù)室無菌物品及一次性用品智能備庫系統(tǒng);b.總結(jié)消毒滅菌工作與消毒效果的規(guī)律;c.預(yù)測術(shù)后切口感染合理安排手術(shù)并防止抗生素的濫用;d.利用HIS中知識解決消毒滅菌難點并杜絕差錯;e.對參觀手術(shù)人員和進(jìn)修生實習(xí)生的管理;f.對手術(shù)室消毒滅菌和醫(yī)院感染常規(guī)工作動態(tài)監(jiān)測。③藥學(xué)管理:a.備藥量預(yù)測:用時間序列預(yù)測方法,對HIS中現(xiàn)有的藥品用量信息進(jìn)行計算模擬,得出藥品消耗模型。b.制劑最佳批生產(chǎn)量預(yù)測:在分析醫(yī)院制劑歷年用量及近期消耗趨勢下,得出該制劑效期內(nèi)用量,并通過計算得出該制劑的最佳批生產(chǎn)量預(yù)測模型。c.治療藥物監(jiān)測:對藥物監(jiān)測(TDM)歷史數(shù)據(jù)分析、提取、加工、整合,更深層次挖掘(或發(fā)現(xiàn))一些新知識,如開展藥物群體藥動學(xué)研究、藥物濃度影響因素相關(guān)度分析等,為臨床提供更多有價值的資料,實現(xiàn)給藥個體化、提高藥物療效、降低藥物毒副反應(yīng)等。d.抗生素合理應(yīng)用自動監(jiān)控:對HIS中相關(guān)信息進(jìn)行提取、分析、挖掘,對抗生素的用量、耐藥性、聯(lián)合用藥、療程、圍手術(shù)期用藥、預(yù)防用藥、用藥途徑及治療效果等指標(biāo)實行自動監(jiān)控,從而實時、有效地監(jiān)測抗生素使用情況。

2.2.2.3醫(yī)院經(jīng)營目標(biāo)管理[20]

①患者構(gòu)成分析:運用數(shù)據(jù)挖掘技術(shù)中的秩和比法對醫(yī)院門診和住院患者的地區(qū)分布、性別分布、身份分布、職業(yè)分布、年齡分布等方面進(jìn)行分析,從而得到不同類型患者的經(jīng)濟(jì)狀況、需求的主要醫(yī)療服務(wù)類型等信息,了解患者差異對醫(yī)院收益的影響,從而能夠有針對性的采取措施來提高服務(wù)質(zhì)量,增加門診量和住院量。②患者流動情況分析:該功能可以分析門診患者從掛號到取藥再到離開醫(yī)院的時間分布以及住院患者從入院到出院各個就醫(yī)環(huán)節(jié)的時間分布。分析出患者的就醫(yī)瓶頸,掌握影響患者診療效率的因素,以便能針對這些因素采取措施來幫助醫(yī)院管理者進(jìn)行業(yè)務(wù)流程的更新和改進(jìn),提高患者的就診效率。

2.2.2.4經(jīng)營決策管理[21]

①患者就診時間分析:由于患者的入院季節(jié)性較強(qiáng),可以通過分析每月、每季度的門診人次、住院人次、床位周轉(zhuǎn)率,通過時間維度分析,建立灰色預(yù)測模型,來預(yù)測下一時期的門診和住院人次。根據(jù)預(yù)測信息,醫(yī)院管理者可以提出有針對性的措施,確定最優(yōu)的服務(wù)項目時間表,從而作出終止或開拓某種醫(yī)療服務(wù)項目的決定,實現(xiàn)對人力資源、醫(yī)療設(shè)施、醫(yī)療設(shè)備的適當(dāng)配置。②醫(yī)療工作量影響分析:科學(xué)合理地評價醫(yī)療工作量,找出影響醫(yī)療工作量變化的主要因素,是進(jìn)行醫(yī)療工作量影響分析的目的。例如:醫(yī)院收治患者數(shù)是醫(yī)院工作量的重要指標(biāo)之一,直接影響醫(yī)院的經(jīng)濟(jì)效益和社會效益。利用數(shù)據(jù)挖掘技術(shù)中的灰色關(guān)聯(lián)分析方法對醫(yī)院收治患者數(shù)的影響因素進(jìn)行分析:病床周轉(zhuǎn)次數(shù)、住院患者手術(shù)人次、年收治患者人數(shù)、平均開放病床數(shù)和年平均醫(yī)生人數(shù)與年收治患者數(shù)關(guān)聯(lián)程度等。

2.2.2.5醫(yī)院資源管理

①科室綜合評價分析:利用數(shù)據(jù)挖掘技術(shù)對醫(yī)院各科室進(jìn)行綜合評價分析,選出代表性強(qiáng)、獨立性好,能反映科室工作效率、治療質(zhì)量、經(jīng)濟(jì)效益、綜合管理等的多項指標(biāo)進(jìn)行綜合評價分析,找到科室的薄弱環(huán)節(jié),并采取相應(yīng)的措施,以提高科室的綜合水平。②醫(yī)療設(shè)備績效預(yù)測分析:從HIS中的患者信息中提取病種、數(shù)量、診療類別等信息后與醫(yī)療設(shè)備使用信息相關(guān)聯(lián),利用數(shù)據(jù)挖掘技術(shù)對所得到的信息進(jìn)行深層次的數(shù)據(jù)挖掘,構(gòu)建數(shù)據(jù)挖掘模型,利用已建立的數(shù)據(jù)挖掘模型,在醫(yī)療設(shè)備購置前對其績效進(jìn)行預(yù)測,使醫(yī)院領(lǐng)導(dǎo)的決策更為準(zhǔn)確、科學(xué);在醫(yī)療設(shè)備投入使用后,對其績效進(jìn)行準(zhǔn)確評價,提高醫(yī)療設(shè)備的完好率和使用率。通過進(jìn)一步的數(shù)據(jù)挖掘,實現(xiàn)對醫(yī)療設(shè)備從購置前的可行性論證到淘汰報廢的全程決策支持,使醫(yī)療設(shè)備的全壽命期都納入管理者的統(tǒng)籌管理之中,較好地解決醫(yī)療設(shè)備效益、代價、風(fēng)險等互相制約的管理難題,充分發(fā)揮醫(yī)療設(shè)備的社會效益和經(jīng)濟(jì)效益。因此本研究具有明確的推廣應(yīng)用前景及重大應(yīng)用意義。

2.3醫(yī)療數(shù)據(jù)挖掘的熱點及前景

當(dāng)前,數(shù)據(jù)挖掘的研究方興未艾,其研究與開發(fā)的總體水平相當(dāng)于數(shù)據(jù)庫技術(shù)在20世紀(jì)70年代所處的地位,迫切需要類似于關(guān)系模式、數(shù)據(jù)挖掘系統(tǒng)和SQL查詢語言等理論和方法的指導(dǎo),才能使數(shù)據(jù)挖掘的應(yīng)用得以普遍推廣。其研究可能會集中到幾個方面,而生物信息或基因的數(shù)據(jù)挖掘則是熱點之一。數(shù)據(jù)挖掘在醫(yī)院管理中的應(yīng)用將會涉及醫(yī)療及管理的各個部分及層面,數(shù)據(jù)挖掘?qū)⑿纬上到y(tǒng),并通過廣泛深入的數(shù)據(jù)挖掘產(chǎn)生醫(yī)療方案數(shù)據(jù)庫,為合理診斷、完善臨床路徑,提供有效幫助;通過數(shù)據(jù)挖掘分析達(dá)到人力資源合理配置;通過數(shù)據(jù)挖掘為區(qū)域性衛(wèi)生系統(tǒng)構(gòu)建提供有效依據(jù)等。

3結(jié)論

數(shù)據(jù)挖掘技術(shù)是一門發(fā)展迅速新興的學(xué)科,它的產(chǎn)生與的發(fā)展是數(shù)據(jù)庫技術(shù)發(fā)展自然演化的結(jié)果,數(shù)據(jù)挖掘技術(shù)被專家預(yù)測可能是繼網(wǎng)絡(luò)技術(shù)之后的下一個技術(shù)熱點。隨著醫(yī)院信息管理的不斷發(fā)展,數(shù)據(jù)挖掘技術(shù)的應(yīng)用必將在醫(yī)院的管理和決策中起著越來越重要的作用。目前我們正處于一個“信息爆炸、知識貧乏”的時代,如何從紛繁蕪雜的數(shù)據(jù)中找到我們需要的知識?只能是通過數(shù)據(jù)挖掘,去偽存真,發(fā)現(xiàn)現(xiàn)象背后的本質(zhì)。通過對醫(yī)院豐富的數(shù)據(jù)進(jìn)行數(shù)據(jù)挖掘,找出有利于治療、護(hù)理等方面的知識,提高我們的醫(yī)療水平,是我們醫(yī)院信息化工作者迫切的任務(wù)。