以資料探勘技術進行巨量資料分析,建立慢性肺病術後併發症風險評估模型

研究計畫: A - 政府部門b - 科技部

說明

慢性阻塞性肺病(Chronic Obstructive Pulmonary Disease,COPD)是一種高致殘率和高致死 率的慢性呼吸系統疾病。根據世界衛生組織的資料,西元2008 年COPD 的死因排名高居第4 位,預計於西元2020 年可能將上昇成為第3 位。在美國,COPD 本身與其併發症所導致的醫 療花費,於西元2010 年估計約320 億美元,而於西元2020 年預估將高達490 億美元。 接受手術就有可能發生術後併發症,併發症不僅讓人痛苦,延後出院時機,也大幅增加醫 療成本。過去關於術後併發症的研究,其議題的全面性及樣本數皆嫌不足。美國於1991 年推 動的「美國外科品質改善計劃」,是第一個大樣本且探討外科照護品質的研究,然而其計劃的 缺點,在於資料來源全數為地區退伍軍人醫學中心,病人族群及其保險給付模式過於特殊, 無法代表一般病人族群。台灣全民健保資料庫涵括全國99%以上民眾就醫資料,使用健保資 料庫研究所得的結論,可具有較高的代表性與實用性。 過去健保資料庫的相關研究,多是利用傳統的統計方法進行分析,而近年來發展的多種資 料探勘技術,包含類神經網路,遺傳演算法,支持向量機,以及敏感度分析等等,都有助於 大型資料庫分析研究。類神經網路相較於傳統統計方法,優點包括:可建構非線性模型、模 型準確度高、對於未知的輸入亦可得到正確的輸出、適應性強等等。健保資料庫資料量相當 龐大,資料變數也相當多且複雜,以類神經網路為基礎,結合其它資料探勘技術來建立風險 評估模型,應可以得到更好的預測效能。 此計畫使用全民健保資料庫,收集病患流行病學相關資料,主診斷與次診斷碼,醫療程序, 醫藥處方,醫療花費,以及住院與門診就診相關的參數。計畫採取類神經網路,支持向量機, 及多變數邏輯斯迴歸3 種模型架構,針對「肺炎」、「肺栓塞」、「呼吸衰竭」、「傷口感染」、「敗 血症」、「急性心肌梗塞」、「急性腎衰竭」、「腦中風」等併發症,以及「死亡」,分別建立獨立 的風險評估模型。模型訓練過程以遺傳演算法協助網路節點的優化,以敏感度分析評估個別 輸入因子的重要程度。最後利用外部資料進行模型的效能評估,以接收者操作特徵曲線下之 面積(the area under receiver operating characteristic curve) 來評估模型的鑑別力, 以 Hosmer-Lemeshow goodness-of-fit statistic 來評估模型的校正度(calibration)。 此模型可協助臨床醫師面對手術病患時,解釋發生術後併發症的風險。根據此模型,臨床 醫師於術前面對病患進行風險評估時,將有實證醫學的參考依據,醫護人員並可事先提高警 覺,採行必要措施來減少或避免重大術後併發症的發生,對於病患整體的醫療照護,可提供 相當大的助益。
狀態已完成
有效的開始/結束日期8/1/1610/31/17