臺大醫院在大型語言模型的發展取得重要突破,訓練本地端大型語言模型(Large language model, LLM)應用於疾病分類編碼任務,兼顧科技創新與資訊安全。
AI疾分編碼系統 節省人力、準確度提升
在陳信希醫務秘書領軍,由病歷資訊管理室莊秋華主任擔任計畫主持人,以去辨識的病歷資料,結合病人多樣態的就醫紀錄資訊,創新導入專家知識於模型訓練,開發AI疾分編碼系統。這項創新的疾病分類輔助系統已於111年3月在臺大醫院醫療體系上線,不但可節省14%的人力工時,更能提升準確率。
隨著生成式人工智慧技術不斷地推進,基於大型語言模型的最新版疾分編碼系統,在今年11月上線使用,其效能更突破先前版本,短短1秒即可產生住院病人的ICD-10-CM/PCS疾病分類編碼(含診斷碼及處置碼)。
重視資料安全 設計專屬訓練策略
疾病分類是世界衛生組織(WHO)依據疾病特性及規則等將疾病分門別類,以代碼來表示,目前台灣採用國際疾病分類第十版臨床修訂版(International Classification of Diseases, 10th Revision, Clinical Modification, ICD-10 CM),作為健保申報、衛生政策制定、教學、研究參考,亦可作國際間比較。111年7月18日衛生福利部修訂「醫療機構電子病歷製作及管理辦法」第8條,各家醫院已可使用雲端服務來改善醫療支援系統。但病患資料一旦上傳至雲端服務平台,就有一定資安疑慮及風險。臺大醫院搶先在院內建構本地端的大型語言模型,採用預訓練模型,以臺大醫院院內資料進行精調,應用在疾病分類編碼任務,真正落實兼顧科技創新並符合相關法規的要求。
週期性模型更新 突破先前版本
莊秋華主任補充道,透過週期性模型更新來修正預測結果,如新興疾病、新醫療技術與其他困難疾病編碼也可正確預測,提升編碼品質及效率。團隊不斷嘗試進一步升級突破,近期更將泛用型大型語言模型,轉化為具備臺大醫院臨床專業知識的疾病分類模型,實驗顯示透過大型語言模型為基礎的疾病分類模型,效能更突破先前版本。