善用人工智慧了解病因

Using AI to Understand What Causes Diseases
希瑪.斯蓋爾 Sema Sgaier , 法蘭西絲卡.多明尼奇 Francesca Dominici
瀏覽人數:1423
醫藥界必須擴大演算法的應用。其中一個正在開發和驗證的新方法,稱為「因果人工智慧」。因果人工智慧演算法可以從觀測數據來推斷出因果關係,告訴我們不同因素如何相互作用,以及哪個因素導致了什麼情況。此外,還可以進行「如果……會怎樣?」的模擬。

目前,健康照護的領導人正全心接納人工智慧(AI)。不過,我們廣泛檢視了個案研究和研究文獻之後發現,他們絕大多數的人工智慧計畫,聚焦在開發出可以「預測」癌症等問題的演算法,以便以較低花費更迅速地做出更好的診斷。他們的組織很少將資源用於了解疾病「為何」發生的人工智慧工作。若要讓醫療介入措施盡可能有效果,這兩種演算法都非常重要。

明確地說,我們並沒有低估預測分析(predictive analytics)在協助診斷病患方面的重要性。這項技術正挽救許多生命。貝絲以色列女執事醫療中心(Beth Israel Deaconess Medical Center)使用一些模型來預測,哪些病人可能不會回院複診或錯過治療,以便提前採取介入措施,例如傳簡訊給他們。Google Mind和美國退伍軍人事務部(U.S. Department of Veterans Affairs)合作開發了一種技術,能夠比目前診斷所需時間提前48小時,就預測到急性腎損傷(五分之一的住院病人受到這種病症影響)。

不過,深度學習(deep learning)之類的預測模型,主要是藉由發現數據中的複雜模式來預測結果。例如,它們可以根據皮膚病變的多個影像,預測是否應將新的病變影像標記為惡性或良性。它們將工作從人類手中(在這個案例中是放射科醫師),移交給演算法,於是接手了我們已經在做的事情,並加以改善。正如最近一篇《哈佛商業評論》文章所強調的,「……人工智慧目前創造的最大價值,在於協助第一線臨床醫師提高生產力,並讓後端流程更有效率,但尚未用於協助進行臨床決策,或改善臨床結果。用於找出病因的臨床應用,目前還是很少。」

相較之下,透過因果演算法(causal algorithm),我們也可以找認出導致癌症的潛在因素,並運用這項知識來開發新藥,以及得知哪些病人應該接受這些藥物。

在健康照護領域裡,了解因果關係的標準方法,是進行隨機對照試驗。但這類試驗花費高昂且耗費時日,也不能完全代表不同類型的病人,而且時常就是不可行。因果人工智慧演算法,可以從觀測數據來推斷出因果關係,告訴我們不同因素如何相互作用,以及哪個因素導致了什麼情況。我們也可以進行「如果……會怎樣?」的模擬,例如,把治療劑量增加為十倍,對疾病結果會產生什麼影響?

因果人工智慧的新方法正在開發和驗證當中,像是貝氏網路(Bayesian network)、結構方程式模型和潛在結果架構等方法。我們特別覺得以下領域很有價值:

發現疾病機制。資料分析公司GNS Healthcare與腫瘤臨床試驗聯盟(Alliance for Clinical Trials in Oncology)合作,希望藉由更了解潛在疾病機制,以提高大腸直腸癌的存活率。他們使用一項臨床試驗的數據,包括兩千多名接受兩種不同藥物治療的病人,根據這些數據建立了因果關係模型。他們能夠從中找出分子的和臨床的導致因素,把這些導因當作存活的生物標記,好讓醫師可以更妥善地針對合適的病人給予恰當的治療。

治療方法最佳化。因果人工智慧最違反直覺、但也令人興奮的應用之一,可能就是提供決策支持給醫護人員。用於評估病人風險並決定最佳治療方法的預測模型,有時候可能提出不可靠的建議。例如,某個模型錯誤地預測,患有肺炎的氣喘病人死亡可能性比較低,真正的原因是醫院的政策是直接讓這些病人入住加護病房,而這個模型並未考慮到這一點。根據這個結果擬定的政策,可能會建議提供較少的醫療照護給氣喘病人,而這是危險的建議。因果人工智慧模型可以克服這類風險。

蘇琪.薩瑞亞(Suchi Saria)博士一直在使用反事實模型(counterfactual model)。他們使用「如果⋯⋯會怎樣」的推論方法,來預測在不同的行動順序下(例如各項醫療介入措施),連續時間軌跡(例如疾病的結果)會如何發展。她的團隊使用在加護病房中洗腎病人的數據,檢視了肌酸酐濃度(這項濃度在腎衰竭時會升高),因而建立一個可用個人化方式進行透析的模型,也就是可以按照個人的情況來決定,應在何時對哪一位病人進行哪一種透析。

有關健康的社會決定因素。美國和全球的健康照護專業人員仍都難以了解,病人周遭的社會因素會如何影響健康。我們任職的瑟構基金會(Surgo Foundation)在印度的研究當中,想了解印度北方邦(Uttar Pradesh)為何會有20%的婦女即使已知在家生產會有健康風險,仍決定在家生產。例如,我們運用因果機器學習技巧,得知距離醫院的遠近其實沒有影響,儘管大多數投資實際上都聚焦於在附近建造更多醫院。

我們原本也假設,婦女比較喜歡在家生產。但我們發現,在醫院生產的一項關鍵決定因素,是婦女是否有生產計畫(比方說安排前往醫院的交通方式),以及非常堅定地認為醫院並不安全。因此,我們現在可以把正確的訊息和醫療介入措施,傳達給適合的對象。

那麼,我們要如何讓因果人工智慧,在健康照護當中發揮更重要的功能?首先,了解人工智慧可發揮功能的廣度很重要。健康照護領導人必須花時間確認,本身工作中有哪些問題最能從因果人工智慧受益,與擁有這個領域專業知識的公司和學者合作,然後在少數一些個案當中測試這個方法。

其次,數據是關鍵所在。我們雖然能取得必要的數據,好讓在家生產計畫得到有意義的結果,但取得足夠的數據可能會是挑戰。因果人工智慧提供可靠結論的能力,取決於是否擁有正確且具有代表性的數據。我們若要把模型訓練成為智慧模型,前提是必須提供極佳品質、足以代表適當人口的數據資料給這些模型,而且這些資料要能與其他資料集結合起來,還必須已經與一個優質的控制組做過比較。組織必須投資,以建立這些演算法所需的數據基礎設施。

透過因果人工智慧來詢問「為什麼」,可提供一些新方法來解決複雜性,以便善用數據的力量,採取行動來處理導致疾病的最重要因素。開發出可以執行這項任務的演算法,難度勝過開發出可進行預測的演算法。但這不僅是值得付出的努力,也是必要的努力。

(蘇偉信譯)



希瑪.斯蓋爾

希瑪.斯蓋爾 Sema Sgaier

瑟構基金會(Surgo Foundation)共同創辦人及執行董事,也是哈佛大學陳曾熙公共衛生學院(Harvard T.H. Chan School of Public Health)兼任助理教授,以及華盛頓大學(University of Washington)全球健康兼任助理教授。


法蘭西絲卡.多明尼奇

法蘭西絲卡.多明尼奇 Francesca Dominici

哈佛大學陳曾熙公共衛生學院生物統計學、人口健康與資料科學講座教授,哈佛大學資料科學計畫(Data Science Initiative)共同主任,以及醫學研究所(Institute of Medicine)成員。


本篇文章主題技術