今日最新上線的《自然》子刊《Nature Medicine》上,發(fā)表了一項激動人心的成果:利用機器學(xué)習(xí)和自然語言處理等人工智能(AI)技術(shù),廣州市婦女兒童醫(yī)療中心的夏慧敏教授和加州大學(xué)圣地亞哥分校(UCSD)張康教授領(lǐng)銜的一支研究團隊,合作帶來一款全新的AI診斷工具。這項工具和人類醫(yī)生一樣,當(dāng)填寫完患者口述和醫(yī)生體查文本型病歷之后,工具可直接閱讀醫(yī)療病歷,自動分析患者病情,智能給出推薦診斷。這是該團隊在《細胞》雜志封面發(fā)表有關(guān)AI圖像診斷的論文后,不到一年時間里,在AI技術(shù)實施應(yīng)用于醫(yī)療方面取得的另一個重要里程碑。它標(biāo)志AI模擬人類醫(yī)生進行疾病診斷時代的到來。
近年來,AI在基于醫(yī)學(xué)圖像的診斷上一次次超越人類。在放射學(xué)、病理學(xué)、眼科學(xué)、皮膚病學(xué)等影像數(shù)據(jù)的識別和篩查上,以機器學(xué)習(xí)為基礎(chǔ)的診斷工具表現(xiàn)搶眼。不過,這些應(yīng)用對于迅猛發(fā)展的AI技術(shù)來說,還只是小試身手。真正的考驗,在于AI能否像人類一樣,讀懂疾病信息,而不是僅僅分析圖片。在這項研究中,科學(xué)家們成功實現(xiàn)了這一目標(biāo),挖掘出了AI在輔助醫(yī)生診斷上的巨大潛力。而他們所關(guān)注的,是對多種兒科疾病的準(zhǔn)確診斷。
對兒科疾病的診斷是醫(yī)療中的一大痛點。一方面,兒童的抵抗力較弱,容易罹患多種疾病。另一方面,一些兒科疾病威脅程度較大,需要盡快得到治療。能夠快速、準(zhǔn)確地對兒科疾病進行診斷,不但可以減少患者們的等待時間,還可以讓那些情況危急的兒童及時得到醫(yī)療診治。
▲本研究團隊的負責(zé)人夏慧敏教授(左)與張康教授(右)(圖片來源:兩位學(xué)者所任職科研院所官網(wǎng))
為了解決這一痛點,研究人員們首先訓(xùn)練AI理解海量電子病歷中的臨床特征數(shù)據(jù),這包括了醫(yī)生輸入的大量文本報告。光是這一步,難度就比分析影像數(shù)據(jù)要大多了!電子病歷中,包括個人史、體格檢查、實驗室檢驗結(jié)果、用藥和手術(shù)等許多方面,維度遠遠高于圖像。而且,電子病歷數(shù)據(jù)中往往存在一些系統(tǒng)差錯,以及有意或無意的輸入錯誤,都會給數(shù)據(jù)分析帶來噪音。因此,怎么從電子病歷中挖掘數(shù)據(jù),用機器學(xué)習(xí)方法來進行準(zhǔn)確的模式識別,這是一個挑戰(zhàn)。
為此,研究人員整合醫(yī)學(xué)知識和數(shù)據(jù)建模,提出了一個數(shù)據(jù)挖掘框架,以深度學(xué)習(xí)技術(shù)為基礎(chǔ),開發(fā)了一套自然語言處理系統(tǒng)。
▲AI診斷框架的設(shè)計流程圖(圖片來源:參考資料[1])
深度學(xué)習(xí)是機器學(xué)習(xí)的一個類別,使用多層神經(jīng)網(wǎng)絡(luò)進行推理,需要大量的訓(xùn)練數(shù)據(jù)來實現(xiàn)高精度。而這項研究的大量數(shù)據(jù)來自近60萬名患兒、超過130萬門診人次的電子病歷,讓機器學(xué)習(xí)的技術(shù)提高有了極大保障。
尤其值得一提的是,針對電子病歷中醫(yī)生記錄的診斷文本,研究人員建立了一套自然語言處理模型進行信息提取。在這一階段,兩個研究機構(gòu)的醫(yī)生和科學(xué)家通力合作,由高級主治醫(yī)師和信息學(xué)研究人員組成的專家團隊手動給電子病歷上的6000多張圖表進行注釋,對模型進行訓(xùn)練和檢驗。高質(zhì)量的數(shù)據(jù)輸入成為這套系統(tǒng)的關(guān)鍵優(yōu)勢。
有了良好的訓(xùn)練為基礎(chǔ),接下來,研究團隊采用邏輯回歸分類器的機器學(xué)習(xí)方式,建立了一套AI分診系統(tǒng)。這套分類系統(tǒng)模擬人類醫(yī)生問診的框架,把電子病歷中提取到的臨床特征按人體各大系統(tǒng)來逐級劃分。
具體來看,這套系統(tǒng)首先會按呼吸系統(tǒng)疾病、胃腸道疾病、全身性疾病等幾大系統(tǒng)分,然后在每一類下面做細分。舉例來說,在最常見的呼吸系統(tǒng)疾病中,這個系統(tǒng)會先按上呼吸道和下呼吸道進行區(qū)分,再按喉炎、氣管炎、支氣管炎、肺炎進行細分。經(jīng)過檢驗,在每一層級,由AI做出的初級診斷在精確度上都接近檢查醫(yī)師做出的初級診斷。例如在患兒群體中最常見的急性上呼吸道感染,模型對病例的診斷達到95%的準(zhǔn)確率。
對于一些兇險的、有可能威脅生命的疾?。ɡ缂毙韵l(fā)作、細菌性腦膜炎等),算法也同樣表現(xiàn)出了強大的診斷性能。這在臨床應(yīng)用中有非常重要的意義,因為有了AI快速分診的輔助,就可以讓醫(yī)療服務(wù)的有限資源用于最需要幫助的患者。
▲AI診斷系統(tǒng)的分診層級(圖片來源:參考資料[1])
最后,要真正檢驗AI的實力,當(dāng)然要讓AI來和富有經(jīng)驗的人類醫(yī)生比試一番了。研究人員拿出近12000份兒科患者的病歷記錄,并把20位“參賽”兒科醫(yī)生按年資和臨床經(jīng)驗高低分成5組,看看AI的成績和哪一組醫(yī)生接近。結(jié)果顯示,AI模型的平均得分高于兩組低年資醫(yī)生,接近三組高年資醫(yī)生。從這個結(jié)果來看,AI模型或許可以為年輕醫(yī)生做診治判斷時助他們一臂之力了。
“我們的工作借助AI復(fù)制優(yōu)質(zhì)兒科醫(yī)療智力資源,增加優(yōu)質(zhì)兒科醫(yī)療資源供給,通過輔助賦能,提升兒科醫(yī)療行業(yè)效率和體驗,并有望通過遠程醫(yī)療和互聯(lián)網(wǎng)醫(yī)療形成更大范圍的示范推廣,從而為基層兒科醫(yī)生和年輕兒科醫(yī)生提供輔助診療服務(wù),為患兒家長提供智能自診服務(wù)和權(quán)威的第二診療意見,避免誤診、漏診造成的醫(yī)療風(fēng)險。” 夏慧敏教授說。
“我們的工作為不久的將來提供一種準(zhǔn)確快速廉價的兒科AI醫(yī)生系統(tǒng)打下了堅實的基礎(chǔ)?!?張康教授補充說。
我們再次祝賀夏慧敏教授和張康教授的研究團隊,也期待人工智能的實施可以在不久的未來為廣大患者提供準(zhǔn)確高效的診斷,徹底改變看病難看病貴的現(xiàn)象。