最新研究指出,人工智能(AI)工可以提高放科醫生對診斷的自信,但不能完全依賴它們來識別部X片上的常見肺部疾病。據于9月25日發表在《放學》雜志上的研究結果顯示,研究人員將72名放科醫生與四種商業人工智能工進行比較,分析了超過2000張X片。人類專家贏得了比賽。

該研究的首席研究員、丹麥哥本哈Herlev和Gentofte醫院放科的居民放科醫生和博士后研究員路易斯·普萊斯納博士表示:“部X線檢查是一種常見的診斷工,但要正確解讀檢查結果需要經過大量的培訓和經驗。”他在一份期刊新聞發布中補充道:“雖然人工智能工在放科部門的使用逐漸得到批準,但有一個未滿足的需求,即在真實臨床場景中進一步測試它們。”

普萊斯納博士表示,商業可用且經FDA批準的AI工可以輔助放科醫生的診斷。在這項研究中,來自丹麥四所醫院的X照片已經持續拍攝了兩年時間。其中約三分之一的病人至有一個目標診斷。研究回顧了三種常見的發現結果:肺泡疾病(由肺炎或肺水腫引起的部X線圖案)、氣(或肺部塌陷)以及腔積(肺部周圍水分的積聚)。

研究發現,AI工對于肺泡疾病的敏率為72%至91%,對于氣的敏率為63%至90%,對于腔積的敏率為62%至95%。高敏意味著更的疾病案例被忽略。然而,與放科醫生相比,AI工產生的虛假結果更多,而且在存在多個發現和更小的目標時,它們的能會下降。

以氣為例,與放科醫生相比,AI系統篩查結果呈的患者實際上患有該疾病的概率在56%到86%之間,而放科醫生的概率為96%。普萊斯納博士說:“AI在識別空氣疾病方面表現最差,預測值在40%至50%之間。在這個病困難且年齡較大的患者樣本中,AI在10次中會有5到6次預測存在空氣疾病,而實際上并不存在。在這樣的況下,不能讓AI系統獨自工作。”

科醫生的目標是在發現和排除疾病兩方面保持平衡,避免重大疾病被忽視和過度診斷。普萊斯納博士指出:“AI系統似乎非常擅長發現疾病,但在復雜的部X線圖像上,它們在識別無疾病的況下并不如放科醫生那麼準確。過多的誤報診斷會導致不必要的像檢查、輻本增加。”

此前的研究聲稱人工智能勝過放科醫生,但那些研究只是在沒有看到患者的臨床病史和以往影像研究的況下進行圖像審查。普萊斯納博士解釋道:“在日常工作中,放科醫生對影像檢查的解讀是綜合了這三個數據點的。”

總而言之,這項研究發現,雖然人工智能工可以幫助放科醫生解讀部X線,但在實際診斷準確方面仍然存在限制。進一步的測試和研究是必要的,以確保人工智能在臨床場景中的可靠和準確