Great Info

Google 用 AI 檢測癌症,準確率 83% 超越人類

為了解決診斷時間有限和診斷結果不一致的問題, Google 研究室正在探索如何讓深度學習在數位病理學領域發揮作用,透過建立自動檢測演算法,在病理學家的工作中提供輔助。

原文作者為 Google 的技術主管 Martin Stumpe 和產品經理 Lily Peng,由 雷鋒網 AI 科技評論編譯,INSIDE 獲授權轉載。

為了解決診斷時間有限和診斷結果不一致的問題, Google 研究室正在探索如何讓深度學習在數位病理學領域發揮作用,透過建立自動檢測演算法,在病理學家的工作中提供輔助。

在檢查患者的生物組織樣品後, 病理學家的報告通常是許多疾病的黃金診斷標準。特別是對於癌症,病理學家的診斷對患者的治療具有深遠的影響。病理切片審查是一個非常複雜的任務,需要多年的培訓才能做好,豐富的專業知識和經驗也是必不可少的。

儘管都經過培訓,但不同病理學家對同一患者給出的診斷結果,可能存在實質性的差異,而這可能導致誤診。例如,在某些類型的乳腺癌診斷中,診斷結論一致性竟低至 48%,前列腺癌診斷的一致性也同樣很低。診斷缺乏一致性低並不少見,因為如果想做出準確的診斷,必須檢查大量的資訊。病理學家通常只負責審查一張切片上所有可見的生物組織。然而,每個患者可能有許多病理切片,假設以 40 倍的放大倍數進行數位化切片圖像,每個患者的圖像數據都超過 10 億個像素。想像一下,要遍歷 1 張 1 千萬像素的照片,並且必須對每個像素的判斷結果負責。不用說了,這裡有太多的數據需要檢查,而時間往往是有限的。

為了解決診斷時間有限和診斷結果不一致的問題,我們正在研究如何讓深度學習數位病理學領域發揮作用,透過建立一種自動檢測演算法,在病理學家的工作流程中提供輔助工具。 Google 研究室使用由 Radboud 大學醫學中心提供的圖像數據來訓練診斷演算法,這些圖片也在 2016 ISBI Camelyon Challenge 中使用,目前該演算法已被優化,用於定位出乳腺癌向乳房相鄰的淋巴結擴散。

在乳腺癌擴散定位任務中,使用現成的標準深度學習方法如 Inception(也稱為 GoogLeNet),表現也是相當不錯,雖然生成的腫瘤機率預測圖還是存在噪點。我們對這個訓練網路做了強化,包括用不同的放大倍數的圖片來訓練模型(非常像病理學家所做的),從訓練結果來看,我們有可能訓練出一個系統,它的能力可以相當於一個病理學家,甚至有可能超過病理學家的表現,並且它擁有無限的時間來檢查病理切片。

▲圖 1 左圖是來自兩個淋巴結活檢的圖像,中圖是早期深度學習演算法檢測腫瘤的結果,右圖是目前的成果,注意第二個版本的可見雜訊(潛在誤判)已降低。Photo credit: Google Reserch。

事實上,由該演算法產生的預測圖已經改善了很多,該演算法的定位得分(FROC)達到 89%,明顯超過沒有限時的病理學家表現,他們的得分僅為 73%。我們不是唯一一組認為這種方法是有希望的,其他組別的演算法模型在同一數據集中獲得了高達 81%的分數。對我們來說更令人興奮的是,我們的模型穩定性非常強,從不同的醫院使用不同的掃描儀獲得的圖像都可以識別。相關的詳細資訊,請參閱 Google 研究室的相關文章「在千兆像素病理圖像上檢測癌症轉移」。

▲圖 2 淋巴結活檢的特寫鏡頭。組織包含乳腺癌轉移以及巨噬細胞,其看起來與腫瘤相似,但是是良性正常組織。Google 的演算法成功識別腫瘤區域(亮綠色),不會被巨噬細胞干擾。Photo credit: Google Research。

雖然這些結果看來振奮人心,但有幾個重要的注意事項需要考慮:

  • ·像大多數指標一樣,本地化的 FROC 分數並不是完美的。在這裡,FROC 分數定義是預設帶有少量假陽性的靈敏度,假陽性是指將正常組織錯判為腫瘤,靈敏度則是每個載玻片所檢測到腫瘤的百分比。但病理學家很少做假陽性的誤判,例如上述 73%的得分對應於 73%的靈敏度和零假陽性。相比之下,假設允許更多的假陽性個數,我們的演算法的靈敏度可以提升。如果每個載玻片允許有 8 個假陽性,我們的演算法的靈敏度可達到 92%。

  • 這些演算法在執行訓練過的任務時表現良好,但相比人類病理學家,還是缺少豐富的知識和經驗。人類病理學家可以檢測出模型還沒有訓練的異常分類,例如炎症過程、自身免疫疾病或其他類型的癌症。

  •  為了確保患者得到最佳的臨床結果,這些演算法需要成為病理學家的輔助工具,融入到他們的工作流程中。我們設想我們的演算法可以提高病理學家的診斷效率和診斷結果的一致性。例如,病理學家可以透過重點檢查最可能的腫瘤預測區域,以及每個載玻片多達 8 個假陽性區域,來降低其假陰性率,假陰性是指未檢出腫瘤的百分比。另外,這些演算法可以讓病理學家準確地測量腫瘤大小,這與腫瘤預測的結果相關。

訓練模型只是將有趣的研究轉化為真實產品的第一步。 從臨床驗證到監管批准,還有很多困難需要克服。但我們已經起了一個非常有希望的開頭,我們希望透過分享我們的工作,能夠加快這個領域的進步。

全文連結: https://www.inside.com.tw/article/8709-assisting-pathologists-in-detecting-cancer-with-deep-learning

Google 用 AI 檢測癌症,準確率 83% 超越人類
Scroll to top