對于中國這樣一個人口大國來說,醫(yī)學影像的市場潛力可謂十分巨大。據(jù)統(tǒng)計,截至目前中國醫(yī)學影像的檢查總數(shù)已經(jīng)超過了75億,而且隨著設備越來越復雜、信息量越來越大,以及圖像從二維走向三維、靜態(tài)邁向動態(tài),數(shù)據(jù)量每年也在呈現(xiàn)飛速增長的態(tài)勢。不過,從中美兩國的醫(yī)學影像數(shù)據(jù)年增長率來看,中國以30%的增長率落后于美國的63%,而放射科的專業(yè)人才年增長率更少,目前為止整個中國的影像科和病理科人才加在一起也僅8萬左右。這種海量圖像數(shù)據(jù)帶來的挑戰(zhàn),加之專業(yè)醫(yī)療人才的稀缺,使得本土AI醫(yī)療影像檢查/篩查的需求日益迫切。
AI究竟能何種程度上提升檢查/篩查效率?典型比如我們做的X射線胸片的篩選,從大概12萬的病例做檢查,覆蓋了肺部常見的9種疾病,其中挑選了4種典型的疾病,相當于是胸片的預篩。我們可以通過AI的方法把徹底沒有病的這部分快速篩出來,將健康的部分篩出去,可以大大降低醫(yī)生的負擔,從不同的疾病把醫(yī)生的工作量從76%降低到35.9%,同時它的漏診率也達到了一個相當?shù)偷乃健?/p>
而從實際應用來看,放射治療的前期一般都要做相應的靶區(qū)規(guī)劃以及靶區(qū)的分割,就是將靶區(qū)給勾畫出來。如果按照傳統(tǒng)的辦法,十分費時費力,但采用深度學習的方法,我們就可以將分割時間縮短到傳統(tǒng)分割方法的5%,同時分割的成功率從90.1%提高到97.8%,這是目前我們對外售賣的產(chǎn)品上已經(jīng)能夠達到的實際效果。
盡管“AI+”的效果如此明顯,但缺乏統(tǒng)一標準的應用再好也難成大器,這也成為困頓本土AI醫(yī)療影像技術邁出市場化關鍵一步的最大障礙。尤其是對醫(yī)療這一特殊而復雜的行業(yè)來說,不同病人的病理指征通常不同,而且可能針對同一種疾病,各醫(yī)生給出的意見也各有差別。這種變幻莫測的復雜狀況,也極大提升了當前醫(yī)療影像技術與AI結(jié)合的難度。
標準之后,要深入解決AI醫(yī)療影像技術的落地難題,還需要更多的去挖掘高質(zhì)量的基礎數(shù)據(jù)??v然,中國借助于如此龐大的人口優(yōu)勢,多年來已經(jīng)獲得了海量的醫(yī)學影像數(shù)據(jù),但實際上這些基礎數(shù)據(jù)中真正能夠為AI所高效利用的部分并不多,大樣本和高質(zhì)量的數(shù)據(jù)獲取依然是本土AI醫(yī)療影像技術的缺憾,這會造成診斷精確度低、投入高回報差甚至信任缺失等嚴重問題。也正是因為這些精準高質(zhì)量數(shù)據(jù)難以獲得,吸引了一大波AI創(chuàng)業(yè)公司蜂擁而入醫(yī)療影像市場淘金。
事實上,普通的醫(yī)療影像數(shù)據(jù)可以說遍地都是,但醫(yī)學上很多疾病數(shù)據(jù)實際上是很少的。某業(yè)內(nèi)資深人士表示,“一家醫(yī)療單位可能僅有一兩百病例符合標準,甚至可以說沒有一家醫(yī)院敢說自己擁有幾千例這樣的符合標準的圖像數(shù)據(jù)。
可能一家醫(yī)院有數(shù)萬病例,但基于不同的疾病、檢查方式、研究目的區(qū)分之后,數(shù)據(jù)一下子就會變得很少。醫(yī)療數(shù)據(jù)不像購物那么簡單,醫(yī)療數(shù)據(jù)很多是不確定的,很難打通,這種情況下,具備完整信息的病人資料就尤其寶貴。拿肺癌或其他腫瘤來說,在大醫(yī)院,滿足要求的可能只有10%-20%,這已經(jīng)算不錯的;在二甲等地方醫(yī)院,很多病人做了檢查之后,就去上級醫(yī)院看病去了,有完整資料的病人可能只有1%-2%?!?/p>
正是因為缺乏有效數(shù)據(jù)的訓練,使得如今的醫(yī)療機構利用AI來做醫(yī)療影像篩查頗具成本壓力。向軍表示:“現(xiàn)在,能看的病不多是AI面臨的一個很大的問題。比如一個放射科醫(yī)生能看100種病,可能AI現(xiàn)在在其中7種、8種病上已經(jīng)比醫(yī)生看得更出色,但是還有剩下的92、93種病它其實是無能為力的。所以,真正要達到解決問題,徹底降低醫(yī)生的負擔,減少對醫(yī)生的數(shù)量需求,應該說現(xiàn)在還遠遠沒有到這個時候?!?/p>
這也就會出現(xiàn)醫(yī)療機構還得專門雇一個專業(yè)醫(yī)生,并攤付額外的成本的現(xiàn)狀。此時,究竟AI對于醫(yī)療機構到底是負擔還是幫襯,值得商榷,向軍進一步補充到:“所以現(xiàn)在很多AI醫(yī)療影像設備放在醫(yī)院其實是吃虧的,如何將其變成一個剛需是需要考慮的問題。如果全中國的‘AI+醫(yī)療公司’能夠形成聯(lián)盟,大家可以相互分工,各有所長,而不是都做同一件事情,最后形成某種意義上技術共享,達成一個真正意義上的醫(yī)院不需要再雇傭DR醫(yī)生的水平,這就變成剛需了。”
這種有效數(shù)據(jù)的缺乏可以通過做大量數(shù)據(jù)標注的工作來解決。很多醫(yī)療圖像數(shù)據(jù)并不是簡單的零或者一,而是需要做經(jīng)驗的判斷,通過有效標注,很多看似無用的數(shù)據(jù)幾乎也都能夠變成有效數(shù)據(jù),但是,數(shù)據(jù)標注還是現(xiàn)階段一個比較大的問題,因為AI做算法的第一要求就是數(shù)據(jù)標注的得是完全正確的,所以現(xiàn)在各種方式,包括算法如何去解決標錯的問題,以及標注本身,業(yè)內(nèi)都有在進行討論和規(guī)劃。在標注問題上,我們也開了各種各樣的討論會,醫(yī)生之間的觀點比較一致,但醫(yī)生在數(shù)據(jù)標注完之后可能還會有三盲五盲的問題,后期我們也還需要再把相對一致性的東西挑出來,以及繼續(xù)深入去討論和解決。