一直以來,我國醫(yī)療都存在醫(yī)生培養(yǎng)周期長,誤診率高,優(yōu)質(zhì)醫(yī)療資源供配不均等痛點(diǎn),這使得看病難、看病貴已成不易根治的“頑疾”。而近兩年來,隨著人工智能走進(jìn)醫(yī)療領(lǐng)域,醫(yī)療成了AI落地的又一萬億級(jí)場景,成為眾多企業(yè)競相涌入的風(fēng)口,然而AI的賦能真的能有效地消除這些“頑疾”嗎?AI+醫(yī)療的痛點(diǎn)又在哪里呢?
五年前,IBM Watson高調(diào)進(jìn)軍醫(yī)療領(lǐng)域,并于2015年實(shí)現(xiàn)Watson系統(tǒng)的商用,為醫(yī)院提供癌癥的輔助診療服務(wù),成為全球AI醫(yī)療行業(yè)的領(lǐng)導(dǎo)者。然而近幾年,IBM Watson的發(fā)展并不如預(yù)期那般順利,2017年2月,休斯敦安德森癌癥研究中心(MD Anderson Cancer Center)終止了與IBM Watson的合作,稱其輔助診療效果始終達(dá)不到預(yù)期。2018年5月24日,IBM Watson又傳出對(duì)醫(yī)療部門大幅度裁員的消息,其背后暴露的問題不禁令人反思。
數(shù)據(jù)是AI醫(yī)療發(fā)展一大瓶頸
實(shí)際上,當(dāng)人工智能打破了算法算力的技術(shù)壁壘之后,也愈發(fā)凸顯其對(duì)數(shù)據(jù)的依賴性,而Watson系統(tǒng)在醫(yī)療診斷時(shí)頻頻出錯(cuò)的根本原因之一正是數(shù)據(jù)問題。雖然X光掃描識(shí)別惡性腫瘤并不算太難,但要制定出某種癌癥的治療方案是一件很復(fù)雜的事情,影像診斷需要經(jīng)過大量專業(yè)醫(yī)師標(biāo)注的數(shù)據(jù)進(jìn)行模型訓(xùn)練才行。但根據(jù)IBM的內(nèi)部文件,Watson使用的訓(xùn)練數(shù)據(jù)并不豐富,例如,訓(xùn)練肺癌治療方案的數(shù)據(jù)僅有635例,況且這些數(shù)據(jù)并非全部來自真實(shí)患者,有些是來自合成的案例或假設(shè)的患者。
此外,北美對(duì)醫(yī)療數(shù)據(jù)有嚴(yán)格的隱私保護(hù)機(jī)制,并且每種疾病所需要的數(shù)據(jù)都不同,數(shù)據(jù)碎片化問題嚴(yán)重,這些因素便導(dǎo)致了數(shù)據(jù)獲取途徑困難且成本高昂。醫(yī)療數(shù)據(jù)成為了影像診斷行業(yè)發(fā)展的瓶頸。
而在我國,數(shù)據(jù)歸醫(yī)療機(jī)構(gòu)和患者所共有,并且在2017年的《“十三五”全國人口健康信息化發(fā)展規(guī)劃》中,國家提出了要有序推動(dòng)人口健康信息基礎(chǔ)資源大數(shù)據(jù)的開放和共享的政策方針。在政策支持下,三家醫(yī)療大數(shù)據(jù)公司也開始積極建設(shè)醫(yī)療數(shù)據(jù)庫,這給AI醫(yī)療的發(fā)展提供了很大的技術(shù)和數(shù)據(jù)支持。因此解決數(shù)據(jù)問題,是助推我國AI醫(yī)療實(shí)現(xiàn)彎道超車的關(guān)鍵點(diǎn)。
我國醫(yī)療大數(shù)據(jù)在質(zhì)量上也不容樂觀
然而在我國醫(yī)療領(lǐng)域,作為AI醫(yī)療發(fā)展基石的醫(yī)療大數(shù)據(jù)在質(zhì)量上也不容樂觀。
就電子醫(yī)療記錄而言,雖然目前醫(yī)院普及率很高,但其可及性和數(shù)據(jù)質(zhì)量都并非最優(yōu),并且不同醫(yī)院使用的信息系統(tǒng)提供者達(dá)300多家,其數(shù)據(jù)結(jié)構(gòu)和標(biāo)準(zhǔn)都有所差異。
除此之外,由于醫(yī)療資源分配不均衡,我國各地區(qū)醫(yī)生水平參差不齊,醫(yī)療欠發(fā)達(dá)地區(qū)的誤診率遠(yuǎn)超一線城市,從而導(dǎo)致了整體疾病診斷正確率偏差很大。
“就像十年前我們討論用數(shù)據(jù)做知識(shí)研究的時(shí)候,中國面臨一個(gè)最大的問題就是中國的數(shù)據(jù)質(zhì)量目前是不太可靠的,不可靠的原因就是疾病診斷不對(duì)。以我們拿到的北京中風(fēng)病人數(shù)據(jù)為例,北京能夠收中風(fēng)病人的醫(yī)院是130家,大概每年住院病人14萬人,診斷正確率是72%,另外的28%診斷都是錯(cuò)的?!?,北京天壇醫(yī)院王擁軍院長在GMIC生命科學(xué)如是說道。
我國醫(yī)療大數(shù)據(jù)之所以質(zhì)量低下,一方面是因?yàn)楦哒`診率,另一方面則是因?yàn)槿狈?biāo)準(zhǔn)化的臨床術(shù)語語義體系。雖然自2002年我國已采用了國際疾病編碼和國際手術(shù)編碼,但單憑這兩大術(shù)語并不能覆蓋醫(yī)療記錄中所有臨床信息,并且目前應(yīng)用較為廣泛的醫(yī)學(xué)系統(tǒng)命名法在我國并不使用。因此只有做好醫(yī)學(xué)術(shù)語管理,才能挖掘出醫(yī)療大數(shù)據(jù)背后的真正含義。
除此之外,醫(yī)療大數(shù)據(jù)的隱私問題也不容忽視,但目前我國并無相關(guān)具體法律或指引,在不影響數(shù)據(jù)完整性的基礎(chǔ)上出臺(tái)隱私保護(hù)規(guī)則也很必要。
醫(yī)療大數(shù)據(jù)對(duì)人工智能在醫(yī)療領(lǐng)域的發(fā)展至關(guān)重要,在提高診斷準(zhǔn)確性和優(yōu)化臨床決策等方面發(fā)揮著巨大作用,我國AI醫(yī)療行業(yè)要想取得實(shí)質(zhì)性發(fā)展,進(jìn)一步完善數(shù)據(jù)系統(tǒng),發(fā)展大數(shù)據(jù)收集、儲(chǔ)存、整合、管理和應(yīng)用等各種新技術(shù)是關(guān)鍵一步。