智慧醫(yī)院需要持續(xù)筑牢安全防護墻,但并不意味著要把安全防護墻加高到滴水不進、滴水不出的地步。正如國家衛(wèi)生健康委規(guī)劃發(fā)展和信息司毛群安司長所說,未來醫(yī)院的邊界會越來越模糊、協(xié)作更加頻繁,傳統(tǒng)的醫(yī)療業(yè)務(wù)流程可能嵌入若干大數(shù)據(jù)、智能應(yīng)用,實現(xiàn)醫(yī)患互動、臨床協(xié)作、醫(yī)教研的互動。
同樣,為增進與衛(wèi)生健康部門、公立醫(yī)院的互信,醫(yī)療大數(shù)據(jù)、人工智能行業(yè)需要擺脫對醫(yī)院大數(shù)據(jù)一味的渴求和索取,從注重數(shù)據(jù)數(shù)量,向注重數(shù)據(jù)質(zhì)量和數(shù)據(jù)績效轉(zhuǎn)變。針對公民個人數(shù)據(jù)采集,被稱為“歐盟數(shù)據(jù)憲章”的《一般數(shù)據(jù)保護條例》(GDPR)提出了“最小可用原則”,即:個人數(shù)據(jù)的處理應(yīng)當是為了實現(xiàn)數(shù)據(jù)處理目的而適當?shù)?、相關(guān)的和必要的。因此,數(shù)據(jù)開發(fā)方、數(shù)據(jù)使用方應(yīng)當確保數(shù)據(jù)濫用,或者被低效利用。
為保護患者個人的數(shù)據(jù)隱私,經(jīng)過清洗后,被用于二次開發(fā)的患者數(shù)據(jù)集中,患者個人信息既不可被識別,也不可被逆轉(zhuǎn)(即逆向破解,將脫敏數(shù)據(jù)還原為原始數(shù)據(jù))。盡管主流醫(yī)療大數(shù)據(jù)、人工智能企業(yè)普遍擁有成熟的數(shù)據(jù)脫敏技術(shù),但隨著數(shù)據(jù)量累計、數(shù)據(jù)交叉比對持續(xù)、新型算法模型被研發(fā),脫敏數(shù)據(jù)被逆向破解的風險將持續(xù)加大。因此,“最小可用”原則是保護患者數(shù)據(jù)隱私的最后一道防線。
隨著技術(shù)革新,傳統(tǒng)深度學習也許將不再過度依賴數(shù)據(jù)量進行算法訓練。作為新型神經(jīng)網(wǎng)絡(luò)的一個分支,生成對抗網(wǎng)絡(luò)(GAN)通過分離出生成網(wǎng)絡(luò)、鑒別網(wǎng)絡(luò),猶如一個警察和假鈔販子之間的對抗,警察對假鈔的鑒別能力不斷提高,假鈔販子“以假亂真”能力也不斷提高,最終機器對醫(yī)學影像的判斷準確性將趨于甚至超過人類。更重要的是,生成對抗網(wǎng)絡(luò)僅需要少量影像數(shù)據(jù)進行算法訓練,且無需人工參與標注,從而符合“最小可用”原則。
國家衛(wèi)生健康委統(tǒng)計信息中心張學高主任在2019CHIMA大會開幕式上表示,當前,我國醫(yī)院信息化在數(shù)據(jù)層面面臨以下問題:一是數(shù)據(jù)質(zhì)量普遍不高,缺乏數(shù)據(jù)質(zhì)量的保障機制;二是對已有標準的應(yīng)用和執(zhí)行滯后;三是術(shù)語類標準、新技術(shù)類標準、安全類標準不健全。
無論是在信息化時代、互聯(lián)網(wǎng)時代、大數(shù)據(jù)時代還是人工智能時代,數(shù)據(jù)質(zhì)量始終是靈魂。對于醫(yī)院信息系統(tǒng)(HIS)、云平臺、AI算法這些數(shù)據(jù)“吞吐大戶”,我們既不能讓它們因“上頓不接下頓”而“營養(yǎng)不良”,也不能喂食“過期變質(zhì)食品”而導致其“食品中毒”,甚至對整個“食品工業(yè)”喪失信心并引發(fā)行業(yè)地震。
公立醫(yī)院是醫(yī)療衛(wèi)生服務(wù)主戰(zhàn)場,也是數(shù)據(jù)治理的源頭?!八础币坏┍粐乐匚廴?,公共平臺歸集數(shù)據(jù)后再進行治理,往往回天乏力。新近出版的《醫(yī)院數(shù)據(jù)治理:框架、技術(shù)與實現(xiàn)》一書,標志著統(tǒng)計信息中心首次提出醫(yī)院數(shù)據(jù)治理的理念,梳理了醫(yī)院數(shù)據(jù)治理的實施重點和路徑,結(jié)合國家級平臺建設(shè)項目實施等相關(guān)實踐,應(yīng)對服務(wù)創(chuàng)新、數(shù)據(jù)質(zhì)量、開放共享、安全合規(guī)等方面存在挑戰(zhàn)。該書和筆者的一線調(diào)研呈現(xiàn)出若干迫切問題:
?。?)數(shù)據(jù)治理重數(shù)量輕質(zhì)量:一些地方的全民健康信息化平臺建設(shè)先抓數(shù)據(jù)匯集,再把好質(zhì)量關(guān),缺乏數(shù)據(jù)上傳審查機制、數(shù)據(jù)質(zhì)量預(yù)警機制,未經(jīng)驗證、未經(jīng)處理的健康大數(shù)據(jù)只能是“一般垃圾”甚至是“有害垃圾”;(2)數(shù)據(jù)治理重技術(shù)輕規(guī)制:醫(yī)院數(shù)據(jù)治理僅停留在技術(shù)框架層面,在院內(nèi)尚未成立數(shù)據(jù)治理管理機構(gòu),在院外尚未建立第三方數(shù)據(jù)治理評估體系;(3)數(shù)據(jù)治理重工程輕績效:把數(shù)據(jù)治理狹隘、靜態(tài)地理解為工程項目,主管部門數(shù)據(jù)規(guī)則跟不上,承建方運營維護跟不上,醫(yī)療機構(gòu)和社會各界對治理績效的獲得感不強。
在數(shù)據(jù)輸入端,我國尚未對健康大數(shù)據(jù)(尤其是醫(yī)院大數(shù)據(jù))啟動國家立法,“健康醫(yī)療大數(shù)據(jù)”相關(guān)法規(guī)停留在部門規(guī)章層面,且仍處在試行期,且對健康大數(shù)據(jù)的分類、分級、分步共享開放的準則,及其易于操作的流程,尚未作出具體規(guī)定。在算法輸出端,我國對醫(yī)療人工智能的算法模型的著作權(quán)尚未得到法律保障。我國知識產(chǎn)權(quán)的主要判定依據(jù)是《著作權(quán)法實施條例》,該條例的修正案早在2013年3月1日就開始施行,趕不上醫(yī)療人工智能技術(shù)發(fā)展的新趨勢。
綜上所述,立法位階不高、法條不夠明晰、法律約束力不強,導致一些地方、一些醫(yī)院的數(shù)據(jù)治理規(guī)則出現(xiàn)較大隨意性,容易出現(xiàn)因時而異(如:人工智能進入某個“風口期”)、因事而異(如:醫(yī)院自發(fā)提出科研合作需求)、因人而異(如:持開放態(tài)度的衛(wèi)健委領(lǐng)導、醫(yī)院領(lǐng)導、信息辦主任)。制度剛性缺失,給醫(yī)療人工智能企業(yè)的數(shù)據(jù)可用性、低成本帶來巨大挑戰(zhàn),也導致算法模型無法根據(jù)“額頭出汗原則”的著作權(quán)原則歸研發(fā)團隊所有,無法對醫(yī)療人工智能研發(fā)提供穩(wěn)定盈利預(yù)期、研發(fā)激勵機制。