123,123,123

新冠肺炎“识别”战，AI算法落地有多难？

日期： 2020-02-23

來源：搜狐科技

關(guān)鍵詞： 新冠肺炎识别 AI算法

　　作者 | 蔣寶尚

　　編輯 | 賈偉

　　人工智能從來沒有像現(xiàn)在這么重要過！

　　這段時(shí)間的疫情猛烈，AI每一次在醫(yī)療領(lǐng)域的落地都在幫助白衣天使拯救生命。從疫情預(yù)測(cè)到檢測(cè)體溫再到藥物開發(fā)，人工智能爭(zhēng)分奪秒，蓄勢(shì)待發(fā)。

　　更為準(zhǔn)確的說是醫(yī)療AI公司們站了出來，為醫(yī)護(hù)人員鑄造了一面堅(jiān)強(qiáng)的后盾。

　　1月28日，依圖醫(yī)療的第一版新冠肺炎產(chǎn)品在上海公衛(wèi)上線，2月5日在武漢的協(xié)和醫(yī)院、中南醫(yī)院、武漢大學(xué)人民醫(yī)院以及荊州市第一人民醫(yī)院完成部署。

　　1月31日，推想科技宣布推出針對(duì)新冠肺炎篩查產(chǎn)品。

　　2月15日，阿里巴巴宣布：達(dá)摩院聯(lián)合阿里云針對(duì)新冠肺炎臨床診斷研發(fā)了一套全新AI診斷技術(shù)，AI可以在20秒內(nèi)準(zhǔn)確地對(duì)新冠疑似案例CT影像做出判讀，分析結(jié)果準(zhǔn)確率達(dá)到96%。

　　.... ...

　　相對(duì)于巡邏機(jī)器人的檢測(cè)體溫，CT影像的自動(dòng)檢測(cè)才能代表AI在醫(yī)療領(lǐng)域的最高水準(zhǔn)，但也更難大規(guī)模應(yīng)用，這里面不僅包含算法難關(guān)，更存在著不斷迭代的需求。

　　但此技術(shù)又不得不加緊落地！因?yàn)樵?月5日，國家衛(wèi)健委發(fā)文表示：在湖北省內(nèi)，CT影像結(jié)果要作為新型冠狀病毒感染“臨床診斷病例”的判定依據(jù)。

　　那么AI技術(shù)在從算法到應(yīng)用層面有哪些難點(diǎn)呢？

　　具體算法，遍地開花

　　在2017年春節(jié)期間，斯坦福大學(xué)工程學(xué)院和醫(yī)學(xué)院合作團(tuán)隊(duì)在《自然》上發(fā)布了在皮膚癌診斷領(lǐng)域的最新突破。他們?cè)诠雀栌糜?a class="innerlink" href="http://ihrv.cn/tags/識(shí)別" target="_blank">識(shí)別貓和狗算法的基礎(chǔ)上，經(jīng)過13萬張皮膚病變的圖像訓(xùn)練后，開發(fā)出了可用于識(shí)別皮膚癌的AI系統(tǒng)。

　　吳恩達(dá)教授也在2017年發(fā)表相關(guān)研究，其使用CheXNet算法訓(xùn)練的模型可以診斷14種病癥，尤其在肺炎診斷方面，比放射科專家單獨(dú)診斷的準(zhǔn)確率更高。

　　2018年Google的Gulshan團(tuán)隊(duì)采用近13萬張已由54位美國專家標(biāo)注過的視網(wǎng)膜眼底圖像，對(duì)深度學(xué)習(xí)網(wǎng)絡(luò)進(jìn)行訓(xùn)練，檢測(cè)準(zhǔn)確率達(dá)到曲線下面積91%。

　　同年，國家千人計(jì)劃“入選者張康教授率領(lǐng)中國研究團(tuán)隊(duì)在頂級(jí)期刊《細(xì)胞》上發(fā)表了一篇AI在醫(yī)療領(lǐng)域應(yīng)用，即基于深度學(xué)習(xí)開發(fā)出一個(gè)能診斷眼病和肺炎兩大類疾病的AI系統(tǒng)，就準(zhǔn)確性來說能夠匹敵頂尖醫(yī)生。

　　值得一提的是，張康教授的那項(xiàng)研究也是世界范圍內(nèi)首次使用龐大的標(biāo)注好的高質(zhì)量數(shù)據(jù)進(jìn)行遷移學(xué)習(xí)。

　　遷移學(xué)習(xí)可以解決訓(xùn)練數(shù)據(jù)不足的局限。

　　那么這么多突破性的研究，這么多表現(xiàn)良好的算法模型為什么卻在實(shí)際應(yīng)用效果不佳呢。

　　首先在胸片上發(fā)現(xiàn)肺炎非常困難，即使對(duì)放射科醫(yī)師來說，他們眼中的胸透圖像的肺炎特征也是模糊的，容易和許多其他的良性異常相混淆。

　　也就是說人工智能系統(tǒng)對(duì)肺部CT影像的片狀陰影不夠敏感，而片狀陰影是新型冠狀病毒肺炎的主要病灶。

　　而要想要鑒別新冠肺炎影像與普通病毒性肺炎影像也并不容易，臨床上影像科的醫(yī)生有自己的判別標(biāo)準(zhǔn)，擁有這個(gè)標(biāo)準(zhǔn)的開發(fā)人員會(huì)嘗試不同的方法提升自己的模型，但是一些算法的訓(xùn)練研究員并不具有放射科的背景，另外這個(gè)標(biāo)準(zhǔn)也并不是容易量化。

　　對(duì)于訓(xùn)練數(shù)據(jù)來說，數(shù)據(jù)量的多少不是關(guān)鍵，關(guān)鍵的是有代表性的以及疑難的數(shù)據(jù)有多少，一個(gè)基于學(xué)習(xí)而不是規(guī)則的算法本身需要大量的類似數(shù)據(jù)才能學(xué)習(xí)到正確的知識(shí)。在AI在檢測(cè)新冠狀肺炎肺炎的時(shí)候，由于缺少“疑難雜癥”樣本數(shù)據(jù)，即使識(shí)別了99%的病人，但是可能真正有威脅的是那沒有識(shí)別出了1%。

　　目前深度學(xué)習(xí)訓(xùn)練過程中所采用的解釋性的方法基本都是可視化方法，看哪些部位對(duì)患病概率的貢獻(xiàn)比較大，而這個(gè)概率只根據(jù)CT影像獲得的。但是醫(yī)生在具體判斷時(shí)候，還要結(jié)合病史，遺傳，生活習(xí)慣等等做出推斷。

　　再有，如果疾病發(fā)生新的變異或變化，那么原來的算法模型還能使用么？

　　考慮到實(shí)際情況，各地的CT設(shè)備并不是非常統(tǒng)一，也就是說對(duì)原算法模型的驗(yàn)證效果很難都達(dá)標(biāo)，甚至可能非常低。即使在原模型基礎(chǔ)上進(jìn)行微調(diào)，也可能需要某個(gè)型號(hào)的CT設(shè)備提供的非常多的數(shù)據(jù)。各地的檢測(cè)環(huán)境也不是非常統(tǒng)一，最差的情況可能會(huì)需要對(duì)每一臺(tái)機(jī)器進(jìn)行微調(diào)來保證準(zhǔn)確率，但這樣特殊的數(shù)據(jù)真的很好采集嗎？

　　參考來源：

　　https://www.zhihu.com/question/372335557

　　https://mp.weixin.qq.com/s/Q0H0s1aL8V06p7o2rlf2MQ

版權(quán)聲明：本站內(nèi)容除特別聲明的原創(chuàng)文章之外，轉(zhuǎn)載內(nèi)容只為傳遞更多信息，并不代表本網(wǎng)站贊同其觀點(diǎn)。轉(zhuǎn)載的所有的文章、圖片、音/視頻文件等資料的版權(quán)歸版權(quán)所有權(quán)人所有。本站采用的非本站原創(chuàng)文章及圖片等內(nèi)容無法一一聯(lián)系確認(rèn)版權(quán)者。如涉及作品內(nèi)容、版權(quán)和其它問題，請(qǐng)及時(shí)通過電子郵件或電話通知我們，以便迅速采取適當(dāng)措施，避免給雙方造成不必要的經(jīng)濟(jì)損失。聯(lián)系電話：010-82306118；郵箱：aet@chinaaet.com。

新冠肺炎“识别”战，AI算法落地有多难？

日期： 2020-02-23

來源：搜狐科技

相關(guān)內(nèi)容