吳恩達(dá)團(tuán)隊(duì)可能沒想到突然被diss。
他們最近發(fā)布了全球最大的醫(yī)學(xué)影像數(shù)據(jù)集MURA,還用這個(gè)數(shù)據(jù)集訓(xùn)練了一個(gè)169層的深度卷積神經(jīng)網(wǎng)絡(luò)模型。
發(fā)布數(shù)據(jù)集的同時(shí),順帶也披露出這個(gè)AI模型識(shí)別肌肉骨骼病變的能力,比放射科醫(yī)師還是……差了那么一點(diǎn)點(diǎn)。
結(jié)果這件事,成為了導(dǎo)火索。
計(jì)算生物學(xué)界的一位戰(zhàn)士,加州理工教授Lior Pachter見到這個(gè)成績后,翻出了吳恩達(dá)幾個(gè)月之前發(fā)布的一條Twitter:
放射科醫(yī)師是不是該擔(dān)心一下自己的工作了?大新聞:我們的AI(ChexNet)現(xiàn)在讀胸腔X光片診斷肺炎的能力已經(jīng)超過放射科醫(yī)師了。
這條搞了個(gè)大新聞的消息緊扣公眾痛點(diǎn),直指放射科醫(yī)師的失業(yè)問題,獲得了1400次轉(zhuǎn)發(fā),2400個(gè)贊。
結(jié)果,反差出來了。
同樣一個(gè)團(tuán)隊(duì),去年發(fā)布ChexNet時(shí),暗示放射科醫(yī)師面臨失業(yè)。
而最近這個(gè)MURA模型的表現(xiàn)意味著:放射科醫(yī)師的工作,似乎又保住了。
學(xué)界爭論
其實(shí)之前ChexNet診斷肺炎“超越放射科醫(yī)師”這個(gè)說法提出時(shí),受到的質(zhì)疑也不少。
例如,Lior一手帶出來的博士,現(xiàn)在斯坦福做博士后的Harold Pimentel,看見吳恩達(dá)的Twitter就立刻就拿出來批判了一番:
放射科醫(yī)師們沒什么可擔(dān)心的;
介紹研究成果的時(shí)候要負(fù)責(zé)任一點(diǎn)。
而跨界放射科醫(yī)師和機(jī)器學(xué)習(xí)研究者的Alexandre Cadrin也說,論文結(jié)論很有意思,但放射科醫(yī)師們“不用擔(dān)心”。
為什么不擔(dān)心?秘密就在ChexNet的結(jié)果里。
Harold后來給出了解釋:
他說,機(jī)器學(xué)習(xí)界研究醫(yī)學(xué)影像問題至少30年了,但識(shí)別的結(jié)果普遍還是不如經(jīng)過專業(yè)訓(xùn)練的人類。吳恩達(dá)Twitter一發(fā),說得好像這個(gè)問題已經(jīng)解決了一樣,可是他們只找了4名放射科醫(yī)師,略微超過了他們的平均成績。
醫(yī)生Eric Topol也在論文結(jié)果中標(biāo)注了這樣兩句話,提醒我們注意:
這個(gè)模型,就和4名放射科醫(yī)師比試了一下,4個(gè)人就能代表所有從業(yè)者了?
還有一名懂機(jī)器學(xué)習(xí)的放射科醫(yī)師Declan O’Regan指出,論文中的數(shù)據(jù)不足以支撐吳恩達(dá)Twitter的結(jié)論,沒有曲線下面積(AUC)的統(tǒng)計(jì)對比,沒有未選病例的外部盲測,沒有細(xì)節(jié),沒有正常病例的比例,對誤分類情況也沒舉出例子。
質(zhì)疑并不少,但是所有人加起來,聲量也不夠大。
生物學(xué)家、醫(yī)生、以及吳恩達(dá)的半個(gè)機(jī)器學(xué)習(xí)同行們對這條Twitter的不滿,很大程度上也是因?yàn)閰嵌鬟_(dá)老師的學(xué)術(shù)地位和影響力。
在Lior看來,吳恩達(dá)作為一名聞名學(xué)界內(nèi)外、有30萬Twitter粉絲的大V,如此聳人聽聞,對同行、對公眾、對整個(gè)科學(xué)家群體來說,都不是什么好事。
對同行來說,傷害顯而易見。知名學(xué)者拿著自己的研究成果大聲吆喝,普通科學(xué)家連一個(gè)小職業(yè)都消滅不了,論文哪還好意思發(fā)表?
對公眾和科學(xué)家群體來說,基本的信任就是這么被消滅的:公眾一次又一次這樣被言過其實(shí)地忽悠,誰還會(huì)相信科學(xué)家?
事情就是這么個(gè)事情。
Lior Pachter其人
Lior Pachter是計(jì)算生物學(xué)、計(jì)算和數(shù)學(xué)科學(xué)教授,目前任教于加州理工大學(xué)。目前其團(tuán)隊(duì)主要研發(fā)基因組學(xué)的計(jì)算和實(shí)驗(yàn)方法,專注于單細(xì)胞測序技術(shù)的發(fā)展及其在RNA生物學(xué)中的應(yīng)用。
這已經(jīng)不是他第一次在網(wǎng)上開炮。
例如四年前,剛剛開通博客不久的Pachter,就連續(xù)發(fā)表三篇熊文,強(qiáng)烈抨擊此前發(fā)表在Nature Biotechnology上的兩篇論文。
他抨擊的對象,一位是知名的復(fù)雜網(wǎng)絡(luò)研究權(quán)威Albert-Laszlo Barabasi,另一位是時(shí)任MIT計(jì)算生物研究組負(fù)責(zé)人的大牛Manolis Kellis。
是非曲直,我們不做深究。但在這一時(shí)間里,Pachter的風(fēng)格同樣一覽無余的展現(xiàn)了出來。當(dāng)時(shí)有報(bào)道這么記述:
“萊爾寫博客的時(shí)間不長,2013年8月開始,也就半年多的時(shí)間。但絕對絕對是博客界的奇葩。萊爾寫博客的風(fēng)格非常鮮明,那就是無論如何上來先噼里啪啦一頓胖揍?!盵1]
以及上面提到的第二個(gè)批評(píng),還是Pachter隱忍多年,找到一處細(xì)節(jié)之后,全力啟動(dòng)的一次爆發(fā)。足見這位教授也是心思縝密、很愛開炮,讓人不由得想起紐約大學(xué)的馬庫斯教授。
與當(dāng)年的洋洋灑灑、雷霆萬鈞相比,他這次對吳恩達(dá)的批評(píng),應(yīng)該算是“三和一少”的態(tài)度了。
而說馬庫斯,馬庫斯就到。
剛剛馬庫斯也出手參與了一下這件事,他又在Twitter上開炮:
“過度炒作可能已經(jīng)成了吳恩達(dá)的習(xí)慣,在影像診斷上,在汽車上,更普遍地說在AI上都是這樣?!?/p>
關(guān)于未來
其實(shí),放狠話的不僅僅是吳恩達(dá)。
此前,聲名煊赫的Geoffrey Hinton曾經(jīng)放言:從現(xiàn)在開始,應(yīng)該停止培訓(xùn)放射科醫(yī)師。他預(yù)言5-10年內(nèi)深度學(xué)習(xí)就將取代這些崗位。
作為一個(gè)克制的英國人,Hinton對深度學(xué)習(xí)能帶來的醫(yī)療革命充滿熱情?!拔铱催^太多的醫(yī)生低效的使用數(shù)據(jù),病患的歷時(shí)信息被大量忽略;我看到醫(yī)生們無法很好地閱讀CT掃描,兩個(gè)醫(yī)生對同一個(gè)掃描片能得出不同的解讀”。
在三次不同的場合,醫(yī)生基于CT掃描說他妻子有繼發(fā)性腫瘤,但每次都是誤診。Hinton相信AI會(huì)最終讓放射科醫(yī)師失業(yè)。
值得注意的是,前不久吳恩達(dá)的老師Michael I.Jordan發(fā)表了一篇博客,題為《人工智能:革命遠(yuǎn)未到來》。
在這篇文章里,Jordan同樣回憶自己14年前的往事,但暗示機(jī)器應(yīng)用于醫(yī)療系統(tǒng)之后,數(shù)據(jù)誤差等原因使得“唐氏綜合癥的診斷就不斷上升”,“導(dǎo)致了一些嬰兒不必要的死亡”。
從這一個(gè)案例出發(fā),Jordan拋出一個(gè)觀點(diǎn):AI正在暴露出嚴(yán)重的缺陷,大家過于依賴數(shù)據(jù),深度學(xué)習(xí)不是AI的全部。并且建議關(guān)注更多推理、因果關(guān)系等方面的進(jìn)展。
未來,爭論可能仍會(huì)不停上演。好在所有人的目標(biāo)都是一致的,那就是如何更好的造福人類社會(huì)。