「YOLO 之父」Joseph Redmon 宣布退出計算機視覺領(lǐng)域了!這個剛剛出現(xiàn)的消息著實讓人工智能界感到驚訝。
在社交網(wǎng)絡(luò)上,這位 YOLO、XNOR-Net 等知名 AI 算法的發(fā)明者昨天突然聲明:出于道德上的考慮,他決定停止一切有關(guān)計算機視覺的研究。 在 AI 領(lǐng)域,這還是第一次。
推文鏈接:https://twitter.com/jeremyphoward/status/1230610470991589376
在有關(guān)「不應(yīng)該發(fā)表的重要研究」的長篇討論中,Redmon 現(xiàn)身發(fā)表了自己的看法:「我現(xiàn)在已經(jīng)停止了計算機視覺研究,因為我看到了自己工作造成的影響。我熱愛自己的作品,但我已經(jīng)無法忽視它在軍事領(lǐng)域的應(yīng)用以及給個人隱私帶來的風(fēng)險?!?他還表示,一些學(xué)者的想法是錯誤的,他們認為,「我們不必考慮新研究的社會影響,因為這很困難,而且其他人也會幫我們做?!?「盡管在大學(xué)階段我們一直被灌輸科學(xué)研究是中立的,無論其內(nèi)容如何。但如果我們認真考慮廣泛的影響,則基本所有面部識別工作都不應(yīng)被發(fā)表:它們幾乎不會帶來好處,盡是負面風(fēng)險?!?為什么突然有了這樣一番話?一切討論似乎都是由最近人工智能頂會 NeurIPS 2020引發(fā)的。 在今年正在進行的大會論文提交過程中,除了提前截稿、提前拒稿,讓論文作者當(dāng)審稿人等一系列新操作之外,還有一條就是必須提交「廣泛影響聲明」:
在 NeurIPS 2020大會官網(wǎng)論文提交指南中,論文評審重大變化的第五條。 NeurIPS 2020候選論文的作者被要求在他們提交論文的文件中加入新的討論部分,闡述其新工作可能產(chǎn)生的廣泛影響,包括一些可能造成的正面和負面社會影響。 近年來,隨著 AI 領(lǐng)域的快速發(fā)展,人們對于科技的思考也越來越多。投向 NeurIPS 的新研究,顯然代表了人工智能領(lǐng)域最先進的技術(shù)。但新科技對于社會發(fā)展的影響,或許是科學(xué)家們此前有所忽略的地方。不過有關(guān)研究廣泛影響的考量竟讓計算機視覺領(lǐng)域的大牛選擇隱退江湖,著實讓人驚訝。 Redmon 和快到?jīng)]朋友的 YOLO 說到 YOLO,相信每個計算機視覺從業(yè)者都不陌生。它是一種非常常用的目標檢測算法,任務(wù)是找出圖像中我們感興趣的目標,確定其大小和位置并識別出具體是哪個對象。從自動駕駛到人臉識別,很多日常生活中的常見任務(wù)都離不開這種算法。 YOLO 模型最早是由 Joseph Redmon 等人在2015年提出的,并在隨后的幾篇論文中進行了修訂。
YOLO 目標檢測算法。圖源:https://arxiv.org/pdf/1506.02640.pdf。
Faster R-CNN 及在其基礎(chǔ)上改進的 Mask R-CNN 在實例分割、目標檢測、人體關(guān)鍵點檢測等任務(wù)上都取得了很好的效果,但通常較慢。而 YOLO 的創(chuàng)新之處在于,它提出了 one-stage,即目標定位和目標識別在一個步驟中完成,是名副其實的「You Only Look Once」。 由于 YOLO 只使用單個網(wǎng)絡(luò),因此可以直接在檢測性能上進行端到端優(yōu)化,使得基礎(chǔ) YOLO 模型能以每秒45幀的速度實時處理圖像。YOLO 的一個小規(guī)模版本——Fast YOLO 可以達到每秒155幀的處理速度。 YOLO 有著讓人驚艷的速度,同時也有讓人止步的缺陷:不擅長小目標檢測。為了彌補這一缺陷,2018年,Redmon 等人發(fā)布了 YOLO v3。這一新版本保持了 YOLO 的速度優(yōu)勢,提升了模型精度,尤其加強了小目標、重疊遮擋目標的識別,補齊了 YOLO 的短板,是目前速度和精度均衡的目標檢測網(wǎng)絡(luò)。 研究者們對于 YOLO 下一個版本的展望主要在于三個方面:更高的識別準確率、更加廣泛的實時監(jiān)測,以及更輕量化的模型。在 GitHub 上,人們對于 v4版本什么時候出的問題,得到的答案一直是「coming soon」。 一直以來,Joseph Redmon 跟隨 Allen School 教授 Ali Farhadi 從事計算機視覺研究,他是2018年度谷歌博士獎學(xué)金的獲得者,理由是在「創(chuàng)造更快、更好、更有用的計算機視覺應(yīng)用工具」方面的貢獻。
Redmond 曾在 TED 上向人們介紹計算機視覺技術(shù)的發(fā)展。Redmon 曾在艾倫人工智能研究所實習(xí)(后孵化出初創(chuàng)公司 XNOR.ai,該公司現(xiàn)已被蘋果收購),當(dāng)時參與的是 XNOR-Net 開發(fā)工作。在此之前,他也曾在谷歌大腦有過實習(xí)經(jīng)歷。 當(dāng)然,他最有名的個人項目還是 YOLO,這一成果最早在論文《You Only Look Once: Unified, Real-Time Object Detection》中進行了詳細介紹,文章也獲得了 CVPR 2016「OpenCV People's Choice Award」獎項;Redmon 與導(dǎo)師合著的論文《YOLO9000: Better, Faster, Stronger》獲得 CVPR 2017最佳論文榮譽提名獎。 To be or not to be? 自己的工作對社會有潛在的負面影響就應(yīng)該停止研究嗎?在 Redmon 的推文底下,大家展開了一番討論。 前谷歌大腦機器人研究專家 Kevin Zakka 認為,研究者不應(yīng)該因為自己的工作可能帶來負面影響而停止研究。相反,你應(yīng)該利用自己在該領(lǐng)域的影響力來提高人們的警惕,將研究成果用在正確的地方。
不少人表達了相似的見解。有人認為,你停止研究并不代表別人也會停。以愛因斯坦的相對論為例,其他人幾乎也同時得出了相同的結(jié)論。這個方向不會因你而停滯不前,而且,繼續(xù)做研究的人道德水平可能并不如你。所以,與其讓一個不了解這一領(lǐng)域潛在危害的人來引領(lǐng)發(fā)展方向,還不如這一領(lǐng)域最清楚利弊的人繼續(xù)做。
當(dāng)然,也有人有不同意見,認為「如果這件事從本質(zhì)上就是錯的,那你永遠也無法找出一種正確的做法?!?/p>
從這個邏輯上來說,如果某個方向有潛在危害,這個領(lǐng)域的專家不僅應(yīng)該停止研究,更應(yīng)該站出來,成為阻止這種研究方向的意見領(lǐng)袖。
YOLO之父退出CV界,稱因無法接受其研究成果負面影響
很多技術(shù)都是一把雙刃劍,它們的出現(xiàn)推動著人類社會的發(fā)展,但也伴隨著倫理、道德問題的討論。諾貝爾后悔發(fā)明了炸藥,但我們今天開山修路卻離不了它。在這種道德困境下,科學(xué)家應(yīng)該如何做選擇?簡單的討論恐怕很難回答這一問題。 在討論區(qū),也有人給出了下一步的職業(yè)建議,認為 Redmon 可以進入醫(yī)療 CV 領(lǐng)域。這一領(lǐng)域目前還有很多待解決的問題。
不知 Joseph Redmon 和 YOLO 的未來將何去何從。