上個月,百度曾發(fā)表論文指出,新近研發(fā)的超級計算機(jī)Minwa在一項(xiàng)備受關(guān)注的人工智能基準(zhǔn)測試ImageNet中取得了世界最好成績,錯誤率僅為4.58%,超越了微軟和谷歌。
此前的世界最好紀(jì)錄4.82%由谷歌創(chuàng)造,而微軟在此測試中也達(dá)到4.94%的不俗成績,同樣的實(shí)驗(yàn)中,人眼辨識的錯誤率大概為5.1%。
百度在的論文中稱,他們的系統(tǒng)在測試ImageNet分類數(shù)據(jù)集中的錯誤率僅為4.58%(ImageNet ILSVRC計算機(jī)視覺挑戰(zhàn)比賽是目前國際上最大規(guī)模的圖像分類和識別測試平臺)。
據(jù)了解,這個數(shù)據(jù)集包含約150萬張圖像,分為1000個不同的類別,軟件被要求為10萬張前所未見的測試圖像進(jìn)行分類。
不過,今日ILSVRC的組織者發(fā)表聲明稱,百度在ILSVRC挑戰(zhàn)賽中被曝光存在違規(guī)行為,百度異構(gòu)計算團(tuán)隊(duì)已經(jīng)就此事道歉。
ILSVRC組織者在聲明中指出,2014年11月28日至2015年5月13日,百度團(tuán)隊(duì)使用至少30個帳號向測試服務(wù)器進(jìn)行了至少200次提交,遠(yuǎn)超每周只能提交兩次的限制。例如,在從3月15日至3月19日的5天時間里,提交次數(shù)超過了40次。
ILSVRC組織者認(rèn)為,百度違反了違測試服務(wù)器的使用規(guī)定,最終結(jié)果無法與其他團(tuán)隊(duì)獲得的結(jié)果進(jìn)行對比。
百度對此回應(yīng)稱:“我們對這一錯誤表示道歉,并將繼續(xù)評估結(jié)果。我們已向研究論文《Deep Image: Scaling up Image Recognition》加入了注釋,并將在了解更多情況后提供相關(guān)的更新。我們支持ImageNet挑戰(zhàn)的公平性和透明性,并將致力于科學(xué)發(fā)展的誠實(shí)性。”
聲明全文:
ILSVRC社區(qū)成員:
這是繼2015年5月19日公告之后的后續(xù)聲明,其中包括更多細(xì)節(jié)和測試服務(wù)器的狀態(tài)。
從2014年11月28日至2015年5月13日,百度一個團(tuán)隊(duì)使用至少30個帳號向測試服務(wù)器進(jìn)行了至少200次提交,遠(yuǎn)超每周只能提交兩次的限制。這其中包括在短時間內(nèi)極高的用量。例如,在從3月15日至3月19日的5天時間里,提交次數(shù)超過了40次。圖A顯示了與百度團(tuán)隊(duì)相關(guān)的ImageNet帳號的提交次數(shù)。圖B顯示了這些帳號與所有其他帳號活躍程度的對比。
圖A
圖B
這一期間獲得的成果在近期的arXiv論文中進(jìn)行了報告。由于違反了測試服務(wù)器的使用規(guī)定,這些結(jié)果可能無法與其他團(tuán)隊(duì)獲得并報告的結(jié)果對比。通過在測試服務(wù)器上測試多種略有不同的解決方案,有可能會出現(xiàn)以下情況:1)基于測試結(jié)果,在一系列類似解決方案中選出最優(yōu)方案,從而獲得不大,但可能很重要的優(yōu)勢;2)直接基于測試數(shù)據(jù),而不是訓(xùn)練和驗(yàn)證數(shù)據(jù),選擇進(jìn)一步的研發(fā)方式。
我們于2015年5月14日注意到了這些違規(guī),并于2015年5月17日通知了論文作者。2015年5月22日,在進(jìn)行討論,并征求我們研究社區(qū)高級顧問的意見之后,我們通知作者:
1.他們通過ImageNet測試服務(wù)器獲得的結(jié)果無法與他人的結(jié)果直接對比。
2.對百度基于這些結(jié)果新提交的任何內(nèi)容,我們持懷疑態(tài)度。這包括關(guān)于ILSVRC挑戰(zhàn)任務(wù)的所有提交內(nèi)容,以及共享數(shù)據(jù)集的一部分。因此,我們要求他們在未來12個月內(nèi)停止向評估服務(wù)器和挑戰(zhàn)任務(wù)提交任何內(nèi)容。
我們正在與涉及此次事件的團(tuán)隊(duì)進(jìn)行溝通。他們請求我們向整個社區(qū)轉(zhuǎn)發(fā)包括以下聲明在內(nèi)的消息。需要指出,為了保持中立性和獨(dú)立性,我們沒有也不能與任何團(tuán)隊(duì)合作,以表述或評估結(jié)果。
目前測試服務(wù)器已經(jīng)重新上線。我們期待繼續(xù)在圖像識別領(lǐng)域取得進(jìn)展。
ILSVRC組織者
以下是來自百度該團(tuán)隊(duì)的消息:
ILSVRC社區(qū):
近期,ILSVRC組織者聯(lián)系了我們異構(gòu)計算團(tuán)隊(duì),并告知我們,我們超過了每周允許向ImageNet服務(wù)器進(jìn)行提交的次數(shù)(在我們項(xiàng)目的生命周期中約為200次)。
我們對這一錯誤表示道歉,并將繼續(xù)評估結(jié)果。我們已向研究論文《Deep Image: Scaling up Image Recognition》加入了注釋,并將在了解更多情況后提供相關(guān)的更新。
我們支持ImageNet挑戰(zhàn)的公平性和透明性,并將致力于科學(xué)發(fā)展的誠實(shí)性。
吳韌,百度異構(gòu)計算團(tuán)隊(duì)