《電子技術(shù)應(yīng)用》
您所在的位置:首頁 > 模擬設(shè)計 > 業(yè)界動態(tài) > 百度在圖像識別大賽中違規(guī):此前稱超過谷歌

百度在圖像識別大賽中違規(guī):此前稱超過谷歌

2015-06-03
關(guān)鍵詞: 百度 微軟 谷歌 人工智能

        上個月,百度曾發(fā)表論文指出,新近研發(fā)的超級計算機(jī)Minwa在一項(xiàng)備受關(guān)注的人工智能基準(zhǔn)測試ImageNet中取得了世界最好成績,錯誤率僅為4.58%,超越了微軟谷歌。

此前的世界最好紀(jì)錄4.82%由谷歌創(chuàng)造,而微軟在此測試中也達(dá)到4.94%的不俗成績,同樣的實(shí)驗(yàn)中,人眼辨識的錯誤率大概為5.1%。

百度在的論文中稱,他們的系統(tǒng)在測試ImageNet分類數(shù)據(jù)集中的錯誤率僅為4.58%(ImageNet ILSVRC計算機(jī)視覺挑戰(zhàn)比賽是目前國際上最大規(guī)模的圖像分類和識別測試平臺)。

據(jù)了解,這個數(shù)據(jù)集包含約150萬張圖像,分為1000個不同的類別,軟件被要求為10萬張前所未見的測試圖像進(jìn)行分類。

不過,今日ILSVRC的組織者發(fā)表聲明稱,百度在ILSVRC挑戰(zhàn)賽中被曝光存在違規(guī)行為,百度異構(gòu)計算團(tuán)隊(duì)已經(jīng)就此事道歉。

ILSVRC組織者在聲明中指出,2014年11月28日至2015年5月13日,百度團(tuán)隊(duì)使用至少30個帳號向測試服務(wù)器進(jìn)行了至少200次提交,遠(yuǎn)超每周只能提交兩次的限制。例如,在從3月15日至3月19日的5天時間里,提交次數(shù)超過了40次。

ILSVRC組織者認(rèn)為,百度違反了違測試服務(wù)器的使用規(guī)定,最終結(jié)果無法與其他團(tuán)隊(duì)獲得的結(jié)果進(jìn)行對比。

百度對此回應(yīng)稱:“我們對這一錯誤表示道歉,并將繼續(xù)評估結(jié)果。我們已向研究論文《Deep Image: Scaling up Image Recognition》加入了注釋,并將在了解更多情況后提供相關(guān)的更新。我們支持ImageNet挑戰(zhàn)的公平性和透明性,并將致力于科學(xué)發(fā)展的誠實(shí)性。”

聲明全文

ILSVRC社區(qū)成員:

這是繼2015年5月19日公告之后的后續(xù)聲明,其中包括更多細(xì)節(jié)和測試服務(wù)器的狀態(tài)。

從2014年11月28日至2015年5月13日,百度一個團(tuán)隊(duì)使用至少30個帳號向測試服務(wù)器進(jìn)行了至少200次提交,遠(yuǎn)超每周只能提交兩次的限制。這其中包括在短時間內(nèi)極高的用量。例如,在從3月15日至3月19日的5天時間里,提交次數(shù)超過了40次。圖A顯示了與百度團(tuán)隊(duì)相關(guān)的ImageNet帳號的提交次數(shù)。圖B顯示了這些帳號與所有其他帳號活躍程度的對比。

圖A

圖B

這一期間獲得的成果在近期的arXiv論文中進(jìn)行了報告。由于違反了測試服務(wù)器的使用規(guī)定,這些結(jié)果可能無法與其他團(tuán)隊(duì)獲得并報告的結(jié)果對比。通過在測試服務(wù)器上測試多種略有不同的解決方案,有可能會出現(xiàn)以下情況:1)基于測試結(jié)果,在一系列類似解決方案中選出最優(yōu)方案,從而獲得不大,但可能很重要的優(yōu)勢;2)直接基于測試數(shù)據(jù),而不是訓(xùn)練和驗(yàn)證數(shù)據(jù),選擇進(jìn)一步的研發(fā)方式。

我們于2015年5月14日注意到了這些違規(guī),并于2015年5月17日通知了論文作者。2015年5月22日,在進(jìn)行討論,并征求我們研究社區(qū)高級顧問的意見之后,我們通知作者:

1.他們通過ImageNet測試服務(wù)器獲得的結(jié)果無法與他人的結(jié)果直接對比。

2.對百度基于這些結(jié)果新提交的任何內(nèi)容,我們持懷疑態(tài)度。這包括關(guān)于ILSVRC挑戰(zhàn)任務(wù)的所有提交內(nèi)容,以及共享數(shù)據(jù)集的一部分。因此,我們要求他們在未來12個月內(nèi)停止向評估服務(wù)器和挑戰(zhàn)任務(wù)提交任何內(nèi)容。

我們正在與涉及此次事件的團(tuán)隊(duì)進(jìn)行溝通。他們請求我們向整個社區(qū)轉(zhuǎn)發(fā)包括以下聲明在內(nèi)的消息。需要指出,為了保持中立性和獨(dú)立性,我們沒有也不能與任何團(tuán)隊(duì)合作,以表述或評估結(jié)果。

目前測試服務(wù)器已經(jīng)重新上線。我們期待繼續(xù)在圖像識別領(lǐng)域取得進(jìn)展。

ILSVRC組織者

以下是來自百度該團(tuán)隊(duì)的消息:

ILSVRC社區(qū):

近期,ILSVRC組織者聯(lián)系了我們異構(gòu)計算團(tuán)隊(duì),并告知我們,我們超過了每周允許向ImageNet服務(wù)器進(jìn)行提交的次數(shù)(在我們項(xiàng)目的生命周期中約為200次)。

我們對這一錯誤表示道歉,并將繼續(xù)評估結(jié)果。我們已向研究論文《Deep Image: Scaling up Image Recognition》加入了注釋,并將在了解更多情況后提供相關(guān)的更新。

我們支持ImageNet挑戰(zhàn)的公平性和透明性,并將致力于科學(xué)發(fā)展的誠實(shí)性。

吳韌,百度異構(gòu)計算團(tuán)隊(duì)


本站內(nèi)容除特別聲明的原創(chuàng)文章之外,轉(zhuǎn)載內(nèi)容只為傳遞更多信息,并不代表本網(wǎng)站贊同其觀點(diǎn)。轉(zhuǎn)載的所有的文章、圖片、音/視頻文件等資料的版權(quán)歸版權(quán)所有權(quán)人所有。本站采用的非本站原創(chuàng)文章及圖片等內(nèi)容無法一一聯(lián)系確認(rèn)版權(quán)者。如涉及作品內(nèi)容、版權(quán)和其它問題,請及時通過電子郵件或電話通知我們,以便迅速采取適當(dāng)措施,避免給雙方造成不必要的經(jīng)濟(jì)損失。聯(lián)系電話:010-82306118;郵箱:aet@chinaaet.com。