5月17日,2021搜狐科技5G&AI峰會在北京隆重召開。阿里巴巴集團副總裁、達摩院城市大腦實驗室主任華先勝作為嘉賓,發(fā)表了題為《人工智能技術(shù)規(guī)?;瘧?yīng)用的探索與實踐》的主題演講。在他看來,AI平臺化是AI未來發(fā)展趨勢,未來將“無行業(yè),不AI”。(詳見文章《阿里巴巴華先勝:AI平臺化是AI未來發(fā)展趨勢 | 搜狐科技5G&AI峰會 》)
演講后,他接受了搜狐科技的專訪,針對技術(shù)在真實世界的通用性、智慧城市的切入點和難點、國內(nèi)人工智能的優(yōu)勢和薄弱點以及圖片搜索于電商的意義等多個問題進行了一一解答。
在他看來,中國在人工智能領(lǐng)域的發(fā)展既存在優(yōu)勢,也有薄弱點。“在中國,尤其是在應(yīng)用技術(shù)創(chuàng)新應(yīng)用方面,做得既深入又廣泛。這跟社會對新技術(shù)的接納態(tài)度很有關(guān)系,不論是政府還是企業(yè),都很愿意嘗試用新的技術(shù)解決行業(yè)的問題和推動行業(yè)的變革。另外,中國的人才也比較豐富,各個層級的人才都有,各個方面的人才都有,這也是非常好的優(yōu)勢?!?/p>
不過,華先勝表示,國內(nèi)在通用的原創(chuàng)技術(shù)上可能會稍弱一些,但也有不少人在為此努力。
衡量人工智能價值,可以從其“通用性”來判斷。這里的通用性并非是指AI跨行業(yè)的通用性,而是指AI從實驗室環(huán)境遷移到現(xiàn)實世界的能力。“通用性是我們做技術(shù)研發(fā)時一開始就會考慮的問題?!?/p>
華先勝解釋稱,在人工智能落地的過程中,每個階段都有不同的關(guān)注重點。首先是算法的準(zhǔn)確率,然后逐漸過渡到計算效率和普適性提升。“我們會在真實的大數(shù)據(jù)場景下不斷地對算法進行打磨和迭代,但如果只是做基礎(chǔ)科研的話,就不見得會關(guān)心這個問題。因為把技術(shù)遷移到真實環(huán)境下,問題往往會變得更深,更復(fù)雜,更有挑戰(zhàn)。”
華先勝所專注的智慧城市領(lǐng)域,就是人工智能最重要的落地場景之一,也是一個眾多公司都在參與競爭的火熱賽道。“同行們有從端(傳感器)切入的,有從應(yīng)用層切入的,有從算法角度切入的,還有從AI能力平臺角度切入的;當(dāng)然,也有從AI技術(shù)研發(fā)平臺角度切入的?!?/p>
盡管業(yè)內(nèi)做法不一,但華先勝表示,憑一家之力,很難從底層到應(yīng)用層全部做到盡善盡美。更好的方式是,每一部分都有更專長的人做?!斑@也同時會帶來一個問題,就是行業(yè)內(nèi)需要一份標(biāo)準(zhǔn)和規(guī)范,能夠讓不同的團隊、不同的公司、不同的服務(wù)的提供方形成合力。不至于在每個城市里,一部分是這家公司做的,另外一個部分那家公司做的,最后各自為政?!?/p>
除了上述談到的國內(nèi)人工智能的優(yōu)勢和薄弱點、技術(shù)通用性等問題外,普通大眾可能對“買買買”更為熟悉。值得一提的是,“搜同款神器”——手機淘寶中 “拍立淘”,其背后的技術(shù)就是由華先勝首創(chuàng)和實現(xiàn)的。
當(dāng)談及圖片搜索對于電商生態(tài)的意義時,華先勝表示:“通過圖片來搜索商品是圖像搜索絕佳的應(yīng)有場景,這是一個剛性的需求,解決的是文本搜索和瀏覽無法解決的問題?!边@也是圖片搜索永遠(yuǎn)在電商搜索中占據(jù)一席之地的原因。
嘉賓簡介:
華先勝,現(xiàn)任阿里巴巴集團副總裁、高級研究員、達摩院城市大腦實驗室主任。
華先勝是國際電氣與電子工程師協(xié)會會士(IEEE Fellow),美國計算機協(xié)會杰出科學(xué)家(ACM Distinguished Scientist);2008年獲MIT技術(shù)評論“全球35個35歲以下杰出青年創(chuàng)新者”稱號(TR35)。
華先勝1996年和2001年畢業(yè)于北京大學(xué)數(shù)學(xué)學(xué)院,分別獲學(xué)士和博士學(xué)位;之后分別工作于微軟亞洲研究院,微軟美國必應(yīng)搜索引擎,以及微軟美國研究院,從事多媒體、計算機視覺和機器學(xué)習(xí)方面的研發(fā)工作。2015年4月加入阿里巴巴,任搜索事業(yè)部資深總監(jiān)/研究員;2016年加入阿里云iDST,負(fù)責(zé)云上視覺智能計算的技術(shù)研發(fā);現(xiàn)任阿里達摩院城市大腦實驗室主任。他的研發(fā)興趣在大規(guī)模視覺人工智能領(lǐng)域,包括視覺分析、識別、搜索和挖掘等。華先勝在國際主流會議和期刊上發(fā)表論文200余篇,擁有專利90余項。曾擔(dān)任多個學(xué)術(shù)期刊的副主編以及ACM Multimedia等頂級學(xué)術(shù)會議的程序委員會主席,并獲得多個國際會議及期刊的最佳論文獎。華先勝曾擔(dān)任ACM Multimedia 2020年大會主席。
以下為專訪實錄精編:
搜狐科技:感謝阿里集團副總裁、達摩院城市大腦實驗室主任華先勝參加搜狐科技的專訪。華老師您好,首先請您跟大家介紹一下達摩院和您的研究方向?
華先勝:達摩院是阿里巴巴的基礎(chǔ)科研和基礎(chǔ)創(chuàng)新研發(fā)的核心機構(gòu)。目前實驗室有5個方向,包括機器智能、數(shù)據(jù)計算、機器人、金融科技和X實驗室。我自己所在的實驗室是人工智能方向,是人工智能從基礎(chǔ)的技術(shù)研發(fā),到形成產(chǎn)品,再到到產(chǎn)品落地應(yīng)用場景的一條龍的團隊建制。
搜狐科技:就像您介紹的,達摩院是研究基礎(chǔ)科學(xué)的創(chuàng)新技術(shù)研究的機構(gòu),實驗室的環(huán)境和真實世界還是有一定的不同的,想問問您,為了讓技術(shù)在現(xiàn)實世界中取得更好的效果,目前是否有哪些難點和技術(shù)解決方案呢?
華先勝:通用性是我們做技術(shù)研發(fā)一開始就會考慮的問題,這個通用性不是指行業(yè)通用性,而是指在真實世界的復(fù)雜場景下有沒有通用性,除了通用性之外,計算的效率有多高,也是我們會考慮的問題。
當(dāng)然最初的時候,算法的準(zhǔn)確率上是技術(shù)研究人員們更關(guān)注的方向,但是我們逐步會把它的效率和普適性提升放在更重要的位置。其實,一開始我們就關(guān)注這個最終的目標(biāo)。
我們會在真實的大數(shù)據(jù)場景下做不斷的打磨和迭代,如果是做基礎(chǔ)科研的話可能會更關(guān)注基礎(chǔ)算法的創(chuàng)新。
在應(yīng)用場景下能夠取得突破,其實相對于在封閉數(shù)據(jù)集上做科研,是一件更難的事情。問題會變得更深,變得更復(fù)雜,更有挑戰(zhàn),我們花費了很大的精力,讓技術(shù)在規(guī)模上、在真實場景中應(yīng)用中去實驗,在實踐中檢驗,在實踐中去磨煉。
搜狐科技:您目前的研究方向是城市大腦,智慧城市領(lǐng)域越來越多受到業(yè)內(nèi)的關(guān)注,很多的同行們都在跟進這個方向,在您的觀察里面,大家的切入點都有哪些不同?
華先勝:切入點都沒有什么太大問題,可以從傳感器端上切入,AI放在端上做也是可以的;也可以從服務(wù)器端的算法切入,解決一些核心問題;還可以從AI平臺切入,提供平臺層的能力,賦能其他開發(fā)者;從應(yīng)用層切入也是常見的方式,能夠基于其他的團隊提供的AI平臺,去做智慧城市的各個領(lǐng)域,比如說各委辦局等等具體部門的業(yè)務(wù)所需要的能力;當(dāng)然,從AI技術(shù)研發(fā)平臺這個角度切入也是可以的。
實際上也是智慧城市也是需要大家一起來繁榮的。很難說誰的切入點一定是對或者一定是錯。
一般來說,一家公司很難從底層到上面最后的應(yīng)用層全部都做了。更多的是每一部分都有更專長的人做,專業(yè)的人做專業(yè)的事情,這個才是最好的。
當(dāng)然這里面也帶來一個問題,就是怎樣能夠形成一個規(guī)范,能夠不同的團隊、不同的公司、不同的服務(wù)的提供方能夠形成合力,這個標(biāo)準(zhǔn)和規(guī)范是急需解決的一個問題,這樣才能真正形成合力,不至于說每個城市里面,這個是他做的,另一個地方是另外一家做的,最后各自為政,這就不太好了。
搜狐科技:那現(xiàn)在的情況是否就像您剛剛提到的呢?
華先勝:應(yīng)該會慢慢變化,我們也在推動規(guī)范和標(biāo)準(zhǔn)的建立。
搜狐科技:您先后有國外和國內(nèi)兩段研究的經(jīng)歷,想問您一下,國內(nèi)相對于國外來說,在人工智能上的優(yōu)勢和發(fā)力點有什么不一樣嗎?
華先勝:在中國,尤其應(yīng)用技術(shù)創(chuàng)新應(yīng)用方面,做得既深入又廣泛,這跟社會對新技術(shù)的接納態(tài)度很有關(guān)系。不論是政府還是企業(yè),都很愿意嘗試用新的技術(shù)解決行業(yè)的問題和推動行業(yè)的變革,中國是一個非常好的環(huán)境。另外,中國的人才也比較豐富,各個層級的人才都有,各個方面的人才都有。所以,在解決行業(yè)的問題上的這些創(chuàng)新,中國是非常占有優(yōu)勢的,在世界上也是走在前沿的。
至于也有人認(rèn)為,中國原創(chuàng)的技術(shù)要稍弱一點,其實中國也有不少原創(chuàng)的東西,但相對來說,通用的原創(chuàng)技術(shù)可能會稍微少一點,比如說一些基礎(chǔ)模型,可能會比應(yīng)用技術(shù)的研發(fā)相比稍微弱一點,現(xiàn)在也看到很多人做這方面的事情。
搜狐科技:您介紹了很多技術(shù)相關(guān)的內(nèi)容,但普通大眾對“買買買”更感興趣,手機淘寶里面的“拍立淘”背后的技術(shù)就是由您開創(chuàng)的,請您簡單介紹一下,圖片搜索對于電商生態(tài)有什么重要性?
華先勝:圖像搜索并不是阿里巴巴原創(chuàng),上世紀(jì)90年代就有很多人做這方面的研究,那時候叫做圖像檢索,有很多人因為這方面的研究而獲得了博士學(xué)位的。
但是那個時候的技術(shù)跟今天還是有很大差別的,深度學(xué)習(xí)技術(shù)和索引技術(shù)起來了以后,才使得這項技術(shù)真正能夠應(yīng)用起來。
之前很多人,包括我在微軟的時候,也做過這樣的工作,大多是通用的場景,但通用的場景目前來看不是一個特別剛性的需求。
但是電商的場景不一樣,通過圖片來搜索商品是圖像搜索絕佳的應(yīng)用場景,也是剛性的需求,解決的是文本的搜索和瀏覽無法解決的問題。因為很多場景只有通過這種方式才能搜索:你看中了這個商品,但是你沒辦法準(zhǔn)確知道商品名字,這時候你只能通過拍照來進行搜索。
當(dāng)然,這個功能還可以搜索同款、相似款,比如“神似”的東西,兩者很像,但其實并不是一個商品,這些通過文字都無法實現(xiàn)。 圖片搜索目前在電商搜索中里面占了一定的量,主流還是在文字和瀏覽,但是它切實解決了一個過去解決不了的問題,所以用戶量也不少。