5月17日,2021搜狐科技5G&AI峰會在北京隆重召開。阿里巴巴集團副總裁、達摩院城市大腦實驗室主任華先勝作為嘉賓,發(fā)表了題為《人工智能技術規(guī)?;瘧玫奶剿髋c實踐》的主題演講。在他看來,AI平臺化是AI未來發(fā)展趨勢,未來將“無行業(yè),不AI”。(詳見文章《阿里巴巴華先勝:AI平臺化是AI未來發(fā)展趨勢 | 搜狐科技5G&AI峰會 》)
演講后,他接受了搜狐科技的專訪,針對技術在真實世界的通用性、智慧城市的切入點和難點、國內(nèi)人工智能的優(yōu)勢和薄弱點以及圖片搜索于電商的意義等多個問題進行了一一解答。
在他看來,中國在人工智能領域的發(fā)展既存在優(yōu)勢,也有薄弱點?!霸谥袊?,尤其是在應用技術創(chuàng)新應用方面,做得既深入又廣泛。這跟社會對新技術的接納態(tài)度很有關系,不論是政府還是企業(yè),都很愿意嘗試用新的技術解決行業(yè)的問題和推動行業(yè)的變革。另外,中國的人才也比較豐富,各個層級的人才都有,各個方面的人才都有,這也是非常好的優(yōu)勢?!?/p>
不過,華先勝表示,國內(nèi)在通用的原創(chuàng)技術上可能會稍弱一些,但也有不少人在為此努力。
衡量人工智能價值,可以從其“通用性”來判斷。這里的通用性并非是指AI跨行業(yè)的通用性,而是指AI從實驗室環(huán)境遷移到現(xiàn)實世界的能力?!巴ㄓ眯允俏覀冏黾夹g研發(fā)時一開始就會考慮的問題?!?/p>
華先勝解釋稱,在人工智能落地的過程中,每個階段都有不同的關注重點。首先是算法的準確率,然后逐漸過渡到計算效率和普適性提升。“我們會在真實的大數(shù)據(jù)場景下不斷地對算法進行打磨和迭代,但如果只是做基礎科研的話,就不見得會關心這個問題。因為把技術遷移到真實環(huán)境下,問題往往會變得更深,更復雜,更有挑戰(zhàn)?!?/p>
華先勝所專注的智慧城市領域,就是人工智能最重要的落地場景之一,也是一個眾多公司都在參與競爭的火熱賽道?!巴袀冇袕亩耍▊鞲衅鳎┣腥氲?,有從應用層切入的,有從算法角度切入的,還有從AI能力平臺角度切入的;當然,也有從AI技術研發(fā)平臺角度切入的?!?/p>
盡管業(yè)內(nèi)做法不一,但華先勝表示,憑一家之力,很難從底層到應用層全部做到盡善盡美。更好的方式是,每一部分都有更專長的人做。“這也同時會帶來一個問題,就是行業(yè)內(nèi)需要一份標準和規(guī)范,能夠讓不同的團隊、不同的公司、不同的服務的提供方形成合力。不至于在每個城市里,一部分是這家公司做的,另外一個部分那家公司做的,最后各自為政?!?/p>
除了上述談到的國內(nèi)人工智能的優(yōu)勢和薄弱點、技術通用性等問題外,普通大眾可能對“買買買”更為熟悉。值得一提的是,“搜同款神器”——手機淘寶中 “拍立淘”,其背后的技術就是由華先勝首創(chuàng)和實現(xiàn)的。
當談及圖片搜索對于電商生態(tài)的意義時,華先勝表示:“通過圖片來搜索商品是圖像搜索絕佳的應有場景,這是一個剛性的需求,解決的是文本搜索和瀏覽無法解決的問題?!边@也是圖片搜索永遠在電商搜索中占據(jù)一席之地的原因。
嘉賓簡介:
華先勝,現(xiàn)任阿里巴巴集團副總裁、高級研究員、達摩院城市大腦實驗室主任。
華先勝是國際電氣與電子工程師協(xié)會會士(IEEE Fellow),美國計算機協(xié)會杰出科學家(ACM Distinguished Scientist);2008年獲MIT技術評論“全球35個35歲以下杰出青年創(chuàng)新者”稱號(TR35)。
華先勝1996年和2001年畢業(yè)于北京大學數(shù)學學院,分別獲學士和博士學位;之后分別工作于微軟亞洲研究院,微軟美國必應搜索引擎,以及微軟美國研究院,從事多媒體、計算機視覺和機器學習方面的研發(fā)工作。2015年4月加入阿里巴巴,任搜索事業(yè)部資深總監(jiān)/研究員;2016年加入阿里云iDST,負責云上視覺智能計算的技術研發(fā);現(xiàn)任阿里達摩院城市大腦實驗室主任。他的研發(fā)興趣在大規(guī)模視覺人工智能領域,包括視覺分析、識別、搜索和挖掘等。華先勝在國際主流會議和期刊上發(fā)表論文200余篇,擁有專利90余項。曾擔任多個學術期刊的副主編以及ACM Multimedia等頂級學術會議的程序委員會主席,并獲得多個國際會議及期刊的最佳論文獎。華先勝曾擔任ACM Multimedia 2020年大會主席。
以下為專訪實錄精編:
搜狐科技:感謝阿里集團副總裁、達摩院城市大腦實驗室主任華先勝參加搜狐科技的專訪。華老師您好,首先請您跟大家介紹一下達摩院和您的研究方向?
華先勝:達摩院是阿里巴巴的基礎科研和基礎創(chuàng)新研發(fā)的核心機構(gòu)。目前實驗室有5個方向,包括機器智能、數(shù)據(jù)計算、機器人、金融科技和X實驗室。我自己所在的實驗室是人工智能方向,是人工智能從基礎的技術研發(fā),到形成產(chǎn)品,再到到產(chǎn)品落地應用場景的一條龍的團隊建制。
搜狐科技:就像您介紹的,達摩院是研究基礎科學的創(chuàng)新技術研究的機構(gòu),實驗室的環(huán)境和真實世界還是有一定的不同的,想問問您,為了讓技術在現(xiàn)實世界中取得更好的效果,目前是否有哪些難點和技術解決方案呢?
華先勝:通用性是我們做技術研發(fā)一開始就會考慮的問題,這個通用性不是指行業(yè)通用性,而是指在真實世界的復雜場景下有沒有通用性,除了通用性之外,計算的效率有多高,也是我們會考慮的問題。
當然最初的時候,算法的準確率上是技術研究人員們更關注的方向,但是我們逐步會把它的效率和普適性提升放在更重要的位置。其實,一開始我們就關注這個最終的目標。
我們會在真實的大數(shù)據(jù)場景下做不斷的打磨和迭代,如果是做基礎科研的話可能會更關注基礎算法的創(chuàng)新。
在應用場景下能夠取得突破,其實相對于在封閉數(shù)據(jù)集上做科研,是一件更難的事情。問題會變得更深,變得更復雜,更有挑戰(zhàn),我們花費了很大的精力,讓技術在規(guī)模上、在真實場景中應用中去實驗,在實踐中檢驗,在實踐中去磨煉。
搜狐科技:您目前的研究方向是城市大腦,智慧城市領域越來越多受到業(yè)內(nèi)的關注,很多的同行們都在跟進這個方向,在您的觀察里面,大家的切入點都有哪些不同?
華先勝:切入點都沒有什么太大問題,可以從傳感器端上切入,AI放在端上做也是可以的;也可以從服務器端的算法切入,解決一些核心問題;還可以從AI平臺切入,提供平臺層的能力,賦能其他開發(fā)者;從應用層切入也是常見的方式,能夠基于其他的團隊提供的AI平臺,去做智慧城市的各個領域,比如說各委辦局等等具體部門的業(yè)務所需要的能力;當然,從AI技術研發(fā)平臺這個角度切入也是可以的。
實際上也是智慧城市也是需要大家一起來繁榮的。很難說誰的切入點一定是對或者一定是錯。
一般來說,一家公司很難從底層到上面最后的應用層全部都做了。更多的是每一部分都有更專長的人做,專業(yè)的人做專業(yè)的事情,這個才是最好的。
當然這里面也帶來一個問題,就是怎樣能夠形成一個規(guī)范,能夠不同的團隊、不同的公司、不同的服務的提供方能夠形成合力,這個標準和規(guī)范是急需解決的一個問題,這樣才能真正形成合力,不至于說每個城市里面,這個是他做的,另一個地方是另外一家做的,最后各自為政,這就不太好了。
搜狐科技:那現(xiàn)在的情況是否就像您剛剛提到的呢?
華先勝:應該會慢慢變化,我們也在推動規(guī)范和標準的建立。
搜狐科技:您先后有國外和國內(nèi)兩段研究的經(jīng)歷,想問您一下,國內(nèi)相對于國外來說,在人工智能上的優(yōu)勢和發(fā)力點有什么不一樣嗎?
華先勝:在中國,尤其應用技術創(chuàng)新應用方面,做得既深入又廣泛,這跟社會對新技術的接納態(tài)度很有關系。不論是政府還是企業(yè),都很愿意嘗試用新的技術解決行業(yè)的問題和推動行業(yè)的變革,中國是一個非常好的環(huán)境。另外,中國的人才也比較豐富,各個層級的人才都有,各個方面的人才都有。所以,在解決行業(yè)的問題上的這些創(chuàng)新,中國是非常占有優(yōu)勢的,在世界上也是走在前沿的。
至于也有人認為,中國原創(chuàng)的技術要稍弱一點,其實中國也有不少原創(chuàng)的東西,但相對來說,通用的原創(chuàng)技術可能會稍微少一點,比如說一些基礎模型,可能會比應用技術的研發(fā)相比稍微弱一點,現(xiàn)在也看到很多人做這方面的事情。
搜狐科技:您介紹了很多技術相關的內(nèi)容,但普通大眾對“買買買”更感興趣,手機淘寶里面的“拍立淘”背后的技術就是由您開創(chuàng)的,請您簡單介紹一下,圖片搜索對于電商生態(tài)有什么重要性?
華先勝:圖像搜索并不是阿里巴巴原創(chuàng),上世紀90年代就有很多人做這方面的研究,那時候叫做圖像檢索,有很多人因為這方面的研究而獲得了博士學位的。
但是那個時候的技術跟今天還是有很大差別的,深度學習技術和索引技術起來了以后,才使得這項技術真正能夠應用起來。
之前很多人,包括我在微軟的時候,也做過這樣的工作,大多是通用的場景,但通用的場景目前來看不是一個特別剛性的需求。
但是電商的場景不一樣,通過圖片來搜索商品是圖像搜索絕佳的應用場景,也是剛性的需求,解決的是文本的搜索和瀏覽無法解決的問題。因為很多場景只有通過這種方式才能搜索:你看中了這個商品,但是你沒辦法準確知道商品名字,這時候你只能通過拍照來進行搜索。
當然,這個功能還可以搜索同款、相似款,比如“神似”的東西,兩者很像,但其實并不是一個商品,這些通過文字都無法實現(xiàn)。 圖片搜索目前在電商搜索中里面占了一定的量,主流還是在文字和瀏覽,但是它切實解決了一個過去解決不了的問題,所以用戶量也不少。