阿里的人工智能“航空母艦”終于下水。
造一艘真正的航母有多難呢?
全世界擁有航母的國家只有10個,擁有完整航母制造技術(shù)的國家只有中國與美國。
相當(dāng)于將一個機(jī)場、3000人的小城鎮(zhèn)、軍火庫、核反應(yīng)堆集結(jié)到一艘船上,能打,能扛,跑得快,不易壞。
1993年,俄羅斯總理訪問黑海造船廠,詢問完成“瓦良格”號需要什么條件。
廠長馬卡羅夫回答:蘇聯(lián)、黨中央、國家計(jì)劃委員會、軍事工業(yè)委員會和九個國防工業(yè)部、600個相關(guān)專業(yè)、8000家配套廠家。
“總之需要一個偉大的國家才能完成?!?/p>
造一艘人工智能的航空母艦更難。
對應(yīng)用場景、對算力、對數(shù)據(jù)和算法的強(qiáng)依賴,讓人工智能產(chǎn)業(yè)也必須以航母的形態(tài)進(jìn)行競爭,這是超級大公司之間,超級大國之間的競爭。
最后一塊零件
伴隨含光800芯片的出世,阿里巴巴人工智能航空母艦最后一塊零件入列,不僅首次亮相,更是火力全開。
9月25日,云棲大會主論壇,做工作報(bào)告的阿里云總裁張建鋒,說著說著掏出了一塊芯片,這是阿里第一顆自研芯片“含光800”。
張建鋒
張建鋒(行癲)說,“它比目前業(yè)內(nèi)最好的AI芯片性能高4倍,包括前幾天兄弟公司發(fā)布的芯片”。他沒指明“前幾天發(fā)布芯片的兄弟公司”是誰,不過,場下會心一笑。
行癲得意是自然。平頭哥發(fā)布自研AI芯片,意味著阿里打通了人工智能全鏈路。
航母動力不足,無法為戰(zhàn)斗機(jī)起降提供足夠的甲板風(fēng)。自研芯片,等于攻克航母動力技術(shù)。
在主論壇外的人工智能芯片專場,身形瘦削的焦陽坐在第一排中央,他是平頭哥研究員、含光800芯片負(fù)責(zé)人,作為東道主的他與相繼到場的分享嘉賓握手寒暄。他們大多是芯片界的老人了。
現(xiàn)場連站的空間都沒有。一個晚到的觀眾從一側(cè)門口擠進(jìn)去,不過,似乎無論他站在哪個位置,都會擋住后方觀眾視野,最終,他從這一側(cè)門口,騰挪到長條形會議室另一側(cè)門口。
含光800用7個月完成了前端設(shè)計(jì),之后僅3個月就成功流片?;貞浧鹦酒O(shè)計(jì)研發(fā)的過程,焦陽說了5次“Crazy”。
去年才成立平頭哥的阿里,一定程度上落后于友商。為了消除業(yè)界顧慮,阿里一定要在一兩個點(diǎn)上做到No.1,不做Me too或者New Follower,才能在下一波浪潮中崛起。
問題來了,要做什么芯片?
谷歌、Facebook、蘋果等互聯(lián)網(wǎng)公司紛紛自研芯片,并非偶然。人工智能對算力需求已經(jīng)超過了摩爾定律?;ヂ?lián)網(wǎng)公司要走到下一個階段,必須要有自己的硬件技術(shù),才能把自己的算法跟硬件做垂直的軟硬一體化設(shè)計(jì),達(dá)到極致的性能。
“含光800芯片預(yù)計(jì)2019年年底可以完成主要業(yè)務(wù)方適配、驗(yàn)證的過程?!苯龟枌︿\財(cái)經(jīng)說,雖然取得了一些成績,但要達(dá)到英偉達(dá)的水平還有一段很長的路要走。
隨著含光800的發(fā)布,平頭哥端云一體全棧芯片產(chǎn)品家族雛形已現(xiàn),打通了芯片設(shè)計(jì)鏈路的全覆蓋,涵蓋終端處理器IP玄鐵系列,一站式芯片設(shè)計(jì)平臺無劍SoC,以及云端AI芯片含光800。
“先在云端做大芯片、技術(shù)上占領(lǐng)制高點(diǎn),如果在云上做成了之后,客戶對于公司在PC、手機(jī)等端上也會充滿信心?!苯龟栍?jì)劃了然于胸。
昨天上午,在云棲大會“飛天智能”論壇上,阿里云第一次亮出了全體AI核心負(fù)責(zé)人陣容。
“最大人工智能公司”,“阿里AI全景圖”,“阿里AI平臺重磅發(fā)布”......輿論一片狂歡。
相比鋪天蓋地的解讀,阿里人自己卻稍顯遲鈍。
AI集體亮相
這張圖最右邊的鄢志杰告訴鋅財(cái)經(jīng),自己也是今天看到外面?zhèn)鱽淼膱D,才真正意識到“我們已經(jīng)集齊了‘龍珠’”。
偶然與必然
內(nèi)部的遲鈍是正常反應(yīng)。畢竟,與造實(shí)體航母不同的是,阿里人工智能最初并沒有清晰的設(shè)計(jì)圖。
就連行癲,也只能概括為“需求牽引、技術(shù)驅(qū)動”。
但要說阿里航母成于偶然,又必然不正確。
五年以前,馬云在iDST內(nèi)部提出,他們是坐在金山上啃饅頭,金山就是阿里巴巴擁有的豐富數(shù)據(jù)?!叭绻麛?shù)據(jù)的價值不能被挖掘出來,那不過就是普通的土壤”。
如果要給阿里人工智能確定個起點(diǎn),這句話再合適不過了,坐擁金山是家底,挖掘價值是驅(qū)動力。
阿里龐大體系內(nèi)生需求,驅(qū)動了人工智能技術(shù)的應(yīng)用。比如,鄢志杰最早做的“淘寶客服質(zhì)檢”,司羅最早做的“聚劃算智能推薦算法”。
眾多巨頭,唯獨(dú)內(nèi)部需求催生了阿里AI航母,這里一定有其他特別的因素。
鄢志杰
2017年12月,當(dāng)時被稱為“黑科技”的阿里云語音售票機(jī)在上海地鐵落地。簡單來說,售票機(jī)的視覺模組能看到到你靠近,嘴唇開合,識別到你在講話,機(jī)器便將麥克風(fēng)陣列聚焦到目標(biāo)說話人,很大程度上隔絕了旁邊的噪聲。
這種多模態(tài)組合已經(jīng)存在多年,為何由阿里語音實(shí)驗(yàn)室再次提起并應(yīng)用?
“因?yàn)槲覀冋Z音與視覺的小伙伴坐在同一間辦公室”,鄢志杰告訴鋅財(cái)經(jīng),這項(xiàng)運(yùn)行了快兩年的黑科技,實(shí)際來自于內(nèi)部“無用的研究”。
“我們想看看語音加上視覺有什么奇妙的效應(yīng),于是用上阿里內(nèi)部人臉識別、定位、測距等“開箱即用”的能力,展示給隔壁的視覺實(shí)驗(yàn)室同學(xué)看,那哥們看了以后覺得很有意思,于是,我們提出‘希望可以識別到嘴唇開合”,他用他的專業(yè)吭哧吭哧馬上做出來了。”
后來,團(tuán)隊(duì)把機(jī)器與地鐵關(guān)聯(lián),搖身一變,成一個在噪聲環(huán)境下,可以賣票的機(jī)子。
“大家分別有了百分之七八十的東西,然后一起完成剩下一二十,這是蠻關(guān)鍵的。如果大家都是0%的話,估計(jì)也沒法合作起來。”
世界杯期間,阿里直播團(tuán)隊(duì)能在比賽結(jié)束后幾分鐘內(nèi)做出集錦視頻,得益于語音團(tuán)隊(duì)開發(fā)的特殊語音識別能力,視覺團(tuán)隊(duì)只需要找到哨聲、歡呼聲的節(jié)點(diǎn),并切片。
又比如,7月底才面世的玄鐵,已經(jīng)和內(nèi)部不同部門合作發(fā)布了語音芯片等專用芯片。
這一切起源于“我們在一間辦公室”。
在阿里這個龐大的培養(yǎng)基里,這種偶然又必然的化合反應(yīng),時刻都在發(fā)生。
8月30日晚,某款換臉軟件瞬間刷屏朋友圈。上線幾個小時之內(nèi),流量如山洪暴發(fā),服務(wù)器瀕臨峰值極限。
事實(shí)上,在這款A(yù)PP上線前,阿里云就已經(jīng)收到了需求,被定了一批服務(wù)器。沒想到上線前幾個小時,流量就已超過了預(yù)期峰值,越來越多的人上傳照片,排隊(duì)時間越來越長。
龍欣
阿里云異構(gòu)計(jì)算產(chǎn)品研發(fā)負(fù)責(zé)人龍欣帶領(lǐng)的十幾個工程師趕到客戶在北京的辦公室,直到凌晨2點(diǎn),穩(wěn)定性和峰值基本滿足了客戶要求。龍欣當(dāng)時很篤定,覺得問題已經(jīng)解決。
6點(diǎn)40分,僅過了4個半小時,龍欣又被電話叫醒,“新的峰值現(xiàn)在的資源沒法扛了,必須要做混合的資源支持和調(diào)度”。他們又回到了辦公室。
用戶抱怨,媒體施壓……龍欣的團(tuán)隊(duì)更慌。
客戶使用的主力GPU是阿里云主售實(shí)例gn6v (使用Tesla V100 GPU),阿里云工程師在彈性擴(kuò)容多地域gn6v實(shí)例的同時,還需要快速擴(kuò)容輕量級的推理GPU實(shí)例gn6i(NVIDIA Tesla T4)以幫助客戶進(jìn)一步降低成本。這帶來的最大挑戰(zhàn)是要保證客戶適配阿里云兩款主售產(chǎn)品不會出現(xiàn)兼容性挑戰(zhàn),不會產(chǎn)生服務(wù)不穩(wěn)定。
頂著巨大的壓力,在很短時間內(nèi)龍欣團(tuán)隊(duì)最后確定了技術(shù)方案。
9點(diǎn)多,阿里云方案設(shè)計(jì)并完成驗(yàn)證。
龍欣自信地告訴鋅財(cái)經(jīng),阿里云是業(yè)界第一個把人工智能算法和GPU的算力大規(guī)模應(yīng)用到to C的現(xiàn)象級APP上的云服務(wù)商。
這是厚積薄發(fā)的結(jié)果。在熟悉客戶業(yè)務(wù)環(huán)境和軟件的基礎(chǔ)上,阿里云從最基本的異構(gòu)計(jì)算IaaS層服務(wù)的穩(wěn)定和彈性,到開源框架的支持,再到深入客戶業(yè)務(wù)環(huán)節(jié)工程化的支持,在這三個不同的環(huán)節(jié)做點(diǎn)對點(diǎn)的定向服務(wù),進(jìn)行優(yōu)化和細(xì)致,才能支持這款現(xiàn)象級軟件刷爆網(wǎng)絡(luò)。
出走象牙塔
1918年,第一艘航母“百眼巨人 號誕生之初,就被評價為“世界海上力量發(fā)生了從制海到制空、制海相結(jié)合的一次革命性變化 ”。
曾經(jīng)信仰“Talk is cheap, show me the code”的阿里科學(xué)家們,在攻下算法山頭后,把目光聚焦到新世界:AI實(shí)戰(zhàn)。
這意味著他們要離開實(shí)驗(yàn)室的象牙塔,到生產(chǎn)環(huán)境中接受考驗(yàn)。海況復(fù)雜,甚至有些境遇讓人啼笑皆非。
在阿里新六脈神劍中,使命是“讓天下沒有難做的生意”,價值觀是“客戶第一”。理解這兩個簡單的陳述句,對這幫智商超過130的AI科學(xué)家們而言,其實(shí)并不容易。
負(fù)責(zé)語言技術(shù)的司羅在加入阿里前是普渡大學(xué)計(jì)算機(jī)系的終身教授,他告訴鋅財(cái)經(jīng):“在學(xué)校,能帶十幾個研究生,有四臺服務(wù)器,這已經(jīng)算是非常好的配置了,但在阿里,內(nèi)部有五千臺服務(wù)器,甚至有幾百張GPU的網(wǎng)卡?!?/p>
司羅
可調(diào)配的資源越多,面對的環(huán)境也更復(fù)雜。在實(shí)驗(yàn)室里,用來檢驗(yàn)?zāi)P唾|(zhì)量的數(shù)據(jù)都是干凈的結(jié)構(gòu)化數(shù)據(jù),而在許多阿里的場景中,面對的則是“方言、省略、簡要、重復(fù)”等各種日常口語化數(shù)據(jù)。
有一回,一個項(xiàng)目負(fù)責(zé)人說了句:“我們領(lǐng)導(dǎo)是一句笑話,但我們要認(rèn)真對待”。這是司羅工作的日常:“人都能理解這句話的語義,可是機(jī)器不能”。
“以前在學(xué)校里,工作的成績和成就感是論文、標(biāo)準(zhǔn)數(shù)據(jù)集上的提升,但是在阿里,成就干是看到你的算法能力在實(shí)際場景中得到了巨大的提升?!?/p>
數(shù)據(jù)的復(fù)雜只是業(yè)務(wù)上的挑戰(zhàn),更多時候的是觀念轉(zhuǎn)變的挑戰(zhàn)。
“來到阿里之后,我們這些搞技術(shù)的‘被迫’嗅到了前線的味道:算法只是冰山一角,如果要在產(chǎn)業(yè)中產(chǎn)生價值,還有很多功課要做”,鄢志杰把進(jìn)入阿里前的環(huán)境比作象牙塔,那時候只需要衡量論文、算法的先進(jìn)性。
“你們搞科學(xué)技術(shù)的,跟‘讓天下沒有難做的生意’有什么關(guān)系”,這個問題在鄢志杰加入阿里后時常被問起。
而他現(xiàn)在悟到了“人工智能,最終還是要為客戶產(chǎn)生價值,他在生意里取得成功,讓他的生意好做,因?yàn)榻o他創(chuàng)造價值,他愿意分一點(diǎn)錢給我們?!?/p>
批量贈送屠龍刀
給鄢志杰啟發(fā)的是,有一家深圳的叫“硅基智能”的公司,他們悄無聲息地用阿里云語音識別能力,加上移動的來電轉(zhuǎn)移,開發(fā)了一款接聽電話人工智能助手“硅秘”。
這讓鄢志杰十分驚喜,“完全不知道有這么一款產(chǎn)品在研發(fā),客戶開發(fā)完上線了才知道”。
這是讓他有了“真的有點(diǎn)像云計(jì)算”那種感覺。
“我們只要把這些能力放到云上去,很多magical(神奇的)事情會自然的發(fā)生。這種結(jié)合中,我們只需要做好自己那部分事情就好了,這些民間的高手,他懂行業(yè),自然會有很多的想法出來。”
大多數(shù)時候,鄢志杰團(tuán)隊(duì)的成果以插件式的很小的模組,嵌入客戶的產(chǎn)品中,希望用2B的方式,降低整個行業(yè)的門檻。
“我們把原來少數(shù)人才擁有的屠龍刀,放給了很多人,讓他們用這把刀到自己的行業(yè)去拼殺。這幫人現(xiàn)在剛剛沖出去,我希望他們能夠快點(diǎn)成功。”
AI航母也一樣,從它誕生開始,就扛起了為客戶服務(wù)的重任,這個誕生于阿里巴巴的龐然大物,正在攪動中國產(chǎn)業(yè)的數(shù)字化,成為數(shù)字經(jīng)濟(jì)的一把屠龍刀。
“客戶在前陣殺敵,我們在營區(qū)打磨屠龍刀”,這是阿里云的常態(tài)。
阿里云高性能計(jì)算負(fù)責(zé)人何萬青常常接到客戶的“抱怨”:別的團(tuán)隊(duì)都是七八個人來我公司,你們每次就那么兩個人。
何萬青
說到這句話時,何萬青笑了,是欣慰的笑。
云棲社區(qū)有一個故事,2008年,何萬青當(dāng)時還在某家硬件廠商,因?yàn)榻oAli Search進(jìn)行性能優(yōu)化,為阿里省下來買200臺服務(wù)器的需求,這對設(shè)備廠商而言可不是好事。
“硬件公司想辦法讓客戶買更好的、更貴的,而在阿里云,這種成就感在于把超算變成云產(chǎn)品,這個產(chǎn)品是所有人可以受益的”。上汽集團(tuán)乘用車采用SCC集群進(jìn)行混合仿真,整體提升25%效率;安世亞太基于SCC集群為客戶提供HPC解決方案,總體成本下降20%以上;大連化物所國家重點(diǎn)實(shí)驗(yàn)室使用E-HPC集群做分子動力學(xué)仿真計(jì)算,相對上一代GPU集群效率提升200% 。
更多時候,阿里的AI航母行駛在肉眼看不到的地方“磨刀”。
駛?cè)肷钏畢^(qū)
能落地的人工智能,才是好的人工智能,才是有價值的人工智能。
在落地這件事情上,阿里試水的航母已經(jīng)進(jìn)入未知的海域。
客戶認(rèn)為“我們說的語言,阿里云的人聽不懂”。
外包團(tuán)隊(duì)抱怨“客戶提的需求太奇怪了”。
互聯(lián)網(wǎng)與工業(yè)天然存在語言隔閡,在很長一段時間里,負(fù)責(zé)落地正泰新能源項(xiàng)目的達(dá)摩院視覺計(jì)算算法專家魏溪含兩頭為難,心里委屈。
2017年10月,當(dāng)阿里的商務(wù)快要放棄與正泰新能源的合作時,兩方突然碰撞出火花:用視覺識別給太陽能電池片瑕疵做檢測。
魏溪含與她的團(tuán)隊(duì)為這一瞬間的“荷爾蒙”,懵懂地趟入深水區(qū)。畢竟,這玩意沒人做過,客戶只在德國見過相關(guān)檢測設(shè)備,但效果不佳,還得輔助人工。
2018年初,魏溪含和同事交付了項(xiàng)目結(jié)果,便安心回家過年。
事情沒那么簡單。
魏溪含和同事交付的方案中,瑕疵是用方框框起來的。但客戶不僅想知道瑕疵在哪,還想知道它長什么樣。這意味著,他們要把瑕疵的輪廓分類描繪出來。
正泰新能源1和正泰新能源2
30多種瑕疵,兩萬多張圖片。
于是發(fā)生了開頭那一幕,客戶認(rèn)為“我們說的語言,阿里云的人聽不懂”,標(biāo)注數(shù)據(jù)外包團(tuán)隊(duì)抱怨“客戶提的需求太奇怪了”。
魏溪含也不理解,但還是得做。
于是她帶著領(lǐng)外包團(tuán)隊(duì),下工廠,學(xué)瑕疵,標(biāo)輪廓。
這太難了,標(biāo)注項(xiàng)目結(jié)束的時候,30多人的標(biāo)注團(tuán)隊(duì),人走了近一半,還有生病倒下的。
另一方面,魏溪含與算法的同事不斷打磨算法模型,優(yōu)化算法速度,她自嘲“我們是在煉丹”。
算法模型上線后,精度達(dá)到97%,這比人工檢測的上限還高。但是,一下產(chǎn)線測試,精度腰斬到50%。
魏溪含心里咯噔了一下,“當(dāng)時真是抱著必死的決心”。
實(shí)際工況遠(yuǎn)比測試環(huán)境復(fù)雜,攝像、燈光、產(chǎn)業(yè)更換、原材料等都是干擾因素。
“大不了這個項(xiàng)目就做砸了,但是我想知道在哪做砸的。”
故事的結(jié)尾是,項(xiàng)目達(dá)成,精度長期穩(wěn)定在97%以上,質(zhì)檢速度比人快5倍,提升一倍到兩倍,實(shí)現(xiàn)全量檢測(原來只能抽檢10%),電池片出廠的良品率從95%到99%。
9月25日,阿里發(fā)布了工業(yè)質(zhì)檢云平臺,第三方廠商可以收集、標(biāo)注數(shù)據(jù),訓(xùn)練模型,部署服務(wù),快速實(shí)現(xiàn)不同行業(yè)的質(zhì)量檢測。
從項(xiàng)目到平臺,這是阿里云落地的一貫打法。
曾震宇說,過去五年,AI支撐起阿里巴巴,今后五年AI將支撐起各行各業(yè),城市大腦、工業(yè)大腦這是阿里在產(chǎn)業(yè)AI里面的實(shí)踐。
在阿里云和蕭山國際機(jī)場的合作中,城市大腦能夠把一架航班從降落、滑行、停靠廊橋各個保障節(jié)點(diǎn),再到退出、離開的整個過程,做精確還原。這樣可以提高機(jī)場的工作效率和安全性,提高航班準(zhǔn)點(diǎn)率,為乘客節(jié)約時間。
工業(yè)大腦能夠幫助工業(yè)企業(yè)把工業(yè)的全生產(chǎn)鏈條數(shù)據(jù)打通,構(gòu)建工業(yè)的數(shù)據(jù)中臺,并通過AI幫企業(yè)實(shí)現(xiàn)從單點(diǎn)智能到局部智能再到全局智能的提升。
以垃圾焚燒為例,工業(yè)大腦能夠把熟練工人的經(jīng)驗(yàn)和數(shù)據(jù)相結(jié)合,構(gòu)建模型,以AI輔助人工的方式去操作鍋爐,使鍋爐的燃燒穩(wěn)定性可以提高23%。另外,以往工人平均每4個小時要操作30次,在工業(yè)大腦的輔助下,現(xiàn)在只需要操作6次,大幅度降低了工人的勞動強(qiáng)度。
產(chǎn)業(yè)AI正在幫助各行各業(yè)進(jìn)行智能化的轉(zhuǎn)型,是數(shù)字經(jīng)濟(jì)的新動能。數(shù)字經(jīng)濟(jì)是阿里AI航母行駛的前方,是真正的無人區(qū)。
作為龐大經(jīng)濟(jì)體中的技術(shù)中臺,阿里AI航母在阿里巴巴的業(yè)務(wù)里經(jīng)受了很多鍛煉,完成了下水前的演練。
張建鋒說,“比如人工智能。如果沒有產(chǎn)業(yè)實(shí)踐,沒有業(yè)務(wù)嘗試,要去做一個高質(zhì)量的云,變成數(shù)字經(jīng)濟(jì)體的基礎(chǔ),是不太可能的?!?/p>
這相當(dāng)于再造一個人類大腦,它不僅能計(jì)算與感知,還要能認(rèn)知甚至創(chuàng)造。從人工智能的三個層次:算力、算法、數(shù)據(jù),無論從哪方面單點(diǎn)突破,都不可能點(diǎn)亮人工智能產(chǎn)業(yè)海域的全貌,因?yàn)槲覀兪冀K在岸邊作戰(zhàn)。
阿里在做的事情,是將算力、算法、數(shù)據(jù)集結(jié)成航空母艦,將我們在人工智能產(chǎn)業(yè)海域的活動能力從近海推向中海。
縱觀當(dāng)前的全球科技大廠,同時擁有算力、算法、數(shù)據(jù)能力的企業(yè)寥寥無幾。有算法的,缺少數(shù)據(jù);有數(shù)據(jù)的,還在研制芯片。
即便下一巨頭,緊跟著阿里之后點(diǎn)亮了三大技能,他們將面臨沒有實(shí)戰(zhàn)經(jīng)驗(yàn),缺少造系統(tǒng)能力的困境。
套用馬卡羅夫廠長的一句話,“總之,需要一個偉大的企業(yè)才能完成”。