凱文·凱利說“人工智能是下一個顛覆人類社會的東西”。據(jù)BBC預測,到2020年,全球人工智能市場規(guī)模將達1190億人民幣。人工智能將成為未來10年內(nèi)的產(chǎn)業(yè)新風口似乎已成不爭的事實。
距離1956年人工智能之父馬文·明斯基提出“人工智能”的概念已整整過去了60年,其間商業(yè)化的浪潮一直遲遲未至。之前,盡管有微軟、谷歌、Facebook等大公司不斷投資人工智能技術,但大多把研究成果用于自身業(yè)務的優(yōu)化與效率提升,未能激起多大的浪花。直至人機大戰(zhàn)重新奪回大眾的關注點,人們才意識到,人工智能商業(yè)化不知何時已悄然開始布局。
實際上,從圖像識別、語音識別的細分角度看,今天的人工智能商業(yè)化已經(jīng)讓大眾受益頗豐。然而就在10年前,今天市面上可以見到的Siri、人臉識別等仍是天方夜譚,人工智能商業(yè)化的前提到底是什么?更快的計算機、更多的數(shù)據(jù)、更高級的算法為了達到人工智能技術落地的可能,無數(shù)科學家試圖給出可行的方案。與此同時,市場也在用商業(yè)的力量和邏輯,加速人工智能產(chǎn)品迭代,掀起一番巨浪。
AI大潮下進擊的巨頭們
人機大戰(zhàn)折射出的現(xiàn)象是人工智能早已成為巨頭們發(fā)展的方向,“深度學習”成為競爭的焦點。事實上只有更多的開發(fā)者加入人工智能領域的研究、不斷推動技術進步,才能實現(xiàn)商業(yè)化的最終目標。因此可以說,谷歌大張旗鼓贏得與李世石的比賽,打響了巨頭們之間又一輪競賽的起跑槍。同樣斥巨資布局人工智能的還有Facebook、微軟、蘋果等多家商業(yè)巨頭。
蘋果公司早早推出了以Siri為代表的人工智能應用,通過收購和自主研發(fā)完成對人工智能的提前布局,在語音、圖像、機器學習都有產(chǎn)品覆蓋。相對于蘋果,谷歌和Facebook在人工智能領域的努力更容易為外界所捕獲。
對于谷歌來說,Alpha Go只是其人工智能計劃的開端。除了AlphaGo,谷歌還推出了基于人工智能的新搜索算法的Rank Brain,聯(lián)手福特研發(fā)了無人駕駛汽車、D-Wave量子計算機測試,并將人工智能融入聊天。后起之秀Facebook則于2015年6月在歐洲成立人工智能研究中心,試圖建造能夠理解海量數(shù)據(jù)的人工智能機器。值得一提的是Facebook一直是開源人工智能技術的積極推動者,F(xiàn)acebook日前開源了三款圖像分割軟件工具,三者相互配合可以完成一個完整的圖像識別分割處理流程。此前,F(xiàn)acebook還曾在Torch上開源了一些功能強大的深度學習工具。
不同于谷歌和Facebook的吸睛,微軟在人工智能領域顯得十分低調(diào),但其實早在1991年微軟便成立研究院,專攻人機交互、自然語言處理、機器學習、語音識別和語音合成、計算機視覺5個方向。而這些,不論是在學界或是業(yè)界,恰恰成為了人工智能最重要的分支。
目前微軟在中國為人熟知的產(chǎn)品是人工智能虛擬機器人小娜(Cortana)和小冰。小冰在中國即時通信軟件巨頭微信上運行三天后,獲得了150萬條聊天記錄。之后,小冰入駐微博,成為最受關注的賬號之一。尤其是小冰與網(wǎng)友的“舌戰(zhàn)”賺足了眼球。小娜則更像用戶生活中的人工智能助手,在今年3月微軟舉辦的Build大會上,小娜成功算出了“主人”最有可能到家的行程和時間,并在“主人”到家前的5分鐘讓家用電器啟動。
力圖在人工智能領域“后發(fā)制人”的微軟日前宣布收購了人工智能調(diào)度工具Genee,并表示或將把它融入云服務Office 365當中,這表明微軟正計劃人工智能助理的多領域用途。事實上,微軟不僅將人工智能技術應用于Windows、Azure等核心業(yè)務中,還構建了開放的平臺,將多年的技術積累開放給產(chǎn)業(yè)界,它的野心是打造一個人工智能生態(tài)圈。
除了BAT,還有誰在AI+?
目光放回國內(nèi),除了眾所周知的BAT在人工智能領域有著較為深厚的積累,還有一批進擊的巨頭們在不斷探索。8月12日,搜狗、華為、小米、360等巨頭在“全球人工智能與機器人峰會”上,對人工智能商業(yè)化場景進行了一番探討。關于人工智能的現(xiàn)在和未來,大佬們都說了什么?
“從搜索引擎產(chǎn)品的從業(yè)者來講,我們認為搜索引擎其實是人工智能最大的一個場景?!彼压稢TO楊洪濤表示,得益于互聯(lián)網(wǎng)的發(fā)展,足夠的應用、信息和用戶量產(chǎn)生了海量數(shù)據(jù),這讓搜索引擎公司有了更好的算法,能大批量、低成本地將計算力連接起來。
8月3日,搜狗推出語音搜索引擎——“知音”,并融合了吞音優(yōu)化、語音糾錯以及多輪交互三個全新的功能。楊洪濤介紹,目前搜狗的智能語音技術已經(jīng)成功應用到搜狗的全線產(chǎn)品中,隨著搜狗在自然交互與知識計算方面的不斷完善,加之與行業(yè)內(nèi)其他領先企業(yè)的深度合作,“知音”將會布局到更多的終端入口,在物聯(lián)網(wǎng)、車聯(lián)網(wǎng)、人工智能等各個方面以“任務+應用”的形式在特定場景上發(fā)力,如汽車和智能家居。
不過,搜狗的智能語音技術不是一個賣技術的商業(yè)模式。搜索引擎公司在背后能夠提供的不僅僅是語音交互,它本質(zhì)上是技術應用對企業(yè)和用戶產(chǎn)生價值的一個過程。對信息的掌握和服務的整合產(chǎn)生的價值,將會極大地滿足和促進市場的需求。
作為一個互聯(lián)網(wǎng)公司,搜狗布局人工智能或許并不令人意外,但很多人似乎不知道華為也早已開始布局人工智能,并成立諾亞方舟實驗室,發(fā)力AI方向的產(chǎn)品和技術。
“華為諾亞方舟實驗室在進行人工智能研究和未來技術探索的同時,主要還將關注終端產(chǎn)品的智能化研發(fā)?!痹搶嶒炇抑魅卫詈秸f,他們的目的是打造一個全智能化的智能移動手機終端,用戶將通過自然語言的方式從終端獲取一切想要的信息和協(xié)助。該實驗室成立4年多以來,主要關注人工智能、機器學習、數(shù)據(jù)挖掘等前沿科技領域的研究。
目前華為諾亞方舟實驗室已經(jīng)推出了兩款產(chǎn)品,分別是華為手機上的App市場及“手機服務”App。面對3億用戶,每天3000萬次檢索,1億次下載總量的大數(shù)據(jù)挑戰(zhàn),前者能夠智能化地為客戶提供檢索結果和推薦App;用戶可以用自然語言的方式向后者求助在手機使用過程中遇到的各種問題,在每天10萬次當量的問題求助中,有超過90%的用戶都可以得到滿意的回答。
而根據(jù)華為公布的2015年年報的內(nèi)容,在人工智能領域,華為在深度學習上持續(xù)突破,取得了不錯的成績。基于深度學習,華為研究出了業(yè)界最先進的神經(jīng)應答機,發(fā)布業(yè)界第一個基于深度學習的單輪對話生成模型。所謂神經(jīng)應答機,就是一個單輪的對話系統(tǒng),用編碼器將問句轉換成中間表示,再用解碼器將中間表示轉換成回答。
比如你說:“我想買一部iPhone”,系統(tǒng)回答:“還是支持一下國產(chǎn)的吧”。事實上,這一句話并沒有提前寫入對話數(shù)據(jù)中,而是系統(tǒng)在看了許多對話例子后自動生成的反饋。除此之外,華為還研發(fā)出神經(jīng)機器翻譯(Neural Machine Translation)技術,能夠支持深度記憶框架,達到業(yè)界一流機器翻譯能力。
和華為類似,小米的人工智能布局也著力在終端上?!叭斯ぶ悄艿陌l(fā)展離不開這三個前提:產(chǎn)品、大數(shù)據(jù)、機器學習?!毙∶卓萍悸?lián)合創(chuàng)始人黃江吉,帶著對一系列小米智能家居設備的介紹,在大會上分享了小米對人工智能技術發(fā)展的方法論。
機器學習與大數(shù)據(jù)離不開高活躍度的產(chǎn)品,這些產(chǎn)品包括常用軟件和手環(huán)、電視盒子、網(wǎng)絡設備以及智能家居等智能硬件。黃江吉提到,小米手機有兩千萬MIUI系統(tǒng)用戶,其中日活躍1000萬的應用有8個,而日活躍超100萬的有17個。這為大數(shù)據(jù)和機器學習能力的提升打好了基礎。
當高活躍度的產(chǎn)品須落地時,就會產(chǎn)生大量數(shù)據(jù),而建立高質(zhì)量的數(shù)據(jù),則通過數(shù)據(jù)采集,數(shù)據(jù)清洗,數(shù)據(jù)挖掘,數(shù)據(jù)智能等方式來實現(xiàn)。任何數(shù)據(jù)最終都是為人服務,因此建立每個人的用戶畫像就顯得尤為重要。小米為建立用戶畫像收集了各個場景和各個碎片時間產(chǎn)生的數(shù)據(jù),數(shù)據(jù)量共達200TB。
黃江吉表示,只有將硬件做好才能培養(yǎng)用戶的忠誠度,從而產(chǎn)生批量數(shù)據(jù),“產(chǎn)生了這個數(shù)據(jù)之后才可以去機器學習、深度學習,讓它反過來變成一個數(shù)據(jù)模型,把你的產(chǎn)品做得越來越智能,才可以把它的體驗度做得越來越好”。
“武術大家都熱衷于名門正派,你不僅能把別人打敗了而且還能提煉出一些招式來,希望這些招式能幫助別人在格斗的時候獲勝。在學術界的人工智能研究與武術這一點就很像。而在工業(yè)界,這些招式就變得不那么重要,重要的是你能有一種武術,或者一種合作的方式能把別人打敗,把一個問題解決掉,這就是好的人工智能?!睂W界出身的360人工智能研究院的院長顏水成,在大會上這樣解釋先后在學術界和工業(yè)界與人工智能打交道的感受。
直到2013年,學術界還能在人工智能競賽中拿下第一,但是到了近兩年,顏水成發(fā)現(xiàn)好的成果都是從互聯(lián)網(wǎng)企業(yè)出來,這也是他接受360聘任邀請的原因。過去兩年,360向市場推出了一系列智能硬件產(chǎn)品,其中很多依托人工智能的技術。如360智能攝像機,依靠的是飛速進步的圖像識別技術和大數(shù)據(jù)技術,如今能智能偵測移動物體,家里無人狀態(tài)下門窗被打開,它會發(fā)出警報。而360周鴻祎更是放話360要利用IOT技術解決人們的出行安全、家居安全、兒童和老人的安全。
華為進入無人區(qū)、小米神話遭遇平臺區(qū),進入2016年,一大批公司再遇到發(fā)展瓶頸。如何突圍,成為了每一個巨頭不得不思考的問題,人工智能將成為助力破冰的關鍵。
細分市場再起風云
如若把人工智能具象化為“人體的延伸”,構造“眼耳鼻舌身意”則是邁向人工智能的系統(tǒng)性工程。在人類的各種感官中,視覺負責接受80%左右的信息。同理,計算機視覺也成為人工智能研究的重要方向。
這門致力于教會機器“看”的科學,實質(zhì)上是讓攝影機和電腦代替人眼對目標進行識別、跟蹤和測量等機器視覺,而后進行圖形處理,試圖從圖像或多維數(shù)據(jù)中獲取信息。計算機誕生50多年以來,計算機視覺經(jīng)歷了從感知到認知的發(fā)展,主要有特征提取、圖像標注、圖像理解和圖像的深度理解4個階段。
計算機學會用人的方式看懂世界,將人從繁瑣的勞動中解放出來,無論是巨頭還是初創(chuàng)公司都企圖搶灘計算機視覺的商業(yè)化市場,尤其是2012年深度學習崛起后,不少該領域的創(chuàng)業(yè)公司大放異彩。
微軟最新的深度學習系統(tǒng)在2015年的Image Net計算機視覺識別挑戰(zhàn)賽中,將計算機視覺系統(tǒng)錯誤率降低至3.57%,相比于人眼辨識的5.1%,這是人工智能首次在識別圖像的正確率上超越人類水平。這些機器由微軟的Azure云服務提供支持。
“在2012年引入深度學習之前,圖像標注的錯誤率高達28.2%,而自從引入了深度學習網(wǎng)絡分析模型,機器標注圖像的錯誤率已經(jīng)從2012年的16%降到了2015年的3.5%,而神經(jīng)網(wǎng)絡分析模型的規(guī)模也增加到152層?!蔽④泚喼扪芯吭撼崭痹洪L芮勇向記者介紹,微軟研究院的計算機視覺技術已處于世界頂端。
全球人工智能公司多專攻深度學習方向,而我國超過70%的公司主攻圖像或語音識別兩大類別。最早一批獲得投資人和市場認可的科技創(chuàng)業(yè)公司中就不乏圖像識別的佼佼者。
獲得百萬美元A輪融資的Face++在2012年抓住機會,進軍人臉識別技術和相關產(chǎn)品應用研究,通過“脫敏”技術掌握了500萬張人臉圖片數(shù)據(jù)庫。阿里巴巴現(xiàn)已攜手Face++探索計算機識別的商業(yè)化場景,旗下支付寶的“笑臉支付”就采用了該公司的技術。
格靈深瞳則是另一家引人注目的計算機視覺創(chuàng)業(yè)公司,他們獲得了來自紅杉的數(shù)千萬美元A輪融資。這家公司選擇以“安保”為切入口,做出了深瞳人眼攝像機,不僅可以極速全場景抓拍,每秒可抓拍超過100張人臉,還可看清80米外的人臉。此外,格靈深瞳現(xiàn)在也介入了汽車視覺業(yè)務,技術注入馭勢科技等新興創(chuàng)業(yè)公司。
和計算機視覺一樣,自然語言處理也是人工智能的重要組成部分。計算機語言是人與計算機之間傳遞信息的媒介,計算機系統(tǒng)最大特征是指令通過一種語言傳達給機器。
Siri和小冰均是自然語言處理技術落地的產(chǎn)品,但用戶對其印象僅僅停留在娛樂層面,兩者在回答問題中還存在很多的問題。確切說,目前語音識別雖已達到很高水準,但是語義分析仍舊有很長的路要走。因此,在整體語音識別率差異較小的競爭環(huán)境中,語義分析的算法優(yōu)劣和切入的使用場景就成為了NLP(Natural Language Processing)產(chǎn)品最為重要的條件。
前谷歌科學家林德康今年回國后加入了“奇點機智”,并參與了該公司的語音助手項目——“小不點”。這項語音助手并不是用來回答問題的,而是為手機添加了一只無形的手,代替人手的功能,完成一些基本的點擊和輸入操作。如果你對“小不點”說“買一張后天上午北京到上海的飛機票”,它就會打開訂票APP,然后自動輸入北京到上海的飛機票以及時間。同一件事,其他語音助手也可以做,但需要跟相關App合作拿到相關軟件接口。而林德康的語音助手則不需要,走的是人正常操作手機的流程,只是代替人操作,從而實現(xiàn)了自動化。
看起來,林德康只是做了一個小軟件,實際上,在這個小軟件背后,他們想探索的是手機交互上的一次變革。它的切入點是語音,核心則是從把用戶語義轉換成App間操作的能力。
在語音識別領域,“云知聲”入局更早。2015年底“云知聲”完成了B+輪數(shù)千萬美金的融資,并開始了對公司品牌的升級——從智能語音公司,到物聯(lián)網(wǎng)人工智能服務商。云知聲布局人工智能,首先推出的是一個“云端芯”的概念。這個概念簡單解釋就是通過芯片將終端和云端連接起來。基于這個概念該公司開始實踐人工智能。云知聲要做的,是將AI芯放進從家電到汽車的各種產(chǎn)品里,讓它們都能連網(wǎng)并通過語音交互連接至云端服務。目前云知聲主要瞄準家居、車載、教育、醫(yī)療四塊市場,其中前兩塊是重中之重。
深層探索,AI商業(yè)場景更進一步
計算機語音和視覺技術讓計算機有了“開眼看/聽世界”的能力,對接收到的信息進行進一步分析和判斷,則成為了人工智能商業(yè)化的深層探索。
金山軟件CEO張宏江透露:“人工智能發(fā)展速度如此之快,離不開大數(shù)據(jù)和云計算。我們看到的未來是前端一系列的智能設備,而它的大腦實際上在云里面。”AI+大數(shù)據(jù)+云正在成為企業(yè)的標配,現(xiàn)在的企業(yè)需要大數(shù)據(jù)的支撐,而大數(shù)據(jù)要靠云來支撐。云計算和大數(shù)據(jù)已在醫(yī)療、政務、游戲等領域成熟運用。
香港科技大學教授楊強表示人工智能要想獲得成功,需滿足以下5個條件:“人工智能有很多領域,到現(xiàn)在為止最成功的一個領域就是機器學習?!睏顝娬f,“機器學習的一個基本概念就是從數(shù)據(jù)里面經(jīng)常重復的現(xiàn)象匯總出規(guī)律,從而把現(xiàn)實中簡單重復煩瑣的工作給替代掉?!?/p>
技術落地,哪些硬件奪人眼球?
無人駕駛、無人機和機器人領域就是結合了計算機視覺、語音識別及深度算法等技術呈現(xiàn)出來的人工智能商業(yè)化場景。
大疆無人機近年來在無人機市場風頭正勁,“未來我們還要做得更加精準,把99%變成99.9%,這就是工匠精神?!贝蠼畡?chuàng)新副總裁王帆談起大疆的未來顯得十分自信,“從室內(nèi)到室外,無縫對接,我們的產(chǎn)品不會產(chǎn)生任何偏移。這才是基本的、關鍵的、核心的,而不是其他花哨的功能?!?/p>
同屬“無人系列”的智能汽車,無論是在經(jīng)濟體量還是商業(yè)多樣性上更為熱鬧。從自動駕駛到無人駕駛,甚至是智能汽車領域的共享經(jīng)濟思維,有關“自動駕駛”和“無人駕駛”的消息持續(xù)霸屏,熱度不減。
智能汽車生態(tài)圈的打造并非空想,神州租車首席信息官劉亞霄直言:“計算機能下贏李世石,也一定能下贏三輪車?!?/p>
事實上,神州專車以及神州租車在2015年也在智能駕駛方面做了大量的技術投入。神州想要構建的是一個以自動駕駛、車聯(lián)網(wǎng)等技術為基礎的開放性智能汽車運營體系?,F(xiàn)在,神州專車在客戶端通過應用集成駕駛,把汽車的租賃、專車、安全駕駛行為融合在一起,變成一個真正的車場。
眼見無人機和無人駕駛的商業(yè)化之路不斷拓寬,機器人的商業(yè)場景路徑也愈發(fā)令人暢想。盡管學界對機器人的探索有共融機器人、機器人靈巧手、軟體機器人等多個研究方向,不過在機器人的商業(yè)化領域,產(chǎn)品的同質(zhì)化嚴重,不少企業(yè)仍處于“摸著石頭過河”的階段。
“等到機器人市場真正爆發(fā)的時候,每一個細分領域都會有強者出現(xiàn),機器人還是要聚焦到垂直領域來把它做透?!睒烦菴EO梁磊認為應該從用戶的角度出發(fā),盯著垂直領域做機器人。
梁磊表示,樂橙最開始關注的是toC的市場,考慮的是圍繞著視頻領域在監(jiān)控、安防以外延伸更多的功能,在調(diào)研了很多家用產(chǎn)品之后,發(fā)現(xiàn)家用視頻應用場景特別豐富,很多用戶用視頻智能技術來看寵物、看小孩、看老人,所以他們決定基于用戶深挖一個產(chǎn)品,最后決定做母嬰領域。
樂橙關注的是“看得見摸得著”的機器人,達闥科技CEO黃曉慶感興趣的卻是“云端機器人”?!昂暧^的理解,就是把機器人的大腦放到云端,然后用網(wǎng)絡接到一個機器人的身體上。”黃曉慶描述,“也就是把機器人變成三個部分,把機器人的大腦放在云端,把機器人的神經(jīng)網(wǎng)絡變成移動通信的網(wǎng)絡,然后把機器人的本體變成一個阿凡達,這樣就形成了一個云端機器人。”
黃曉慶表示達闥科技初期會以運營云端機器人的運營商新創(chuàng)企業(yè)形象出現(xiàn),主要的研究在機器人的大腦和機器人的神經(jīng)網(wǎng)絡,未來會做機器人連接云端的控制器,到最后實現(xiàn)家庭保姆機器人。
人工智能的黃金時代已經(jīng)到來,在這一波AI+的淘金熱中,關于人工智能的商業(yè)化場景,大企業(yè)和創(chuàng)業(yè)公司均躍躍欲試。想要夢想照進現(xiàn)實,或許還要等待上游技術的成熟和終端產(chǎn)品的優(yōu)化。AI能夠+出何種未來,值得期待.