毫無疑問,人工智能(AI)一直是近兩年來發(fā)展最快也是最為熱門領域,無論是國外的谷歌、亞馬遜、蘋果,還是國內的BAT等科技巨頭都紛紛入局,大批的AI創(chuàng)業(yè)公司更是如雨后春筍般涌現(xiàn)。
得益于中國政府對于AI的重視以及眾多中國企業(yè)的大舉投入,中國在AI領域也取得了飛速的發(fā)展。更為重要的是,中國擁有7.3億的網絡用戶,同時也是全球最大的智能終端市場,每天可產生極為龐大的數(shù)據(jù)資源。可以說,AI技術的發(fā)展離不開數(shù)據(jù)的驅動。據(jù)國家發(fā)展改革委披露的數(shù)據(jù)顯示,2020年中國將成為世界第一數(shù)據(jù)資源大國,中國每天產生的數(shù)據(jù)總量有望達到8000EB,占全球數(shù)據(jù)的18%以上。而數(shù)據(jù)對于AI來說則是相當于是“糧食”或“石油”。正因為中國所擁有的龐大的數(shù)據(jù)資源優(yōu)勢,也使得中國成為了AI領域發(fā)展最快的國家之一。
根據(jù)美國白宮發(fā)布的兩份報告顯示,自2014年以來,中國不僅在深度學習領域所發(fā)表的學術文章數(shù)量上超越了美國,而且在深度學習領域被引用學術文章數(shù)量也已超過美國。此外,在計算機視覺、自然語言處理、智能機器人和語音識別能等領域,中國已超越美國走在了世界前列。因此,不少媒體和業(yè)內人士紛紛表示,中國的人工智能實力很快將超過美國。但是,實際上,中國與美國在人工智能領域的差距依然巨大。
中美AI實力差距依然巨大
根據(jù)此前騰訊研究院的中美AI實力對比報告顯示,截止到2017年6月,全球AI企業(yè)總數(shù)為2542家,其中美國1078家,占42%;中國592家只占23%。美國的AI企業(yè)數(shù)量是中國的近兩倍。另外在AI九大熱門領域,美國的融資額更是達到了中國的23倍。而在AI處理器/芯片這種基礎層領域,美國企業(yè)的數(shù)量也大大超過中國,是中國企業(yè)數(shù)量的2.3倍。
不久前,市場研究公司Compass Intelligence對100多家人工智能(AI)芯片公司進行評估,最終發(fā)布了一份全球AI芯片企業(yè)排名,在公布的前24名的榜單上,從國家和地區(qū)分布來看,美國有13家,而且排名前三的也都是美國公司(英偉達、英特爾以及IBM)。中國公司只占據(jù)了7個席位,排名最靠前的是華為,排名第12位。隨后是聯(lián)發(fā)科(14)、Imagination(15)、瑞芯微(20)、芯原(21)、寒武紀(23)和地平線(24)。如果算上即將被高通收購的NXP和即將把總部搬回美國的博通,美國就將會有15家企業(yè)在榜單上,數(shù)量將超過中國企業(yè)兩倍。
當然,僅從中美AI相關領域的企業(yè)數(shù)量或者排名榜單上的企業(yè)數(shù)量對比,并不能完整反應兩國之間的AI實力差距。那么是否有更系統(tǒng)的評判方式呢?
中國AI實力只有美國的一半?
近期,牛津大學也發(fā)布了一份題為《解密中國AI夢》(Deciphering China's AI Dream)的報告,作者牛津大學博士、青年經濟和政治學者杰弗里·?。↗effrey Ding)指出中國目前的AI實力實際僅約為美國的一半。在這份報告中,首次提出了“國家AI潛力指數(shù)(AIPI)”這一概念,AIPI主要考察四項基本指標,分別是:硬件、數(shù)據(jù)、算法和商業(yè),以此來衡量一個國家在AI方面的綜合實力。
下面我們就來看看,在AI硬件、數(shù)據(jù)、算法和商業(yè)這四個方面,中美之間的差距:
1、硬件(占比25%)
在AI硬件方面,由于具備較高的技術門檻和投入成本以及較長的研發(fā)周期,AI芯片的研發(fā)是最為困難的。這類AI芯片又有兩大類:一類是可以被用于機器學習/深度學習訓練的傳統(tǒng)通用型芯片,比如CPU/GPU等;另一類則是專為執(zhí)行AI算法所設計的芯片,比如谷歌的TPU和一些PFGA芯片。
為了衡量中國在AI硬件上的實力,該報告從“半導體生產的國際市場份額(2015)”及“FPGA(現(xiàn)場可編程門陣列)芯片生產商的融資情況(2017)”兩個方面的數(shù)據(jù)來進行分析。
首先,以全球半導體市場份額來看(2015年數(shù)據(jù)),美國占據(jù)了全球半導體市場50%的份額,而中國僅只有4%的份額。其次,在FPGA芯片生產商的融資上,中國相關企業(yè)2017年獲得的投資是3440萬美元,占全球FPGA廠商融資額的7.6%;而美國這一數(shù)據(jù)是1.925億美元,占據(jù)42.4%的份額。
報告據(jù)此計算得出,中國硬件指數(shù)為(4+7.6)/2=5.8,美國硬件指數(shù)為(50+42.4)/2=46.2。
另外報告指出,目前GPU則被廣泛用于深度學習計算領域,在美國前十大芯片制造商當中,有4家GPU廠商,其中Nvidia更是極為強勢。而中國在GPU方面仍沒有一家企業(yè)(芯智訊注:現(xiàn)在Imagination已被中資收購,算是在一定程度上彌補了這個缺憾),幾乎完全依賴國外的企業(yè)。
雖然在中國10大芯片制造商中,有6家有專門從事ASIC芯片的研發(fā),但是美國也擁有更多的從事ASIC芯片的企業(yè),而且實力上也更強。比如谷歌此前已經推出了第二代的TPU。當然這些ASIC芯片的靈活性不如FPGA。而在FPGA領域,美國和中國各有兩家FPGA芯片制造廠商。不過,在2017年美國的FPGA公司獲得了1.925億美元的融資,兩家中國的FPGA公司只獲得了3440萬美元的融資。
該報告也承認,中國在超級計算機方面的成功展示了它在人工智能領域追趕世界的潛力。2014年,中國在超算Top500榜單上的名額僅為76個,占比15.2%,而美國則有232個,占比46.4%。但是到來2017年6月,全球超算Top500榜單上,中國已經擁有了159個名額,占比31.8%,美國則有168個,占比33.6%,顯然中國在超算上的整體實力已經與美國相當。而在未來的人工智能發(fā)展中,超級計算設備可能變得更加適用。
但是需要指出的是,目前中國AI硬件實力的提升,主要還是依靠進口關鍵器件和收購來提升的。由于這一戰(zhàn)略受到美國和歐盟的更嚴格審查,中國正在大力發(fā)展國內芯片設計和制造行業(yè),并在強大的超級計算機上進行長期投資。但是盡管如此,中國國內生產的集成電路只滿足了國內13%的需求,中國的集成電路進出口貿易逆差自2005年以來已經翻了一倍多。因此,如果中國要在人工智能硬件領域中迎頭趕上,可能需要很長時間。
2、數(shù)據(jù)(占據(jù)25%)
前面芯智訊有提到,AI技術的發(fā)展離不開數(shù)據(jù)的驅動,特別是機器學習必須要有足夠數(shù)據(jù)來訓練,而龐大的數(shù)據(jù)資源優(yōu)勢則是中國AI發(fā)展的優(yōu)勢之一。根據(jù)CCID的報告,到2018年中國大陸將占到全球零售電子商務市場的50%以上。咨詢公司預計,到2020年,中國將擁有全球20%的數(shù)據(jù);到2030年,中國將擁有全世界30%的數(shù)據(jù)。因此,在數(shù)據(jù)方面,中國擁有絕對的優(yōu)勢。
不過以2016年的數(shù)據(jù)來看,中國擁有全世界20%的數(shù)據(jù);美國的數(shù)據(jù)量占全世界的5.5%。據(jù)此,該報告計算得出,中國數(shù)據(jù)指數(shù)為20,美國數(shù)據(jù)指數(shù)為5.5。
另外報告指出,中國的數(shù)據(jù)量之所以豐富,除了人口眾多、移動互聯(lián)網發(fā)展迅速以外,中國相對松懈的隱私保護策略,更加使得中國科技巨頭能夠方便收集大量的數(shù)據(jù),并在政府間共享。此外,中國的互聯(lián)網數(shù)據(jù)保護主義也是促使中國互聯(lián)網崛起的關鍵,比如對于Facebook和谷歌的屏蔽,從而使得微博和百度等國內平臺的崛起。從中我們可以看到數(shù)據(jù)的優(yōu)勢。
此外該報告還表示,數(shù)據(jù)是人工智能發(fā)展的稀缺資源,中國可以對其公司和研究機構的資源進行排他性控制,但是如果能夠在更多的平臺和國家之間共享更多的數(shù)據(jù),中國的AI廠商也可以從全球數(shù)據(jù)共享中獲益。
3、算法與研究(占據(jù)25%)
AI研究和算法開發(fā)是人工智能發(fā)展的關鍵因素。該報告將這一指標的考核劃分為兩個部分,一部分是AI人才數(shù)量,另一部分是在AAAI上發(fā)表的論文數(shù)量。
報告稱,中國的研究人員能夠快速復制世界上任何地方開發(fā)的最先進的算法。中國也有大量的AI研究人員和優(yōu)秀的畢業(yè)生,但是在最具創(chuàng)新性的研究領域以及頂級AI人才數(shù)量方面仍與美國有差距。
雖然數(shù)據(jù)顯示,2014年,中國在人工智能研究領域的相關專利注冊和深度學習領域的文章發(fā)布數(shù)量上超過了美國。但是,這并不是一個有質量的證明。該報告稱,根據(jù)人工智能發(fā)展協(xié)會(AAAI)的數(shù)據(jù)顯示,2015年中國學者在AAAI上發(fā)表的論文為138項,占據(jù)全世界的20.5%;而來自美國學者發(fā)表的成果數(shù)量為326項,占比高達48.4%。
另外根據(jù)麥肯錫的數(shù)據(jù)顯示,中國在基礎研究方面落后于美國和英國。盡管中國學者發(fā)表的AI論文在數(shù)量上近年來顯著提升,但在論文被引用數(shù)量上(除去自我引用),美國和英國的AI研究論文更有影響力,被引用的也更多。
報告稱,在AI人才數(shù)量上,2017年美國STEM專業(yè)的畢業(yè)生中,有約78700人從事AI研究,占據(jù)全世界的26.2%。而中國只有約39000人從事AI研究,占全世界AI人才的13.1%。在AI人才上美國處于領先的關鍵在于,美國擁有大量世界一流的大學,擁有更加成熟的人工智能商業(yè)生態(tài)系統(tǒng)。另外在美國,近50%的AI研究人員有超過10年的工作經驗,而在中國只有25%的人有超過10年的工作經驗。所以這不僅僅是AI人才數(shù)量上的差距,AI人才質量上的差距也很大。
【芯智訊注:STEM由科學(Science)、技術(Technology)、工程(Engineer)和數(shù)學(Mathematics)首字母組成,是美國鼓勵學生主修科學、技術、工程及數(shù)學的一項計劃。在美國國土安全局網站上可以查到一個長長的屬于STEM計劃的專業(yè)列表,比如化工、計算機科學、物理、數(shù)學、生物科學和航空航天等理工科?!?/p>
根據(jù)以上的數(shù)據(jù),該報告計算得出,中國在算法與研究指數(shù)上的得分是(13.1+20.5)/2=16.8;美國的得分則是(26.2+48.4)/2=37.3。
4、商業(yè)(占據(jù)25%)
在AI商業(yè)化評分指標方面,該報告主要從以下三個方面來進行比較:
a、人工智能公司數(shù)量:
根據(jù)2017年6月的數(shù)據(jù),全球AI公司總數(shù)約為2542家,其中42%來自美國,而中國則只有23%。報告稱,美國的生態(tài)系統(tǒng)能夠培育出更具競爭力的人工智能創(chuàng)業(yè)公司。
b、2012-2016年對AI公司的總投資額
根據(jù)烏鎮(zhèn)研究所的報告稱,在2012-2016年間,中國對于AI領域的總投資額是26億美元,占據(jù)全球的6.6%;而美國的投資總額則高達172億美元,占據(jù)全球的43.4%。
但是,很多研究數(shù)據(jù)對于“核心人工智能”與“相關產業(yè)”并未完全區(qū)別,因為其界限本來就很模糊。這也使得一些研究機構的數(shù)據(jù)會有較大差異。比如來自IT Juzi和騰訊研究所的另一份報告給出了一個截然不同的估計,該數(shù)據(jù)顯示,美國在AI領域共獲得了148億美元融資,占據(jù)全球51.10%的份額;而中國的融資規(guī)模則為96億美元,占據(jù)全球的33.18%的份額。
報告認為,數(shù)據(jù)相互沖突背后的另一個因素是人工智能領域的快速變化。作為參考,從2014年到2016年,中國新成立AI公司的數(shù)量占中國AI公司總量的55%,這三年中國AI投資的規(guī)模占中國科技企業(yè)總融資總量的90%以上。
另外報告還指出,近年來,大型科技公司競相收購具有領先優(yōu)勢的AI公司來獲取相關技術和市場,有132家美國科技巨頭從收購當中獲益。數(shù)據(jù)顯示,從2012年到2017年7月,全球總共有79次規(guī)模較大的AI企業(yè)收購案。其中美國公司收購了66家AI公司,而中國公司只收購了3家AI公司。
c、2017年AI初創(chuàng)公司全球融資總額
在AI初創(chuàng)公司2017年全球融資總額上,中國AI初創(chuàng)企業(yè)的總融資額占據(jù)全球AI初創(chuàng)企業(yè)融資總額的48%,美國公司總融資額則占據(jù)全球的38%。報告稱,在過去的一年里,中國在AI領域的融資額獲得了爆炸式的增長,要知道2016年中國AI初創(chuàng)企業(yè)的總融資額僅占全球的11.3%。盡管對中國AI領域的規(guī)模的統(tǒng)計數(shù)據(jù)各有不同,但可以肯定的是,中國的AI行業(yè)在過去幾年里在絕對和相對方面都有了顯著的增長。
雖然,在這一項指標上,中國領先美國。但是,該報告也指出,在CB Insight的AI 100榜單中,美國有39家AI創(chuàng)業(yè)公司在榜單之上,而中國只有3家AI創(chuàng)業(yè)公司上榜。
根據(jù)以上數(shù)據(jù),報告計算得出,中國在商業(yè)指數(shù)上的得分是(23+6.6+48)/3=25.9;美國的得分則是(42+43.4+38)/3=41.1。
結論:
從以上四個方面的對比來看,中國雖然再數(shù)據(jù)方面具有較大的領先優(yōu)勢之外,在硬件、算法與研究、商業(yè)化上面與美國仍有較大差距,特別是再硬件上差距更是巨大。
根據(jù)以上四個項目的評分相加再,中國最后的總得分是:5.8+20+16.8+25.9=68.5,美國最后的總得分是:46.2+5.5+37.3+41.1=130.1。
顯然從這個綜合評分來看,中國的AI綜合實力確實只有美國的一半。
國內專家稱該報告不專業(yè),中美差距不會這么大?
對于此份報告的內容,國內有專家稱中美在AI領域確實存在一定差距,比如在半導體、芯片等方面確實差距比較大。但從整體實力上看,中美AI差距或許并沒有那么大。
國內相關專家表示:“首先,該報告選取的評判要素、標準不夠全面,值得商榷。其次,該報告的數(shù)據(jù)不全面。比如在對AI公司的總投資額和AI初創(chuàng)企業(yè)融資額上,數(shù)據(jù)不太準確,中國在AI領域的跨國并購和對初創(chuàng)企業(yè)投資的速度在加速,從國家資本到民營機構都非常看重對優(yōu)質AI公司的投入,而且力度非常大。第三,中國在商業(yè)化領域的落地能力較強,這項指標沒有加入,比如圖像識別在中國市場的應用已經非常廣泛,反觀美國則比較滯后?!?/p>
不過在芯智訊看來,這份報告還是比較有參考意義的,首先決定AI綜合實力的關鍵因素,技術(包括硬件和軟件)、人才、資金、商業(yè)化等方面,該報告都有覆蓋。雖然國內有專家認為“中國在商業(yè)化領域的落地能力較強,這項指標沒有加入”,但是實際上,中國的這項優(yōu)勢是體現(xiàn)在了該報告當中的“數(shù)據(jù)”項上。正因為中國的人口、網絡用戶以及互聯(lián)網上的優(yōu)勢,才使得中國的AI能夠有足夠大量的數(shù)據(jù)訓練,從而能夠快速的進入到實際應用。而且同樣也是因為用戶基數(shù)夠大,所以各項的應用能夠被快速的推廣,而AI在應用端的快速和廣泛的部署,也進一步促進了更多數(shù)據(jù)的產生和數(shù)據(jù)的價值化,進一步強化了中國在這塊的優(yōu)勢。
另外,該報告所引用的數(shù)據(jù)也都還是相對比較權威的數(shù)據(jù),其所展現(xiàn)的中美在AI領域的差距,也與之前據(jù)騰訊研究院發(fā)布的《中美兩國人工智能產業(yè)發(fā)展全面解讀》的報告所反應的基本相符。
此前,騰訊研究院發(fā)布的《中美兩國人工智能產業(yè)發(fā)展全面解讀》顯示,在AI基礎研究和人才領域,美國基礎層人才數(shù)量是中國的13.8倍,世界人工智能排名前20的大學中,美國占16所,中國一所都沒有。目前中國只有不到30所大學擁有專注于AI的研究室,其中僅有清華大學、中國科技大學等少數(shù)幾所高校在國際有一定競爭力。
在AI企業(yè)數(shù)量和融資方面,截止到2017年6月,全球AI企業(yè)總數(shù)為2542家,其中美國1078家,占42%;中國592家只占23%。美國的AI企業(yè)數(shù)量是中國的近兩倍。另外在AI九大熱門領域,美國的融資額更是達到了中國的23倍。特別是在AI處理器/芯片這種基礎層領域,美國企業(yè)的數(shù)量也大大超過中國,是中國企業(yè)數(shù)量的2.3倍。
這些數(shù)據(jù)也都反應了中國與美國在人工智能領域的實際差距。雖然我們在人工智能應用端確實走在了世界前列,比如國內語音識別已經開始在智能家居上的廣泛應用,以人臉識別為代表的機器視覺在國內各領域都開始有廣泛應用(比如刷臉支付、智能安防),但是我們不能忽視在應用之上的更為核心的在硬件芯片、軟件算法等方面差距。這就好比中國的智能手機產業(yè),雖然全球智能手機大都是中國生產的,而且全球前五的智能手機廠商當中,中國已占據(jù)了3席,但是智能手機的眾多核心器件乃至安卓系統(tǒng)都是掌握在美國廠商手中。同樣,對于中國目前AI產業(yè)的繁榮我們也應該清楚的認識到中美之間的差距,我們還有很多的薄弱環(huán)節(jié)需要去彌補。