人工智能(AI)市場持續(xù)升溫,但產(chǎn)業(yè)對于這些系統(tǒng)應(yīng)如何建構(gòu)仍十分分歧,大型科技公司動輒投入數(shù)十億美元購并新創(chuàng)公司或支持研發(fā),各國政府也提供大學(xué)和研究機構(gòu)大筆研究經(jīng)費,希望在這波AI競賽中脫穎而出。
據(jù)Semiconductor Engineering報導(dǎo),研究機構(gòu)Tractica的數(shù)據(jù)顯示,全球AI市場規(guī)模將在2025年成長至368億美元,只不過目前對于AI的定義或是需要分析的數(shù)據(jù)類型都還沒有共識,OneSpin Solutions總裁暨執(zhí)行長Raik Brinkmann指出,眼下有三個問題需要解決,第一是大量待處理的數(shù)據(jù),其次是并行處理和互連技術(shù),第三則是移動大量數(shù)據(jù)導(dǎo)致的耗能問題。
目前市場首批AI芯片幾乎都是以現(xiàn)成的CPU、GPU、FPGA和DSP加以組合而成,盡管英特爾(Intel)、Google、NVIDIA、高通(Qualcomm)和IBM等公司正研發(fā)新的設(shè)計,最后誰能勝出仍不明朗。無論如何,這些系統(tǒng)仍需有至少一個CPU負(fù)責(zé)控制,但可能需要不同類型的協(xié)同處理器。
AI處理多牽涉到矩陣乘法和加法,使用并行運作的GPU成本較低,但缺點是耗能較高。內(nèi)建DSP區(qū)塊和本地存儲器的FPGA可獲得較佳的能源效率,但價格比較昂貴。Mentor Graphics董事長暨執(zhí)行長Wally Rhines表示,有些人使用標(biāo)準(zhǔn)GPU執(zhí)行深度學(xué)習(xí),同時也有許多人采用CPU,為了達(dá)到使類神經(jīng)網(wǎng)路行為更像人腦的目標(biāo),刺激了新的一波設(shè)計浪潮。
視覺處理是目前最受關(guān)注的AI區(qū)塊,目前大部分的AI研究與自動駕駛使用的視覺處理有關(guān),這項技術(shù)在無人機和機器人方面的應(yīng)用也與日俱增。Achronix公司總裁暨執(zhí)行長Robert Blake指出,影像處理的運算復(fù)雜度很高,市場需要5~10年時間沉淀,不過因為變數(shù)精度(variable precision arithmetic)運算需要,可程式邏輯元件的角色會更吃重。
FPGA非常適合矩陣乘法,可程式化特性增加了設(shè)計上的彈性,用來做決策的數(shù)據(jù)部分會在本地處理,部分則由數(shù)據(jù)中心進(jìn)行,但兩者的比例會因應(yīng)用的不同而改變,并影響AI芯片和軟件設(shè)計。
目前汽車使用的AI技術(shù)主要是偵測和避免物體,這和真正的人工智能還有段差距。真正的AI應(yīng)該具有一定程度的推理,例如判斷如何閃避正在穿越馬路的人群。前者的推論為根據(jù)傳感器輸入的大量數(shù)據(jù)處理和預(yù)編程行為得來,后者則能夠作出價值判斷,思考各種可能后果以找出最佳選擇。
這樣的系統(tǒng)需要極高的頻寬并內(nèi)建安全機制,此外還必須能保護數(shù)據(jù)安全,許多根據(jù)現(xiàn)成零件開發(fā)的設(shè)計很難兼顧運算和編程效率。Google試圖以專為機器學(xué)習(xí)開發(fā)的TPU特殊應(yīng)用芯片改變這樣的方程式,并開放TensorFlow平臺以加快AI發(fā)展速度。
第一代AI芯片將重點放在運算能力和異質(zhì)性,但這就像早期的IoT裝置,在不確定市場如何演變的情況下,業(yè)者只好把所有東西都加進(jìn)去,之后再找出瓶頸,針對特定功能設(shè)計,取得功率和性能上的平衡。
隨著自駕車使用案例的增加,AI應(yīng)用范圍也會逐漸擴大,這也是為何英特爾在2016年8月收購Nervana的原因。Nervana開發(fā)的2.5D深度學(xué)習(xí)芯片利用高性能處理器核心將數(shù)據(jù)從載板移到高頻寬存儲器,希望比GPU解決方案縮短100倍的深度學(xué)習(xí)模型訓(xùn)練時間。
量子運算則是AI系統(tǒng)的另一個選擇。IBM研究部門副總裁Dario Gil解釋,如果4張卡片中有3張藍(lán)卡1張紅卡,使用傳統(tǒng)運算猜中紅卡的機率為4分之1,使用量子電腦及疊加量子位元的糾纏(entanglement),系統(tǒng)每次都可以提供正確答案。
AI并沒有所謂最適合的單一系統(tǒng),也沒有一種應(yīng)用可以吃遍各種市場,這些進(jìn)一步的細(xì)分市場都需要再精致化、再擴大尋找可用工具,并需要生態(tài)系統(tǒng)來支持,但低功率、高吞吐量及低延遲則是AI系統(tǒng)的通用需求。半導(dǎo)體產(chǎn)業(yè)經(jīng)過多年仰賴制程微縮元件以改善功率,性能和成本,如今則需要重新思考進(jìn)入新市場的方法。