人工智能是未來數(shù)年的主流和趨勢,它是由算法、算力和數(shù)據(jù)組成,而算力的決定性因素就是AI芯片。目前全球從事AI芯片研究的企業(yè)接近百家,未來可能會更多,因為AI芯片分很多種,應(yīng)用場景的多樣化決定其芯片不一樣。以云端和終端的芯片最多,其中大概有二三十家能成為主流的芯片,看看它們是哪些吧!
一、高通
高通一直在和Yann LeCun在Facebook AI研究機構(gòu)的團隊保持合作,共同開發(fā)用于實時推理的新型芯片。高通一直專注于智能手機、汽車和機器人等終端側(cè)人工智能的研究。高通的驍龍AI芯片,在高度集成的系統(tǒng)級芯片中提供異構(gòu)計算的能力,成為目前眾多AI手機的標(biāo)配。。
二、英偉達
英偉達發(fā)布了一塊新型芯片,極大的推動了機器學(xué)習(xí)的極限。這款特斯拉P100 GPU可以執(zhí)行深度學(xué)習(xí)神經(jīng)網(wǎng)絡(luò)任務(wù),速度是英偉達之前高端系統(tǒng)的12倍。據(jù)英偉達表示,P100是英偉達傾力之作,研發(fā)費用高達20億美元,在一個芯片上有1500億個晶體管,使得它成為世界上最大的芯片。除了機器學(xué)習(xí),P100還能進行各種高性能的計算任務(wù),英偉達只是想讓你們知道這款芯片非常擅長機器學(xué)習(xí)。
三、蘋果
蘋果正在研發(fā)一款專門處理人工智能相關(guān)任務(wù)的芯片,他們內(nèi)部將其稱為蘋果神經(jīng)引擎。據(jù)稱,這塊芯片將能夠改進蘋果設(shè)備在處理需要人工智能的任務(wù)時的表現(xiàn),如面部識別和語音識別等,新A11 Bionic神經(jīng)引擎采用多核設(shè)計,實時處理速度最高每秒可以達到6000億次。
四、谷歌
谷歌的人工智能相關(guān)芯片就是TPU,也就是Tensor Processing Unit。TPU是專門為機器學(xué)習(xí)應(yīng)用而設(shè)計的專用芯片,通過降低芯片的計算精度,減少實現(xiàn)每個計算操作所需的晶體管數(shù)量,從而能讓芯片的每秒運行的操作個數(shù)更高,這樣經(jīng)過精細調(diào)優(yōu)的機器學(xué)習(xí)模型就能在芯片上運行的更快,進而更快的讓用戶得到更智能的結(jié)果。
五、微軟
微軟蟄伏六年,打造出了一個迎接AI世代的芯片。那就是Project Catapult。這個FPGA目前已支持微軟Bing,未來它們將會驅(qū)動基于深度神經(jīng)網(wǎng)絡(luò)——以人類大腦結(jié)構(gòu)為基礎(chǔ)建模的人工智能——的新搜索算法,在執(zhí)行這個人工智能的幾個命令時,速度比普通芯片快上幾個數(shù)量級。
六、IBM
百年巨人IBM,在很早以前就發(fā)布過wtson,現(xiàn)在他的人工智能機器早就投入了很多的研制和研發(fā)中去。而在去年,他也按捺不住,投入到類人腦芯片的研發(fā),那就是TrueNorth,郵票大小、重量只有幾克,但卻集成了54億個硅晶體管,內(nèi)置了4096個內(nèi)核,100萬個“神經(jīng)元”、2.56億個“突觸”,能力相當(dāng)于一臺超級計算機,功耗卻只有65毫瓦。
七、三星
看到蘋果和華為在AI芯片上投入巨大,三星自然不甘落后。近日,據(jù)韓國媒體報道,三星將在今年推出一款NPU,它們已經(jīng)完成第一款神經(jīng)處理單元的開發(fā)工作,這款芯片將用在自己的手機上。除了這款芯片,它們也在研發(fā)新的AI服務(wù)器芯片,準(zhǔn)備將這款芯片賣給其它服務(wù)器廠商。
八、寒武紀(jì)
寒武紀(jì)于2016年發(fā)布全球首款商用深度學(xué)習(xí)專用處理器IP——寒武紀(jì)1A處理器打破了多項記錄,入選了第三屆世界互聯(lián)網(wǎng)大會評選的十五項“世界互聯(lián)網(wǎng)領(lǐng)先科技成果”。這款處理器基于寒武紀(jì)科技所發(fā)明的國際首個人工智能專用指令集,具有完全自主知識產(chǎn)權(quán),在若干關(guān)鍵人工智能應(yīng)用上實測,寒武紀(jì)1A達到了傳統(tǒng)的四核通用CPU 25倍以上的性能和50倍以上的能效。
九、中星微
中星微電子推出量產(chǎn)的“NPU”芯片。對于企業(yè)而言,實現(xiàn)量產(chǎn)是定義‘首款’NPU芯片的標(biāo)準(zhǔn)。中星微CTO張韻東博士介紹,“星光智能一號”VC0758可以支持Caffe、TensorFlow等多種神經(jīng)網(wǎng)絡(luò)框架,支持AlexNet、GoogleNet等各類神經(jīng)網(wǎng)絡(luò)。每個NPU具有4個內(nèi)核,每個內(nèi)核有兩個數(shù)據(jù)流處理器,每個流處理器具有8個長位寬或16個長位寬的SIMD運算單元。
十、紫光展銳
紫光展銳作為國內(nèi)出貨量最大的芯片廠商之一,其中低端芯片在非常占有率很高。對于AI芯片這塊藍海,它們也不會放過的,2018年,紫光展銳發(fā)布了首款支持人工智能應(yīng)用的8核LTE SoC芯片平臺—紫光展銳SC9863。面向全球主流市場,可實現(xiàn)AI運算與應(yīng)用,提升移動終端的智能化體驗。據(jù)悉,紫光展銳SC9863集成了LTE芯片,采用Cortex-A55架構(gòu),八核心設(shè)計,主頻1.6GHz。相比A53,性能提升了20%,AI處理能力提升了6倍。
十一、思必馳
本來可以安心的做語音,可是語音進展慢,AI芯成為它們推向市場的一款殺手锏。2019年,思必馳發(fā)布AI芯片——深聰TAIHANG芯片(TH1520),據(jù)介紹,TH1520是一款聚焦于語音應(yīng)用場景下的AI專用芯片,主要面向智能家居、智能終端、車載、手機、可穿戴設(shè)備等各類終端設(shè)備。TH1520進行了算法硬件優(yōu)化,基于雙DSP架構(gòu),內(nèi)部集成codec編解碼器以及大容量的內(nèi)置存儲單元,TH1520采用了AI指令集擴展和算法硬件加速的方式,使其相較于傳統(tǒng)通用芯片具有10X以上的效率提升。
十二、云知聲
2018年,云知聲在北京召開新品發(fā)布會,正式推出全球首款面向物聯(lián)網(wǎng)的AI芯片——UniOne。該芯片由云知聲自主設(shè)計研發(fā),采用云知聲自主AI指令集,擁有具備自主知識產(chǎn)權(quán)的DeepNet、uDSP(數(shù)字信號處理器),支持DNN/LSTM/CNN等多種深度神經(jīng)網(wǎng)絡(luò)模型,性能較通用方案提升超50倍。
十三、深鑒科技
據(jù)悉,深鑒推出過六款A(yù)I產(chǎn)品,分別是人臉檢測識別模組、人臉分析解決方案、視頻結(jié)構(gòu)化解決方案、ARISTOTLE架構(gòu)平臺,深度學(xué)習(xí)SDK DNNDK、雙目深度視覺套件。芯片方面,公布了最新的芯片計劃,由深鑒自主研發(fā)的芯片“聽濤”、“觀?!币呀?jīng)面市。
十四、比特大陸
2017年,比特大陸發(fā)布了全球首款公開發(fā)售的TPU(Tensor Processing Unit張量計算單元)芯片BM1680,專門用于人工智能中的深度學(xué)習(xí)加速。2018年,比特大陸又推出其第二款TPU芯片BM1682,BM1682是一塊專門用于圖像/視頻處理方向的人工智能芯片。
十五、華為
2018年10月10日,在第三屆HUAWEI CONNECT 2018(華為全聯(lián)接大會)上,華為輪值董事長徐直軍公布了華為自主研發(fā)的全球首個覆蓋全場景人工智能的Ascend系列芯片。徐直軍正式宣布了華為自研的人工智能昇騰芯片(Ascend)的存在,并同時公布了其中的兩款——昇騰910和昇騰310,其中昇騰910(Ascend 910)是目前全球已發(fā)布的單芯片計算密度最大的AI芯片,昇騰310(Ascend 310)則是目前面向計算場景最強算力的AI SoC。
十六、百度
百度在2018年百度AI開發(fā)者大會上宣布推出云端全功能AI芯片“昆侖”,“昆侖”是中國第一款云端全功能AI(人工智能)芯片,也是業(yè)內(nèi)設(shè)計算力最高的AI芯片。它的運算能力比最新基于FPGA的AI加速器,性能提升了近30倍。
總結(jié)
AI芯片也被稱為AI加速器或計算卡,即專門用于處理人工智能應(yīng)用中的大量計算任務(wù)的模塊(其他非計算任務(wù)仍由CPU負責(zé))。當(dāng)前,AI芯片主要分為 GPU 、FPGA 、ASIC。AI的許多數(shù)據(jù)處理涉及矩陣乘法和加法,大量并行工作的GPU提供了一種廉價的方法,但缺點是更高的功率。
AI芯片該使用什么方法原理去實現(xiàn),目前沒定論,而人們的研究主要集中在如何更好的適應(yīng)已有的數(shù)據(jù)流式處理模式進行的芯片優(yōu)化設(shè)計。很多的AI芯片包括現(xiàn)成的CPU,GPU,F(xiàn)PGA和DSP的各種組合,未來AI芯片的趨勢是怎樣,還沒有一個明確的定論。