《電子技術(shù)應(yīng)用》
您所在的位置:首頁 > EDA與制造 > 業(yè)界動態(tài) > 深扒百度昆侖,造芯靠什么?

深扒百度昆侖,造芯靠什么?

2021-03-18
來源:半導(dǎo)體行業(yè)觀察
關(guān)鍵詞: 百度昆侖 造芯

  3月15日,據(jù)路透社報道,百度昆侖芯片業(yè)務(wù)完成獨(dú)立融資,投后估值約130億元人民幣,領(lǐng)投方為CPE,跟投方IDG、君聯(lián)資本、元禾璞華。據(jù)了解,百度正在考慮將其人工智能芯片設(shè)計能力進(jìn)行商業(yè)化,目的是將昆侖部門打造成一家獨(dú)立的公司。

  如今互聯(lián)網(wǎng)科技企業(yè)造芯已不是什么新鮮事,尤其是AI領(lǐng)域已經(jīng)成為世界科技巨頭爭奪的制高點, IBM,微軟,谷歌和亞馬遜正在微調(diào)其AI平臺,以使客戶更輕松,更快捷地整合各種AI技術(shù)。

  可以說,造芯熱幾乎與人工智能的爆發(fā)處于同一個階段,人工智能的這一輪爆發(fā)是深度學(xué)習(xí)算法的興起,而深度學(xué)習(xí)的基礎(chǔ)就是需要更多的數(shù)據(jù)訓(xùn)練、更高的算力支撐。當(dāng)傳統(tǒng)芯片逐漸無法滿足互聯(lián)網(wǎng)爆發(fā)的算力需求時,擁有先進(jìn)算法和強(qiáng)大計算能力的互聯(lián)網(wǎng)公司成為了芯片自研的推動者,國內(nèi)外企業(yè)幾乎步調(diào)一致地各自開啟了這一篇章。

  中國在進(jìn)入其市場方面的行動將在該行業(yè)的創(chuàng)新中發(fā)揮關(guān)鍵作用。根據(jù)一項研究,中國現(xiàn)在占全球半導(dǎo)體消費(fèi)的60%。根據(jù)《國際商業(yè)戰(zhàn)略》,2019年,中國半導(dǎo)體行業(yè)銷售額為2122億美元,北美為595億美元,世界其他地區(qū)為488億美元,歐洲為418億美元,日本為387億美元。

 2(1).png

  圖:2019年按地區(qū)劃分的全球半導(dǎo)體消費(fèi)(十億)

  目前,國產(chǎn)AI芯片處于一個窗口,這個窗口有如下特征:1、市場廣闊,容納下許多巨頭玩家;2、處于爆發(fā)期初期,大規(guī)模應(yīng)用尚未到來;3、應(yīng)用場景分散、復(fù)雜度高,需要定制化;4、單獨(dú)芯片不夠,需要配套的解決方案支撐。

  在這樣的大背景下,對“AI第一股”百度而言,造芯能抓住其中的哪些機(jī)會,競爭力又有多少?

  問世2年多,昆侖幾何?

  衡量一款芯片好不好,成不成功,最直觀的就是看出貨量。百度昆侖于2018年宣布,2019年12月,百度和三星宣布,百度首款基于云的產(chǎn)品昆侖第一代用于計算和邊緣計算的AI芯片已經(jīng)完成。

  截至目前,實現(xiàn)量產(chǎn)的百度昆侖1已在百度搜索引擎及云計算用戶部署2萬片。與國內(nèi)其他互聯(lián)網(wǎng)造芯玩家的產(chǎn)品相比,百度昆侖1的出貨量可以說是不錯的。

  從技術(shù)結(jié)合場景的經(jīng)驗來看,新一批崛起的AI 芯片要針對不同的人工智能應(yīng)用類型和場景,對于芯片的要求就不單單是要適合深度學(xué)習(xí),需要兼顧計算能力、能耗和靈活性。

 3(1).png

  云計算巨頭紛紛布局云計算+FPGA芯片,首先因為FPGA作為一種可編程芯片,非常適合部署于提供虛擬化服務(wù)的云計算平臺之中。FPGA的靈活性,可賦予云服務(wù)商根據(jù)市場需求調(diào)整FPGA加速服務(wù)供給的能力。

  運(yùn)算速度、功耗等性能是衡量一款芯片的核心指標(biāo)。昆侖芯片定位為通用AI芯片,目標(biāo)是提供高性能,低成本,高度靈活的AI芯片。特別要指出的是,昆侖芯片既能做訓(xùn)練也能做推理,它可以滿足AI的高處理需求,用于云實例和邊緣實例,包括數(shù)據(jù)中心,公共云和自動駕駛汽車。據(jù)了解,昆侖2將采用7nm工藝打造,將于2021年實現(xiàn)量產(chǎn),其性能對1代,將再提升3倍。

  一份經(jīng)紀(jì)報告顯示:“這種大型的,基于云的,具有高計算能力的AI芯片具有很高的技術(shù)門檻。只有百度,華為和寒武紀(jì)才能生產(chǎn)這些產(chǎn)品。”

  在昆侖芯片誕生前,2017年百度內(nèi)部數(shù)據(jù)中心、自動駕駛系統(tǒng)等就已大規(guī)模使用部署了超過10000片F(xiàn)PGA加速器,這對跨行業(yè)跨場景測試?yán)鲂酒蛳铝顺醪交A(chǔ)。隨后,在部署上線的微億智造工業(yè)智能質(zhì)檢設(shè)備上,百度智能云以整機(jī)一體化方式,向微億智造交付搭載百度昆侖芯片的百度云質(zhì)檢一體機(jī)。

  僅僅硬件遠(yuǎn)遠(yuǎn)不夠,一個整體的解決方案對商業(yè)化落地也至關(guān)重要。百度提出了AI-Native的云計算架構(gòu),從基礎(chǔ)設(shè)施的AI計算集群、AI芯片,到工程平臺的飛槳、云原生,以及應(yīng)用開發(fā)平臺的視頻云、區(qū)塊鏈等,通過云智一體、端到端的方式,支持產(chǎn)業(yè)的智能應(yīng)用。

  當(dāng)然,無形財產(chǎn)的積累對以科技為導(dǎo)向的企業(yè)來說也是至關(guān)重要的一環(huán),手機(jī)芯片玩家高通光靠專利費(fèi)就吃透了全世界。在AI專利申請和許可方面,百度已連續(xù)三年位居中國第一,百度AI開放平臺也已經(jīng)匯集了265萬開發(fā)者。

  百度在其他地區(qū)的市場份額不大,與成熟的競爭對手競爭也將非常艱難。但盡管如此,在當(dāng)前大環(huán)境下,昆侖芯片如今的量產(chǎn)和交付進(jìn)展卻凸顯了AI在中國的整體發(fā)展勢頭,也代表了中國企業(yè)在這一新興領(lǐng)域確立全球領(lǐng)導(dǎo)者的決心。

  其實在AI領(lǐng)域,中國一直沒有落后。據(jù)斯坦福大學(xué)發(fā)布的一份222頁的《2021年度AI指數(shù)報告》指出,2020年,中國在世界人工智能期刊上的引用頻次首次超過美國。在刊登數(shù)量上,早在2004年,中國在人工智能期刊的總發(fā)表數(shù)量上短暫超過美國,然后在2017年重新占據(jù)領(lǐng)先地位。

 4(1).png

  中國在世界人工智能期刊上的引用頻次首次超過美國

  定制、魔改、二次開發(fā)

  早在2011年百度啟動了FPGA AI加速器項目,2015年的FPGA部署已經(jīng)超過5000片,2017年成為業(yè)界部署最多的,超過了12000片;2018年百度發(fā)布自主研發(fā)的AI芯片——百度昆侖;2019年流片成功,2020年昆侖一代開始量產(chǎn)并且大規(guī)模部署。

  關(guān)于昆侖芯片的細(xì)節(jié)我們不做過多的贅述,但是值得一提的是,往往GPU是打造AI芯片的重要手段之一,但是我們也可以看出,百度從一開始卻是基于FPGA打造的,F(xiàn)PGA的特點就是可編程,這樣使用昆侖芯片的用戶,就完全可以根據(jù)自己的應(yīng)用場景來進(jìn)行定制、魔改、二次開發(fā)。

  由于AI應(yīng)用場景的分散和復(fù)雜度高,定制化就顯得格外重要。FPGA作為一種可編程芯片,非常適合部署于提供虛擬化服務(wù)的云計算平臺之中。昆侖芯片配以FPGA的靈活性,可讓用戶可以按照自己的需求和應(yīng)用場景進(jìn)行專項定制,魔改,二次開發(fā),實現(xiàn)更快速的市場普及,并能完成自身產(chǎn)品的后續(xù)迭代。

  在性能方面,百度昆侖性能最高比英偉達(dá)T4強(qiáng)三倍。放大到全球的AI芯片,據(jù)麻省理工學(xué)院林肯實驗室超級計算中心的一項統(tǒng)計研究《機(jī)器學(xué)習(xí)加速器的調(diào)查和基準(zhǔn)測試》,在全球公開宣布的人工智能加速器和處理器的性能與功率分散圖中,我們也可以看出,昆侖芯片性能也處于高位(如下圖)。下圖顯示了最近公開發(fā)布的一些AI處理器能力(截至2019年5月),列出了芯片的峰值性能與功耗。

 5(1).png

  公開宣布的人工智能加速器和處理器的性能與功率分散圖(圖源:MIT《機(jī)器學(xué)習(xí)加速器的調(diào)查和基準(zhǔn)測試》研究)

  注:其中x軸表示峰值功率,y軸表示每秒千兆次操作的峰值。處理能力的計算精度由所采用的幾何形狀來描述;計算精度范圍從單個位int1到單個字節(jié)int8,從4字節(jié)float 32到8字節(jié)float 64。形狀因子由顏色來描述,這對于顯示消耗了多少能量很重要,而且對于顯示在單個芯片、單個PCI卡和整個系統(tǒng)中可以裝載多少計算量也很重要。藍(lán)色僅是單個芯片的性能和功耗。橙色表示芯片的性能和功率(注意,它們都在200-300W區(qū)域)。綠色表示整個系統(tǒng)的性能和能力——在這里是單節(jié)點桌面和服務(wù)器系統(tǒng)。

  眾所周知,“AI應(yīng)用場景碎片化、落地難”已成行業(yè)共識,在AI芯片前仆后繼的大軍中,泡沫過后,許多企業(yè)已銷聲匿跡,僅留下了為數(shù)不多的十幾家。百度又能靠什么?

  造芯者不但需要懂硬件,還需要懂AI算法軟件。據(jù)了解,百度昆侖作為百度人工智能平臺的核心組件,可以原生支持開源深度學(xué)習(xí)框架飛槳(PaddlePaddle),百度機(jī)器學(xué)習(xí)平臺(BML)及各垂類的AI 能力引擎。另外,昆侖不僅支持全球主流CPU、操作系統(tǒng),Pytorch和 TensorFlow 等深度學(xué)習(xí)框架,也和國產(chǎn)化廠商密切合作支持飛騰、申威和海光等國產(chǎn)CPU,麒麟、深度和統(tǒng)信等國產(chǎn)操作系統(tǒng)。

  此外,生態(tài)能力在芯片行業(yè)中尤為關(guān)鍵,而且放在自家產(chǎn)品上可盡顯其性價比優(yōu)勢。

  其實這點我們可以從華為麒麟芯片得到啟發(fā),因為有手機(jī)終端的不斷試錯和支持,麒麟芯片才能在迭代中不斷創(chuàng)新,二者相輔相成,最終成就一段手機(jī)史上的佳話。百度亦是如此,相比其他單打獨(dú)斗的AI芯片企業(yè),它有大公司的生態(tài)優(yōu)勢。百度完全不用有一般AI芯片廠商的擔(dān)憂:“我該做什么樣的芯片?芯片做出來能否迎合市場的需求?又將用在什么場景?”因為百度有太多的應(yīng)用場景了,智能音箱、智能駕駛Apollo、智能云等等,這些對百度整體業(yè)務(wù)都形成一個大循環(huán)。

  特斯拉也是一樣。在特斯拉自研FSD芯片前,需要采用英偉達(dá)的芯片,不僅在性能上滿足不了特斯拉的需求,而且成本還高昂,完全不具有話語權(quán)。此后,特斯拉自己研發(fā)芯片竟達(dá)到了與英偉達(dá)相同乃至更好的效果,成本也把控在自己手里。

  在造芯策略上,百度與當(dāng)下國際互聯(lián)網(wǎng)巨頭如亞馬遜、谷歌、微軟等如出一轍,自產(chǎn)自用為主,但同時也注意為芯片建生態(tài),芯片又反哺生態(tài)。未來隨著智能汽車逐漸爆發(fā),云計算、物聯(lián)網(wǎng)市場的大幅度需求,百度或?qū)⒈煌粕蠚v史的潮頭。

 

本站內(nèi)容除特別聲明的原創(chuàng)文章之外,轉(zhuǎn)載內(nèi)容只為傳遞更多信息,并不代表本網(wǎng)站贊同其觀點。轉(zhuǎn)載的所有的文章、圖片、音/視頻文件等資料的版權(quán)歸版權(quán)所有權(quán)人所有。本站采用的非本站原創(chuàng)文章及圖片等內(nèi)容無法一一聯(lián)系確認(rèn)版權(quán)者。如涉及作品內(nèi)容、版權(quán)和其它問題,請及時通過電子郵件或電話通知我們,以便迅速采取適當(dāng)措施,避免給雙方造成不必要的經(jīng)濟(jì)損失。聯(lián)系電話:010-82306118;郵箱:aet@chinaaet.com。