《電子技術應用》
您所在的位置:首頁 > 通信與網絡 > 業(yè)界動態(tài) > 為什么還用A76 ? 麒麟990 詳細解析

為什么還用A76 ? 麒麟990 詳細解析

2019-09-15
關鍵詞: A76 麒麟990

  昨天,華為在德國柏林和北京同時發(fā)布最新一代旗艦芯片麒麟990系列,包括麒麟990和麒麟990 5G兩款芯片。兩款芯片在性能與能效、AI智慧算力及ISP拍攝能力等方面進行全方位升級。這標志著,華為在5G和端側AI兩大領域同時實現了全球引領。

640.webp (16).jpg

  兩款SoC:麒麟990(4G)和麒麟990 5G

  隨著我們進入5G時代,現在市場上出現了分差,很多區(qū)域還沒有準備好5G,因此迫切更換到5G手機的需求不是特別大。所以4G手機將會和5G手機共存一段時間。華為不是為這兩個市場提供單一解決方案,而是首次將其戰(zhàn)略與兩種版本的麒麟990分開。

  這些版本將正式稱為麒麟990和麒麟990 5G。兩個麒麟芯片組和標準基本級基本相同。相同的核心配置,相同的相機支持,相同的內存,相同的存儲。但是,在調制解調器之外的一些關鍵領域,存在差異,例如NPU性能和核心頻率。我們稍后會討論這些問題。但值得強調的是,麒麟990 5G版本是如何展望未來的。

  現在高通、三星每家公司都宣布了自己的分立式5G調制解調器,這意味著我們有一個帶有4G的標準處理芯片,然后還需要外掛一片5G支持芯片。這樣做及增大了成本又增加了線路板的面積。

  因此如果要獲得最佳性能,5G芯片應集成在同一硅片上,在5G模式下實現更高的效率,以換取芯片面積和設計復雜性。

  華為是第一家為智能手機市場做到這一點的公司。

640.webp (15).jpg

  Kirin 990 5G是一種真正的統(tǒng)一設計,支持SA和NSA架構上的Sub-6 GHz 5G網絡。為了控制芯片尺寸,華為正在使用臺積電最新的7nm+制造工藝和EUV,這有助于為芯片進入的各種器件實現更小的芯片尺寸。

  到目前為止,無論是高通還是三星都沒有統(tǒng)一的接近商業(yè)化的旗艦芯片設計。(雖然早前聯發(fā)科近日也推出了集成5G SOC,但是首部搭載該款芯片的手機要到明年推出)。

  麒麟990系列詳情

  這次麒麟 990 5G 挑戰(zhàn)了芯片工藝物理極限,在一顆指甲大小的芯片上集成了 103 億晶體管,是目前晶體管數最多、功能最完整、復雜度最高的 5G SoC。與此前的麒麟980相比晶體管增加44億個。

640.webp (14).jpg

  由于采用了TSMC的7FF+和EUV,這使得芯片面積并沒有增加太多。

  麒麟980 5G芯片面積僅100平方毫米(4G版本80億晶體管,面積90平方毫米),麒麟980(TSMC 7納米,69億晶體管)為74.13平方毫米而麒麟970(TSMC 10納米,55億晶體管)則達到了96.72平方毫米。可見7FF+工藝的帶來的芯片面積減小相當的可觀。

640.webp (13).jpg

  CPU

  兩個SoC的核心配置相同 - 兩個高頻A76內核,兩個中頻A76內核和四個更高效的A55內核。它們分為各自的功率和頻率域,可根據工作負載提供更好的靈活性。然而,基于7和7+過程之間的差異,990 5G和990 4G的頻率會略有不同。

  對于高速緩存,所有四個A76內核都具有512kB L2,而A55內核各為128 kB。

  從技術上講,華為將A76內核稱為“基于A76”,因為對緩存系統(tǒng)中的內核進行了一些增強,以改善內存延遲。華為不會說它的“SmartCache”實現有助于GPU,也可以幫助CPU和NPU。我們認為這基本上是DynamiQ DSU之上的下一級緩存,類似于高通和三星的實施。

640.webp (12).jpg

  這里有一個側面說明:我們原本預計華為將在今年早些時候宣布推出采用Arm最新A77核心的全新麒麟。盡管作為Arm合作伙伴的優(yōu)先成員,該公司的技術團隊向我們解釋了兩件事:首先,兩年前核心決策是針對這款芯片做出的,但除此之外,他們沒有看到臺積電的A77預期頻率。7nm工藝。

640.webp (11).jpg

  華為表示,雖然A77達到了更高的峰值性能,但A77和A76在7nm上的功率效率實際上是相同的,但是由于A76在7nm上的體驗更好,他們能夠將核心頻率推得更高。據報道,其他擁有A77產品的公司在其他晶圓廠采用類似的工藝技術時,只能達到2.2 GHz。據說A77很可能會在未來的產品中出現,最有可能的是當5nm變得更加廣泛可用。

  此外關于LPDDR5支持的話題,華為表示LPDDR5仍然是一項昂貴的技術,正在考慮未來的產品中使用。

  GPU

  提高核心,降低主頻。麒麟990 采用了16核Mali-G76實現,高于麒麟980中的10核Mali-G76。

640.webp (10).jpg

640.webp (9).jpg

  部分原因是芯片尺寸增加:華為認為更低的電壓,更低的頻率但更寬的GPU將提供更好的芯片整體。

  隨著我們從10核750 MHz設計轉向16核700 MHz設計,GPU的性能有所提升。

  NPU

  除了實現了內置5G調制解調器,麒麟990最大的變化將是NPU。

  在麒麟970和麒麟980 中,華為直接采用了寒武紀公司提供的NPU許可。隨著麒麟810以及最新的990的問世,已經完全轉向了采用華為自研達芬奇架構的NPU。

640.webp (8).jpg

  在AI+5G的全新賽道,麒麟990 5G將再度引領AI潮流。麒麟990 5G是首款采用華為自研達芬奇架構NPU的旗艦級芯片,創(chuàng)新設計NPU雙大核+NPU微核計算架構,NPU大核展現卓越性能與能效,微核NPU實現超低功耗。達芬奇架構是華為在2018年推出的全新自研AI計算架構,基于其靈活可裁剪的特性,華為面向全場景推出昇騰(Ascend)系列芯片,可用于小到幾十毫瓦,大到幾百瓦的訓練場景,橫跨全場景提供最優(yōu)算力,而此次麒麟990 5G搭載的正是面向智能手機場景的Ascend Lite和Ascend Tiny。

  在雙大核NPU(Ascend Lite*2)加持下,麒麟990 5G實現業(yè)界最強AI算力,與業(yè)界其他旗艦AI芯片相比,性能優(yōu)勢高達6倍,能效優(yōu)勢高達8倍,持續(xù)刷新端側AI的算力高點。無論是在業(yè)界典型的中載神經網絡模型ResNet50(用于檢測、分割和識別),還是在移動端更流行的輕載神經網絡模型MobilenetV1(用于分類、檢測、嵌入和分割)下,麒麟990 5G的FP16和int8性能和能效均達到業(yè)界最佳水平。業(yè)界首發(fā)NPU微核(Ascend Tiny)賦能超低功耗應用,在人臉識別的應用場景下,NPU微核比大核能效最高可提升24倍,讓AI運算更省電。

  在990 5G和990 4G之間也存在差異。除了調制解調器,GPU和制造工藝之外,芯片尺寸差異的一個原因是990 5G的NPU內核數量是其兩倍。990 5G將擁有兩個“大”NPU核心,同時支持雙ML流程以及Tiny Core NPU。相比之下,990 4G只有一個“大”NPU核心,加上微核NPU。

  這意味著我們可能會看到Kirin 990 4G設備可能無法實現的某些功能。

  巴龍調制解調器

640.webp (7).jpg

640.webp (6).jpg

  除了是第一款集成智能手機5G設計外,最終華為并未提供有關新5G調制解調器或4G設計更新的詳細信息。據稱,麒麟990 5G是第一款商用的支持NSA和SA架構的全頻調頻調制解調器。

  峰值速度將高達2.3 Gbps下載和1.25 Gbps上傳,額外的基于ML的波束成形技術有助于在高速旅行期間支持更快的速度。對于弱信號區(qū)域,該設計還允許同時連接到5G和4G。我們確認該公司仍在使用Tensilica DSP,技術團隊表示盡管存在國際問題,但Tensilica的許可仍然有效。

640.webp (5).jpg

  麒麟990 (5G)的性能

640.webp (4).jpg

  圖中所示從Kirin 980到Kirin 990 5G的單線程性能增加了9%,主要是通過更高的主頻來實現。多線程性能整體上漲10%。然而,與去年相比,中端A76核心的電源效率提高了35%,華為預計大多數非要求性能相關的工作負載都要在這些中間核上運行。(華為表示高性能內核的效率比上一代高出12%,較小的內核的效率提高了15%。

640.webp (3).jpg

  GPU方面,麒麟芯片始終追求更好的用戶體驗。針對GPU在運行重載游戲、播放高清視頻等高負載場景下容易出現的發(fā)熱、掉幀、卡頓等問題,麒麟990 5G搭載16核Mali-G76 GPU,與業(yè)界主流旗艦芯片相比,圖形處理性能高6%,能效優(yōu)20%,實現業(yè)界領先的性能與能效。全新系統(tǒng)級Smart Cache分流,支持智能分配DDR數據,在重載游戲等大帶寬場景下帶寬較上一代最高可節(jié)省15%,功耗可降低12%,進一步提升GPU能效。

640.webp (2).jpg

  余承東在現場表示,在雙大核NPU加持下,麒麟990 5G實現業(yè)界最強AI算力,與業(yè)界其他旗艦AI芯片相比,性能優(yōu)勢高達6倍,能效優(yōu)勢高達8倍,持續(xù)刷新端側AI的算力高點。無論是在業(yè)界典型的中載神經網絡模型ResNet50(用于檢測、分割和識別),還是在移動端更流行的輕載神經網絡模型MobilenetV1(用于分類、檢測、嵌入和分割)下,麒麟990 5G的FP16和int8性能和能效均達到業(yè)界最佳水平。業(yè)界首發(fā)NPU微核(Ascend Tiny)賦能超低功耗應用,在人臉識別的應用場景下,NPU微核比大核能效最高可提升24倍,讓AI運算更省電。


本站內容除特別聲明的原創(chuàng)文章之外,轉載內容只為傳遞更多信息,并不代表本網站贊同其觀點。轉載的所有的文章、圖片、音/視頻文件等資料的版權歸版權所有權人所有。本站采用的非本站原創(chuàng)文章及圖片等內容無法一一聯系確認版權者。如涉及作品內容、版權和其它問題,請及時通過電子郵件或電話通知我們,以便迅速采取適當措施,避免給雙方造成不必要的經濟損失。聯系電話:010-82306118;郵箱:aet@chinaaet.com。