123,123,123

核内显卡逆袭 Sandy Bridge平台全解析

王承祥

摘要： 英特尔IDF2011在风和日丽的13日终于落下帷幕。本届IDF以“智无界，芯跨越”（Compute Continuum and Beyond）为主题，将进一步展示英特尔如何通过从硬件、平台到软件和服务全面的计算解决方案，推进个性化互联网发展；同时面向中国市场如何支持本地合作伙伴创新，助力新一代信息技术等战略性新兴产业发展。而回顾本次IDF，依然有很多情景让我们觉得身临其境，再先进的技术最后也只有一个用处，那就是应用在改变大家的生活当中。

關(guān)鍵詞： 英特尔 IDF2011 SandyBridge平台

Abstract：

Key words :

英特爾 IDF2011在風(fēng)和日麗的13日終于落下帷幕。本屆IDF以“智無界，芯跨越”（Compute Continuum and Beyond）為主題，將進(jìn)一步展示英特爾如何通過從硬件、平臺到軟件和服務(wù)全面的計算解決方案，推進(jìn)個性化互聯(lián)網(wǎng)發(fā)展；同時面向中國市場如何支持本地合作伙伴創(chuàng)新，助力新一代信息技術(shù)等戰(zhàn)略性新興產(chǎn)業(yè)發(fā)展。而回顧本次IDF，依然有很多情景讓我們覺得身臨其境，再先進(jìn)的技術(shù)最后也只有一個用處，那就是應(yīng)用在改變大家的生活當(dāng)中。

IDF2011落下帷幕

在此次的IDF上，借助內(nèi)容豐富的主題演講、技術(shù)課程和技術(shù)展示將Intel在技術(shù)與研發(fā)方面的最新成果加以詮釋，推動用戶走在科技發(fā)展的最前沿。其中，作為英特爾在2011年的創(chuàng)新---第二代英特爾® 酷睿™處理器,代號 Sandy Bridge的相關(guān)主題講座將成為此次IDF的重頭之一。

IDF2011落下帷幕

盡管SandyBridge平臺早在年初就已發(fā)布，但對于多數(shù)用戶而言英特爾僅提升了概念性認(rèn)識。至于在實際應(yīng)用細(xì)節(jié)方面的實現(xiàn)并沒有明確的透露。而在此次IDF 2011論款上包括Intel首席高級工程師Opher Kahn，首席多媒體工程師Hong Jiang博士等多位資深專家在現(xiàn)為廣大的與會者就Sandy Bridge平臺的微架構(gòu)、圖形處理單元、多媒體優(yōu)化以及高清圖形處理方面的設(shè)計思路和性能體驗進(jìn)行了全面的解讀。

英特爾繼續(xù)履行其堅定的承諾，籍由下一代微架構(gòu)代號Sandy Bridge 來推動處理器能力和指令集的發(fā)展。這一革命性的微架構(gòu)構(gòu)建于32 納米制程技術(shù)之上，在提高能效的同時，具有更卓越的性能和能力。整合顯示核心是Sandy Bridge處理器的一大改進(jìn)。

Sandy Bridge微構(gòu)架采用了可擴(kuò)展的環(huán)形互連架構(gòu)，將內(nèi)核、最后一集高速緩存LLC和系統(tǒng)代理互連在一起，并且通過環(huán)上的數(shù)據(jù)存取總是選擇最短路徑，這樣可以最小化延遲。另外，環(huán)形的互連架構(gòu)讓Sandy Bridge具有更高的可擴(kuò)展性，可以支持大量的處理器。Sandy Bridge架構(gòu)的優(yōu)勢集中在：能效，性能優(yōu)化，聯(lián)合CPU進(jìn)行了優(yōu)化，增強(qiáng)的固有優(yōu)勢和媒體性能。

其前端微架構(gòu)的處理順序為：32K一級緩存>預(yù)譯碼>指令隊列>譯碼器>分支預(yù)測單元。其中一級緩存為32KB的8路相連指令高速緩存，譯碼器部分包含4個譯碼器，每個時鐘周期可處理器4條指令，指令隊列處理方式包括微融合和宏融合，可將多條指令時間打包為一條“微操作”或?qū)⒍鄬χ噶钊诤蠟橐粭l復(fù)雜的“位操作”，譯碼流水線支持每個時鐘周期16個字節(jié)。

第二代酷睿微加構(gòu)解析

此外，在前端微架構(gòu)處理器單元中還增加了一個譯碼微操作高速緩存，稱之為0級（L0）指令高速緩存，代替了指令字節(jié)，對于大多數(shù)應(yīng)用高達(dá)80%的命中率，此外，新架構(gòu)還帶來了更高的指令帶寬和更低的延遲。譯碼高速緩存可以在每個時鐘周期遞送32字節(jié)，更多時鐘周期可以保持每個周期4條指令，并能夠縫合控制流程間的分支，從而達(dá)到更高的效能。

整合顯示核心可說是是Sandy Bridge處理器的又一改進(jìn)。與Westmere處理器所使用的MXM技術(shù)不同，Sandy Bridge處理器率先實現(xiàn)了將顯示模塊完全集成于芯片內(nèi)部，并允許其通過Ring Bus（環(huán)形總線）與處理器模塊共享三級緩存，以提升整體性能。

革命性的進(jìn)步：核心顯卡

全新的Sandy Bridge圖形核心采取了統(tǒng)一的顯卡-CPU電源管理，可在CPU和顯卡之間的資源分配上達(dá)到最優(yōu)決策，從而提升效能，在顯卡中使用了CPU登記的電源管理技術(shù)。獨立的顯卡和CPU電源控制允許電源按工作量需求進(jìn)行分配,其電壓和時序都是獨立于CPU的。

革命性的進(jìn)步：核心顯卡

固定的模塊計算能達(dá)到最優(yōu)平衡，在3D管道中每個點都有外在的固定功能模塊，從而達(dá)到低延時、高吞吐量、簡單的驅(qū)動編程模型，同時釋放著色器，令其專注于渲染工作。

革命性的進(jìn)步：核心顯卡

特別是新一代的EU擁有更大的寄存器文件以提高并行度和復(fù)雜著色器的執(zhí)行效率，對深度嵌套條件也能有效優(yōu)化，數(shù)學(xué)計算能力提高了4~20倍，新的指令集與API、ISA一一對應(yīng)，從而在同頻率下達(dá)到更高效率。固定模塊的設(shè)計去掉了正交狀態(tài)，與上代產(chǎn)品相比，驅(qū)動運行時間大幅降低，釋放了CPU負(fù)載，將能量更多分配到顯卡上。

革命性的進(jìn)步：核心顯卡

比如在高清視頻解碼方面，英特爾所采用的支持多格式編解碼器---MFX則是一種專用并行引擎。該引擎除了支持MPEG2、VC1以及AVC等常見編碼格式還提供了對立體3D（MVC）的支持。而憑借MFX引擎的有力支持，CPU本身的負(fù)載也得到了進(jìn)一步優(yōu)化。

酷睿加速2.0技術(shù)解析

與上一代睿頻加速1.0技術(shù)相比，睿頻加速2.0技術(shù)的設(shè)計方向更多的針對多線程應(yīng)用，不僅能夠提供更高的多線程加速頻率，而且調(diào)節(jié)機(jī)制更具彈性。當(dāng)啟動一個運行程序后，處理器會自動加速到合適的頻率，而原來的運行速度會提升 10%—20% 以保證程序流暢運行；應(yīng)對復(fù)雜應(yīng)用時，處理器可自動提高運行主頻以提速，輕松進(jìn)行對性能要求更高的多任務(wù)處理；當(dāng)進(jìn)行工作任務(wù)切換時，如果只有內(nèi)存和硬盤在進(jìn)行主要的工作，處理器會立刻處于節(jié)電狀態(tài)。這樣既保證了能源的有效利用，又使程序速度大幅提升。

酷睿加速2.0技術(shù)解析

而值得注意的是，雖然設(shè)計在同一個芯片上，但是Sandy Bridge的CPU和GPU使用分別的電壓和頻率，共同分擔(dān)芯片的整體功耗，通過功耗預(yù)算，CPU和GPU之間的調(diào)整使得在不同應(yīng)用中始終保持最佳的分配，當(dāng)CPU負(fù)載重時，GPU的能耗則相應(yīng)降低，反之亦然。

關(guān)鍵字：英特爾 IDF2011 SandyBridge平臺

在多媒體指令集方面，Sandy Bridge增加了Intel AVX指令集，使用了新的執(zhí)行群集、存儲器群集，可以擴(kuò)展SSE浮點指令集到256bit的操作數(shù)，采用新的無損源語法和矢量運算，是面向低功耗的架構(gòu)，矢量對于許多應(yīng)用語言都是自然的數(shù)據(jù)類型，更寬的矢量和無損源語可用更少的指令詳細(xì)描述更多的工作，使得現(xiàn)有工作得到有效擴(kuò)展。Sandy Bridge的浮點運算能力大幅增加。AVX指令集可以利用2組128bit執(zhí)行棧，令執(zhí)行群集重新使用現(xiàn)有數(shù)據(jù)路徑達(dá)到雙重使用的目的。

在渲染的時候，光線跟蹤也好，光能傳遞也好都需要大量的計算，這些工作都是由CPU提供的。而核內(nèi)顯卡在3D管道中每個點都有外在的固定功能模塊，從而達(dá)到低延時、高吞吐量、簡單的驅(qū)動編程模型，同時釋放著色器，令其專注于渲染工作。

高精度星球瀏覽器的現(xiàn)場演示

除了核心顯示在設(shè)計上的優(yōu)勢，英特爾的技術(shù)人員特別演示了“高精度星球瀏覽器”的應(yīng)用案例。無論是在第二代英特爾酷睿i5還是i7處理器中，其內(nèi)建的核心顯卡均可以在高負(fù)荷的應(yīng)用下完成星球整體以及地表的圖形建模與高精度實時渲染。在高符合的渲染過程中，第二代酷睿處理器所采用雙精度英特爾高級矢量擴(kuò)展指令集（AVX）則是憑借四線程、64位的優(yōu)化能力大大提升了整個過程的執(zhí)行速度，而這一優(yōu)勢是上一代產(chǎn)品所不具備的。

英特爾早在今年第一季度正式發(fā)布基于Sandy Bridge架構(gòu)設(shè)計的處理器產(chǎn)品，事實上早在去年9月底的IDF 2009舊金山站上，英特爾的高管StephenSmith就已經(jīng)拿出了桌面和移動版本的Sandy Bridge處理器實物，要知道那個時候甚至就連現(xiàn)在的32nm Westmere還沒有正式發(fā)布呢，英特爾也借此表達(dá)了充分貫徹Tick-Tock策略的決心。

總結(jié)及IT168評測中心觀點

而時至今日，在新一代SNB平臺已經(jīng)全面捕貨的同時時候，我們看到作為Nehalem的繼任者，在實際應(yīng)用方面，代號為Sandy Bridge的處理器在硬件特性方面還有著更多成長空間。憑借全新的處理架構(gòu)，更加智能的睿頻技術(shù)，全新的AVX指令集，SNB可在家庭娛樂、日常辦公甚至服務(wù)器市場有著更多值得驚喜的表現(xiàn)，特別是其核內(nèi)顯卡在圖形以及并行處理應(yīng)用的改善讓我們對這一架構(gòu)發(fā)展有著更多的期待。

原創(chuàng)聲明：此內(nèi)容為AET網(wǎng)站原創(chuàng)，未經(jīng)授權(quán)禁止轉(zhuǎn)載。

關(guān)鍵字：英特爾 IDF2011 SandyBridge平臺

相關(guān)內(nèi)容