英特爾IDF2011在風和日麗的13日終于落下帷幕。本屆IDF以“智無界,芯跨越”(Compute Continuum and Beyond)為主題,將進一步展示英特爾如何通過從硬件、平臺到軟件和服務全面的計算解決方案,推進個性化互聯(lián)網(wǎng)發(fā)展;同時面向中國市場如何支持本地合作伙伴創(chuàng)新,助力新一代信息技術等戰(zhàn)略性新興產(chǎn)業(yè)發(fā)展。而回顧本次IDF,依然有很多情景讓我們覺得身臨其境,再先進的技術最后也只有一個用處,那就是應用在改變大家的生活當中。
在此次的IDF上,借助內(nèi)容豐富的主題演講、技術課程和技術展示將Intel在技術與研發(fā)方面的最新成果加以詮釋,推動用戶走在科技發(fā)展的最前沿。其中,作為英特爾在2011年的創(chuàng)新---第二代英特爾® 酷睿™處理器,代號 Sandy Bridge的相關主題講座將成為此次IDF的重頭之一。
盡管SandyBridge平臺早在年初就已發(fā)布,但對于多數(shù)用戶而言英特爾僅提升了概念性認識。至于在實際應用細節(jié)方面的實現(xiàn)并沒有明確的透露。而在此次IDF 2011論款上包括Intel首席高級工程師Opher Kahn,首席多媒體工程師Hong Jiang博士等多位資深專家在現(xiàn)為廣大的與會者就Sandy Bridge平臺的微架構、圖形處理單元、多媒體優(yōu)化以及高清圖形處理方面的設計思路和性能體驗進行了全面的解讀。
英特爾繼續(xù)履行其堅定的承諾,籍由下一代微架構代號Sandy Bridge 來推動處理器能力和指令集的發(fā)展。這一革命性的微架構構建于32 納米制程技術之上,在提高能效的同時,具有更卓越的性能和能力。整合顯示核心是Sandy Bridge處理器的一大改進。
Sandy Bridge微構架采用了可擴展的環(huán)形互連架構,將內(nèi)核、最后一集高速緩存LLC和系統(tǒng)代理互連在一起,并且通過環(huán)上的數(shù)據(jù)存取總是選擇最短路徑,這樣可以最小化延遲。另外,環(huán)形的互連架構讓Sandy Bridge具有更高的可擴展性,可以支持大量的處理器。Sandy Bridge架構的優(yōu)勢集中在:能效,性能優(yōu)化,聯(lián)合CPU進行了優(yōu)化,增強的固有優(yōu)勢和媒體性能。
其前端微架構的處理順序為:32K一級緩存>預譯碼>指令隊列>譯碼器>分支預測單元。其中一級緩存為32KB的8路相連指令高速緩存,譯碼器部分包含4個譯碼器,每個時鐘周期可處理器4條指令,指令隊列處理方式包括微融合和宏融合,可將多條指令時間打包為一條“微操作”或?qū)⒍鄬χ噶钊诤蠟橐粭l復雜的“位操作”,譯碼流水線支持每個時鐘周期16個字節(jié)。
此外,在前端微架構處理器單元中還增加了一個譯碼微操作高速緩存,稱之為0級(L0)指令高速緩存,代替了指令字節(jié),對于大多數(shù)應用高達80%的命中率,此外,新架構還帶來了更高的指令帶寬和更低的延遲。譯碼高速緩存可以在每個時鐘周期遞送32字節(jié),更多時鐘周期可以保持每個周期4條指令,并能夠縫合控制流程間的分支,從而達到更高的效能。
整合顯示核心可說是是Sandy Bridge處理器的又一改進。與Westmere處理器所使用的MXM技術不同,Sandy Bridge處理器率先實現(xiàn)了將顯示模塊完全集成于芯片內(nèi)部,并允許其通過Ring Bus(環(huán)形總線)與處理器模塊共享三級緩存,以提升整體性能。
全新的Sandy Bridge圖形核心采取了統(tǒng)一的顯卡-CPU電源管理,可在CPU和顯卡之間的資源分配上達到最優(yōu)決策,從而提升效能,在顯卡中使用了CPU登記的電源管理技術。獨立的顯卡和CPU電源控制允許電源按工作量需求進行分配,其電壓和時序都是獨立于CPU的。
固定的模塊計算能達到最優(yōu)平衡,在3D管道中每個點都有外在的固定功能模塊,從而達到低延時、高吞吐量、簡單的驅(qū)動編程模型,同時釋放著色器,令其專注于渲染工作。
特別是新一代的EU擁有更大的寄存器文件以提高并行度和復雜著色器的執(zhí)行效率,對深度嵌套條件也能有效優(yōu)化,數(shù)學計算能力提高了4~20倍,新的指令集與API、ISA一一對應,從而在同頻率下達到更高效率。固定模塊的設計去掉了正交狀態(tài),與上代產(chǎn)品相比,驅(qū)動運行時間大幅降低,釋放了CPU負載,將能量更多分配到顯卡上。
比如在高清視頻解碼方面,英特爾所采用的支持多格式編解碼器---MFX則是一種專用并行引擎。該引擎除了支持MPEG2、VC1以及AVC等常見編碼格式還提供了對立體3D(MVC)的支持。而憑借MFX引擎的有力支持,CPU本身的負載也得到了進一步優(yōu)化。
與上一代睿頻加速1.0技術相比,睿頻加速2.0技術的設計方向更多的針對多線程應用,不僅能夠提供更高的多線程加速頻率,而且調(diào)節(jié)機制更具彈性。當啟動一個運行程序后,處理器會自動加速到合適的頻率,而原來的運行速度會提升 10%—20% 以保證程序流暢運行;應對復雜應用時,處理器可自動提高運行主頻以提速,輕松進行對性能要求更高的多任務處理;當進行工作任務切換時,如果只有內(nèi)存和硬盤在進行主要的工作,處理器會立刻處于節(jié)電狀態(tài)。這樣既保證了能源的有效利用,又使程序速度大幅提升。
而值得注意的是,雖然設計在同一個芯片上,但是Sandy Bridge的CPU和GPU使用分別的電壓和頻率,共同分擔芯片的整體功耗,通過功耗預算,CPU和GPU之間的調(diào)整使得在不同應用中始終保持最佳的分配,當CPU負載重時,GPU的能耗則相應降低,反之亦然。
關鍵字:英特爾 IDF2011 SandyBridge平臺
在多媒體指令集方面,Sandy Bridge增加了Intel AVX指令集,使用了新的執(zhí)行群集、存儲器群集,可以擴展SSE浮點指令集到256bit的操作數(shù),采用新的無損源語法和矢量運算,是面向低功耗的架構,矢量對于許多應用語言都是自然的數(shù)據(jù)類型,更寬的矢量和無損源語可用更少的指令詳細描述更多的工作,使得現(xiàn)有工作得到有效擴展。Sandy Bridge的浮點運算能力大幅增加。AVX指令集可以利用2組128bit執(zhí)行棧,令執(zhí)行群集重新使用現(xiàn)有數(shù)據(jù)路徑達到雙重使用的目的。
在渲染的時候,光線跟蹤也好,光能傳遞也好都需要大量的計算,這些工作都是由CPU提供的。而核內(nèi)顯卡在3D管道中每個點都有外在的固定功能模塊,從而達到低延時、高吞吐量、簡單的驅(qū)動編程模型,同時釋放著色器,令其專注于渲染工作。
高精度星球瀏覽器的現(xiàn)場演示
除了核心顯示在設計上的優(yōu)勢,英特爾的技術人員特別演示了“高精度星球瀏覽器”的應用案例。無論是在第二代英特爾酷睿i5還是i7處理器中,其內(nèi)建的核心顯卡均可以在高負荷的應用下完成星球整體以及地表的圖形建模與高精度實時渲染。在高符合的渲染過程中,第二代酷睿處理器所采用雙精度英特爾 高級矢量擴展指令集(AVX)則是憑借四線程、64位的優(yōu)化能力大大提升了整個過程的執(zhí)行速度,而這一優(yōu)勢是上一代產(chǎn)品所不具備的。
英特爾早在今年第一季度正式發(fā)布基于Sandy Bridge架構設計的處理器產(chǎn)品,事實上早在去年9月底的IDF 2009舊金山站上,英特爾的高管StephenSmith就已經(jīng)拿出了桌面和移動版本的Sandy Bridge處理器實物,要知道那個時候甚至就連現(xiàn)在的32nm Westmere還沒有正式發(fā)布呢,英特爾也借此表達了充分貫徹Tick-Tock策略的決心。
而時至今日,在新一代SNB平臺已經(jīng)全面捕貨的同時時候,我們看到作為Nehalem的繼任者,在實際應用方面,代號為Sandy Bridge的處理器在硬件特性方面還有著更多成長空間。憑借全新的處理架構,更加智能的睿頻技術,全新的AVX指令集,SNB可在家庭娛樂、日常辦公甚至服務器市場有著更多值得驚喜的表現(xiàn),特別是其核內(nèi)顯卡在圖形以及并行處理應用的改善讓我們對這一架構發(fā)展有著更多的期待。