《電子技術(shù)應(yīng)用》
您所在的位置:首頁 > 顯示光電 > 設(shè)計(jì)應(yīng)用 > 核內(nèi)顯卡逆襲 Sandy Bridge平臺(tái)全解析
核內(nèi)顯卡逆襲 Sandy Bridge平臺(tái)全解析
王承祥
摘要: 英特爾IDF2011在風(fēng)和日麗的13日終于落下帷幕。本屆IDF以“智無界,芯跨越”(Compute Continuum and Beyond)為主題,將進(jìn)一步展示英特爾如何通過從硬件、平臺(tái)到軟件和服務(wù)全面的計(jì)算解決方案,推進(jìn)個(gè)性化互聯(lián)網(wǎng)發(fā)展;同時(shí)面向中國市場(chǎng)如何支持本地合作伙伴創(chuàng)新,助力新一代信息技術(shù)等戰(zhàn)略性新興產(chǎn)業(yè)發(fā)展。而回顧本次IDF,依然有很多情景讓我們覺得身臨其境,再先進(jìn)的技術(shù)最后也只有一個(gè)用處,那就是應(yīng)用在改變大家的生活當(dāng)中。
Abstract:
Key words :

    英特爾IDF2011在風(fēng)和日麗的13日終于落下帷幕。本屆IDF以“智無界,芯跨越”(Compute Continuum and Beyond)為主題,將進(jìn)一步展示英特爾如何通過從硬件、平臺(tái)到軟件和服務(wù)全面的計(jì)算解決方案,推進(jìn)個(gè)性化互聯(lián)網(wǎng)發(fā)展;同時(shí)面向中國市場(chǎng)如何支持本地合作伙伴創(chuàng)新,助力新一代信息技術(shù)等戰(zhàn)略性新興產(chǎn)業(yè)發(fā)展。而回顧本次IDF,依然有很多情景讓我們覺得身臨其境,再先進(jìn)的技術(shù)最后也只有一個(gè)用處,那就是應(yīng)用在改變大家的生活當(dāng)中。

IDF2011落下帷幕

     在此次的IDF上,借助內(nèi)容豐富的主題演講、技術(shù)課程和技術(shù)展示將Intel在技術(shù)與研發(fā)方面的最新成果加以詮釋,推動(dòng)用戶走在科技發(fā)展的最前沿。其中,作為英特爾在2011年的創(chuàng)新---第二代英特爾® 酷睿™處理器,代號(hào) Sandy Bridge的相關(guān)主題講座將成為此次IDF的重頭之一。

IDF2011落下帷幕

    盡管SandyBridge平臺(tái)早在年初就已發(fā)布,但對(duì)于多數(shù)用戶而言英特爾僅提升了概念性認(rèn)識(shí)。至于在實(shí)際應(yīng)用細(xì)節(jié)方面的實(shí)現(xiàn)并沒有明確的透露。而在此次IDF 2011論款上包括Intel首席高級(jí)工程師Opher Kahn,首席多媒體工程師Hong Jiang博士等多位資深專家在現(xiàn)為廣大的與會(huì)者就Sandy Bridge平臺(tái)的微架構(gòu)、圖形處理單元、多媒體優(yōu)化以及高清圖形處理方面的設(shè)計(jì)思路和性能體驗(yàn)進(jìn)行了全面的解讀。

     英特爾繼續(xù)履行其堅(jiān)定的承諾,籍由下一代微架構(gòu)代號(hào)Sandy Bridge 來推動(dòng)處理器能力和指令集的發(fā)展。這一革命性的微架構(gòu)構(gòu)建于32 納米制程技術(shù)之上,在提高能效的同時(shí),具有更卓越的性能和能力。整合顯示核心是Sandy Bridge處理器的一大改進(jìn)。

    Sandy Bridge微構(gòu)架采用了可擴(kuò)展的環(huán)形互連架構(gòu),將內(nèi)核、最后一集高速緩存LLC和系統(tǒng)代理互連在一起,并且通過環(huán)上的數(shù)據(jù)存取總是選擇最短路徑,這樣可以最小化延遲。另外,環(huán)形的互連架構(gòu)讓Sandy Bridge具有更高的可擴(kuò)展性,可以支持大量的處理器。Sandy Bridge架構(gòu)的優(yōu)勢(shì)集中在:能效,性能優(yōu)化,聯(lián)合CPU進(jìn)行了優(yōu)化,增強(qiáng)的固有優(yōu)勢(shì)和媒體性能。

    其前端微架構(gòu)的處理順序?yàn)椋?2K一級(jí)緩存>預(yù)譯碼>指令隊(duì)列>譯碼器>分支預(yù)測(cè)單元。其中一級(jí)緩存為32KB的8路相連指令高速緩存,譯碼器部分包含4個(gè)譯碼器,每個(gè)時(shí)鐘周期可處理器4條指令,指令隊(duì)列處理方式包括微融合和宏融合,可將多條指令時(shí)間打包為一條“微操作”或?qū)⒍鄬?duì)指令融合為一條復(fù)雜的“位操作”,譯碼流水線支持每個(gè)時(shí)鐘周期16個(gè)字節(jié)。

第二代酷睿微加構(gòu)解析

    此外,在前端微架構(gòu)處理器單元中還增加了一個(gè)譯碼微操作高速緩存,稱之為0級(jí)(L0)指令高速緩存,代替了指令字節(jié),對(duì)于大多數(shù)應(yīng)用高達(dá)80%的命中率,此外,新架構(gòu)還帶來了更高的指令帶寬和更低的延遲。譯碼高速緩存可以在每個(gè)時(shí)鐘周期遞送32字節(jié),更多時(shí)鐘周期可以保持每個(gè)周期4條指令,并能夠縫合控制流程間的分支,從而達(dá)到更高的效能。

    整合顯示核心可說是是Sandy Bridge處理器的又一改進(jìn)。與Westmere處理器所使用的MXM技術(shù)不同,Sandy Bridge處理器率先實(shí)現(xiàn)了將顯示模塊完全集成于芯片內(nèi)部,并允許其通過Ring Bus(環(huán)形總線)與處理器模塊共享三級(jí)緩存,以提升整體性能。

革命性的進(jìn)步:核心顯卡

    全新的Sandy Bridge圖形核心采取了統(tǒng)一的顯卡-CPU電源管理,可在CPU顯卡之間的資源分配上達(dá)到最優(yōu)決策,從而提升效能,在顯卡中使用了CPU登記的電源管理技術(shù)。獨(dú)立的顯卡和CPU電源控制允許電源按工作量需求進(jìn)行分配,其電壓和時(shí)序都是獨(dú)立于CPU的。

革命性的進(jìn)步:核心顯卡

    固定的模塊計(jì)算能達(dá)到最優(yōu)平衡,在3D管道中每個(gè)點(diǎn)都有外在的固定功能模塊,從而達(dá)到低延時(shí)、高吞吐量、簡(jiǎn)單的驅(qū)動(dòng)編程模型,同時(shí)釋放著色器,令其專注于渲染工作。

革命性的進(jìn)步:核心顯卡

    特別是新一代的EU擁有更大的寄存器文件以提高并行度和復(fù)雜著色器的執(zhí)行效率,對(duì)深度嵌套條件也能有效優(yōu)化,數(shù)學(xué)計(jì)算能力提高了4~20倍,新的指令集與API、ISA一一對(duì)應(yīng),從而在同頻率下達(dá)到更高效率。固定模塊的設(shè)計(jì)去掉了正交狀態(tài),與上代產(chǎn)品相比,驅(qū)動(dòng)運(yùn)行時(shí)間大幅降低,釋放了CPU負(fù)載,將能量更多分配到顯卡上。

革命性的進(jìn)步:核心顯卡

    比如在高清視頻解碼方面,英特爾所采用的支持多格式編解碼器---MFX則是一種專用并行引擎。該引擎除了支持MPEG2、VC1以及AVC等常見編碼格式還提供了對(duì)立體3D(MVC)的支持。而憑借MFX引擎的有力支持,CPU本身的負(fù)載也得到了進(jìn)一步優(yōu)化。

酷睿加速2.0技術(shù)解析

    與上一代睿頻加速1.0技術(shù)相比,睿頻加速2.0技術(shù)的設(shè)計(jì)方向更多的針對(duì)多線程應(yīng)用,不僅能夠提供更高的多線程加速頻率,而且調(diào)節(jié)機(jī)制更具彈性。當(dāng)啟動(dòng)一個(gè)運(yùn)行程序后,處理器會(huì)自動(dòng)加速到合適的頻率,而原來的運(yùn)行速度會(huì)提升 10%—20% 以保證程序流暢運(yùn)行;應(yīng)對(duì)復(fù)雜應(yīng)用時(shí),處理器可自動(dòng)提高運(yùn)行主頻以提速,輕松進(jìn)行對(duì)性能要求更高的多任務(wù)處理;當(dāng)進(jìn)行工作任務(wù)切換時(shí),如果只有內(nèi)存硬盤在進(jìn)行主要的工作,處理器會(huì)立刻處于節(jié)電狀態(tài)。這樣既保證了能源的有效利用,又使程序速度大幅提升。 

酷睿加速2.0技術(shù)解析

     而值得注意的是,雖然設(shè)計(jì)在同一個(gè)芯片上,但是Sandy Bridge的CPU和GPU使用分別的電壓和頻率,共同分擔(dān)芯片的整體功耗,通過功耗預(yù)算,CPU和GPU之間的調(diào)整使得在不同應(yīng)用中始終保持最佳的分配,當(dāng)CPU負(fù)載重時(shí),GPU的能耗則相應(yīng)降低,反之亦然。

關(guān)鍵字:英特爾 IDF2011 SandyBridge平臺(tái)

    在多媒體指令集方面,Sandy Bridge增加了Intel AVX指令集,使用了新的執(zhí)行群集、存儲(chǔ)器群集,可以擴(kuò)展SSE浮點(diǎn)指令集到256bit的操作數(shù),采用新的無損源語法和矢量運(yùn)算,是面向低功耗的架構(gòu),矢量對(duì)于許多應(yīng)用語言都是自然的數(shù)據(jù)類型,更寬的矢量和無損源語可用更少的指令詳細(xì)描述更多的工作,使得現(xiàn)有工作得到有效擴(kuò)展。Sandy Bridge的浮點(diǎn)運(yùn)算能力大幅增加。AVX指令集可以利用2組128bit執(zhí)行棧,令執(zhí)行群集重新使用現(xiàn)有數(shù)據(jù)路徑達(dá)到雙重使用的目的。

    在渲染的時(shí)候,光線跟蹤也好,光能傳遞也好都需要大量的計(jì)算,這些工作都是由CPU提供的。而核內(nèi)顯卡在3D管道中每個(gè)點(diǎn)都有外在的固定功能模塊,從而達(dá)到低延時(shí)、高吞吐量、簡(jiǎn)單的驅(qū)動(dòng)編程模型,同時(shí)釋放著色器,令其專注于渲染工作。


高精度星球?yàn)g覽器的現(xiàn)場(chǎng)演示

    除了核心顯示在設(shè)計(jì)上的優(yōu)勢(shì),英特爾的技術(shù)人員特別演示了“高精度星球?yàn)g覽器”的應(yīng)用案例。無論是在第二代英特爾酷睿i5還是i7處理器中,其內(nèi)建的核心顯卡均可以在高負(fù)荷的應(yīng)用下完成星球整體以及地表的圖形建模與高精度實(shí)時(shí)渲染。在高符合的渲染過程中,第二代酷睿處理器所采用雙精度英特爾 高級(jí)矢量擴(kuò)展指令集(AVX)則是憑借四線程、64位的優(yōu)化能力大大提升了整個(gè)過程的執(zhí)行速度,而這一優(yōu)勢(shì)是上一代產(chǎn)品所不具備的。

    英特爾早在今年第一季度正式發(fā)布基于Sandy Bridge架構(gòu)設(shè)計(jì)的處理器產(chǎn)品,事實(shí)上早在去年9月底的IDF 2009舊金山站上,英特爾的高管StephenSmith就已經(jīng)拿出了桌面和移動(dòng)版本的Sandy Bridge處理器實(shí)物,要知道那個(gè)時(shí)候甚至就連現(xiàn)在的32nm Westmere還沒有正式發(fā)布呢,英特爾也借此表達(dá)了充分貫徹Tick-Tock策略的決心。

總結(jié)及IT168評(píng)測(cè)中心觀點(diǎn)

    而時(shí)至今日,在新一代SNB平臺(tái)已經(jīng)全面捕貨的同時(shí)時(shí)候,我們看到作為Nehalem的繼任者,在實(shí)際應(yīng)用方面,代號(hào)為Sandy Bridge的處理器在硬件特性方面還有著更多成長(zhǎng)空間。憑借全新的處理架構(gòu),更加智能的睿頻技術(shù),全新的AVX指令集,SNB可在家庭娛樂、日常辦公甚至服務(wù)器市場(chǎng)有著更多值得驚喜的表現(xiàn),特別是其核內(nèi)顯卡在圖形以及并行處理應(yīng)用的改善讓我們對(duì)這一架構(gòu)發(fā)展有著更多的期待。

 

此內(nèi)容為AET網(wǎng)站原創(chuàng),未經(jīng)授權(quán)禁止轉(zhuǎn)載。