英特爾作為一家美國主要研制CPU處理器的公司,是全球最大的個人計算機零件和CPU制造商,它成立于1968年,具有50年產(chǎn)品創(chuàng)新和市場領(lǐng)導(dǎo)的歷史,它的X86架構(gòu)成為經(jīng)典。近日,英特爾中國研究院迎來二十歲生日,英特爾總部在加州Los Altos舉辦的“架構(gòu)日”。
英特爾高管、架構(gòu)師和院士們展示了下一代技術(shù),并介紹了英特爾在驅(qū)動不斷擴展的數(shù)據(jù)密集型工作負載方面的戰(zhàn)略進展,從而為PC和其他智能消費設(shè)備、高速網(wǎng)絡(luò)、人工智能(AI)、云數(shù)據(jù)中心和自動駕駛汽車提供支持。
英特爾不僅展示了一系列處于研發(fā)中的基于10納米的系統(tǒng),將用于PC、數(shù)據(jù)中心和網(wǎng)絡(luò)設(shè)備,并預(yù)覽了其他針對更廣泛工作負載的技術(shù),還一連分享了聚焦于六個工程領(lǐng)域的技術(shù)戰(zhàn)略,包括先進的制造工藝和封裝、可加速人工智能(AI)和圖形等專門任務(wù)的新架構(gòu)、超高速內(nèi)存、超微互連、嵌入式安全功能、為開發(fā)者統(tǒng)一和簡化基于英特爾計算路線圖進行編程的通用軟件。
在介紹全新的 Sunny Cove 架構(gòu)之前,英特爾方面先秀了一張關(guān)于近年來層出不窮的芯片漏洞以及對應(yīng)解決方案,最早是從軟件層面修改來修正已經(jīng)發(fā)生的各種漏洞攻擊,Cascade Lake 更是引入了硬件防范設(shè)計,與操作系統(tǒng)配合,在防范手段上更有效率。未來則是將會嘗試以純硬件方式解決,一方面避免性能損耗,一方面也要更早應(yīng)對未來硬件資安事件的發(fā)生。
接下來,英特爾也介紹了過去在 14nm 架構(gòu)的發(fā)展歷程,可以看到,從最早的 14nm 芯片中,時鐘速度僅能達到 4.2GHz,而到最新一代的產(chǎn)品中,已經(jīng)可以把時鐘速度拉到 5GHz,雖然同樣是 14nm,但也是有隨著時間不斷強化精進,配合微架構(gòu)的改善,達到計算效率的明顯增長。另一方面,未來 CPU 計算也不會只是針對過去認知的一般通用計算,由于 AI 計算已經(jīng)成為通用計算的一部份,因此針對這方面計算應(yīng)用的加速也是勢在必行的工作,英特爾在首款 10nm 方案中將引進 VNNI 框架,以及針對深度學(xué)習(xí)發(fā)展全新的指令集來加速深度學(xué)習(xí)計算的工作。
具體的指令集強化主要是在 INT8/INT16 計算工作的強化,由于這是 AI 推理工作最常使用的精度,因此主流 AI 計算架構(gòu)都是針對這方面進行大幅強化,英特爾在其 CPU 架構(gòu)中也將引入同樣的概念。由于英特爾處理器中已經(jīng)包含了非常強大的 AVX-512 多媒體加速指令集,因此主要的修改就是來自于這個計算區(qū)塊,通過增加 4 道指令,將乘加計算的周期大幅縮短,讓相關(guān)精度的數(shù)據(jù)可以在最短的時間獲得處理,理論上可獲得比沒有內(nèi)建相關(guān)指令的前代處理器產(chǎn)品 3 倍的 INT8 計算效能,以及 2 倍的 INT16 計算性能。
針對AI應(yīng)用這一當下和未來的主流計算趨勢,英特爾也會在其主力架構(gòu)中增加更多包含深度學(xué)習(xí)、訓(xùn)練以及推理計算加速的功能區(qū)塊。其下一代 14nm 處理器Cooper Lake將引進 AI 模型訓(xùn)練加速能力,支持 bfloat16的數(shù)據(jù)格式,可達到比 fp32高兩倍的數(shù)據(jù)輸出能力。
未來英特爾將針對三大計算領(lǐng)域布局更廣的計算架構(gòu),而這些架構(gòu)將不會像過去一樣在核心設(shè)計方面涇渭分明,而是混合了更多元,更具彈性的計算能力,包含 CPU 或 GPU 都是。
關(guān)于英特爾
英特爾(NASDAQ: INTC)是全球半導(dǎo)體行業(yè)的引領(lǐng)者,以計算和通信技術(shù)奠定全球創(chuàng)新基石,塑造以數(shù)據(jù)為中心的未來。我們通過精尖制造的專長,幫助保護、驅(qū)動和連接數(shù)十億設(shè)備以及智能互聯(lián)世界的基礎(chǔ)設(shè)施 —— 從云、網(wǎng)絡(luò)到邊緣設(shè)備以及它們之間的一切,并幫助解決世界上最艱巨的問題和挑戰(zhàn)。