北京時(shí)間4月6日消息,谷歌為了滿足自身運(yùn)算量的需求,并沒(méi)有去建立更多的運(yùn)算中心,而是自助開(kāi)發(fā)了適用于AI計(jì)算的高性能專用硬件—TPU。谷歌在一篇博文中提到,其自主研發(fā)的TPU在性能上一點(diǎn)不輸英特爾,甚至在某些性能上還有所超越。
谷歌自主研發(fā)了TPU處理器(圖片來(lái)自kkj)
谷歌表示,相比類似的服務(wù)器級(jí)Intel Haswell CPU和NVIDIA K80 GPU,TPU在AI運(yùn)算測(cè)試中的平均速度要快15-30倍。更重要的是,TPU的每瓦性能要比普通的GPU高出25-80倍。此外,谷歌工程師還為T(mén)PU開(kāi)發(fā)了名為CNN1的軟件,其可以讓TPU的運(yùn)行速度比普通CPU高出70多倍。
同時(shí)谷歌還表示,由于TPU專為機(jī)器學(xué)習(xí)所運(yùn)行,得以較傳統(tǒng)CPU、GPU降低精度,在計(jì)算所需的電晶體數(shù)量上,自然可以減少,也因此,可從電晶體中擠出更多效能,每秒執(zhí)行更復(fù)雜、強(qiáng)大的機(jī)器學(xué)習(xí)模組,并加速模組的運(yùn)用,使得使用者更快得到答案。谷歌
指出,團(tuán)隊(duì)已經(jīng)在數(shù)據(jù)中心執(zhí)行TPU超過(guò)一年,且發(fā)現(xiàn)TPU能讓機(jī)器學(xué)習(xí)每瓦提高一個(gè)數(shù)量級(jí),粗略來(lái)說(shuō),相當(dāng)于摩爾定律中晶片效能往前推進(jìn)了七年或者三代。據(jù)悉,谷歌數(shù)據(jù)中心自2015年以來(lái)一直在使用TPU來(lái)加速AI服務(wù),而且收獲了理想的效果,其能夠更快的處理用戶發(fā)送的請(qǐng)求,降低結(jié)果反饋的延遲。
值得一提的是,谷歌認(rèn)為現(xiàn)在的TPU仍在硬件和軟件方面存在很大的優(yōu)化空間,比如假定用上了NVIDIA K80 GPU中的GDDR5內(nèi)存,那么TPU就可以發(fā)揮出更好的性能。