2017年5月11日0點(北京時間),NVIDIA CEO 黃仁勳在第八屆GTC大會上帶來了一段主題為《計算的未來》的演講,在長達兩小時的演講中,老黃帶來了不少乾貨!其中最令筆者在意的是:
沒錯!它就是老黃手裡拿著的這片Tesla V100!老黃稱為了研發Volta架構,NVIDIA已經花費了30億美元!!!
比TITAN X更誇張的規模架構:
作為一款專注於AI領域的產品,Tesla V100採用了全新的TSMC 12nm FFN工藝,Volta全新架構(目前消費級是Pascal),內置5120個CUDA核心(是目前最強TITAN XP的1.3倍),擁有7.5 FP64 TFLOPS、15FP32 TFLOPS的運算能力,非常值得注意的一點是它採用了容量為16GB的HBM2顯存,帶寬高達900GB/s;同時支持NVLink,帶寬達300GB/s。
如果把Volta核心放在桌面顯卡,就算不看架構優化,單看規模性能已比TITAN XP強30%以上,算上架構優化和HBM2顯存,預計提升50%問題不大,此時AMD的心情可想而知...
在提及Tesla V100的DIE尺寸時,老黃笑稱:Tesla V100的DIE只有各位手上的AppleWatch錶盤般大小!
同時老黃還發布了搭載最新Tesla V100的NVIDIA DGX-1和NVIDIA DGX STATION等工作站產品,售價分別為149000美元和69000美元(沒錯,是刀,笑~)。
隨後老黃又祭出了面向超級計算領域的Tesla V100產品(採用PCIe接口),並笑稱其體積只有CD盒般大小,但卻擁有超強的算力!簡直感人!
兩代頂級消費卡&專業卡參數對比:
參數對比 | |||
顯卡名稱 | Tesla P100 | GTX1080Ti | Tesla V100 |
核心架構 | Pascal | Pascal | Volta |
晶體管數 | 153億 | 120億 | 211億 |
製程工藝 | 16nm | 16nm | 12nm |
流處理器 | 3584 | 3584 | 5120 |
紋理單元 | 224 | 224 | 320 |
顯存容量 | 16GB HBM2 | 11GB GDDR5X | 16GB HBM2 |
顯存位寬 | 4096Bit | 352Bit | 4096Bit |
核心頻率 | -1480MHz | 1481-1582MHz | -1455MHz |
TDP | 300W | 250W | 300W |
DIE面積 | 610mm² | 471mm² | 815mm² |
對比說明:對比P100和V100,可以看到其核心規模是超大幅度提升的,而且功耗同時維持在300W,說明這12nm和新架構的能耗比控制也已經大幅度超越帕斯卡了,需知道目前帕斯卡的能耗比已經是極大幅度強於AMD北極星的了,這麼玩下去AMD真的hard to play了。
當然核心DIE面積也從610mm²提升為815mm²了,但實際上晶體管的密度、流處理器的單位密度都提升了很多,但頻率依然能控制在1.4GHz的高頻,除了黑科技真想不到怎麼形容了,NVIDIA現在的對手就只有自己啊。
通過上述對比我們可以大概推測出下一代Volta消費級顯卡(也許就是GTX2080Ti)的規模,5120個流處理器、250W、12GB GDDR6顯存、320紋理單元,大概能確定下來的就這些了,運算性能理論上會比GTX1080Ti強30%~40%,對於頂級顯卡來說,這個幅度已經很BT了。
小結:
雖然這次GTC上老黃並沒有帶來任何普通消費級顯卡產品,但從採用全新Volta架構的Tesla V100的幾大特點中我們亦能對今年底晚些發佈的Volta顯卡做一些相對準確的預測。
其一,採用全新的TSMC 12nm FFN工藝似乎是沒跑的了!
其二,雖然Tesla V100用的是HBM2顯存,但本次GTC大會上海力士首次展示了8Gb GDDR6顯存芯片,而且據稱GDDR6顯存首發為NVIDIA的下一代顯卡Volta設計,且將定於2018年發售。所以筆者認為下代Volta顯卡採用GDDR6顯存的機率會更大一些!
其三,鑑於Tesla V100較之上一代產品Tesla P100無論是規格還是性能提升都十分明顯,筆者對於即將到來Volta消費級顯卡還真是什麼期待呢!
另外,雖然這次NVIDIA沒有發佈Volta消費級產品,但其Volta架構產品實則已出,第三季度會先面向Tesla計算市場發售。而AMD方面VEGA還不見聲響,生生被NVIDIA甩開了兩代;此間種種都暗示著AMD在顯卡這塊未來一到兩年的路……只怕是不太好走了!