NVIDIA tillkännager ”NVIDIA Titan V" Grafikkort: GV100 för $ 3000, Till salu nu

0 Shares

Utifrån ingenstans har NVIDIA avslöjat NVIDIA Titan V idag vid konferensen Neural Information Processing Systems 2017, med VD Jen-Hsun Huang som blinkar ut kortet på scenen. Bara sju månader efter att Volta tillkännagavs med Tesla V100-acceleratorn och GV100 GPU inuti den fortsätter NVIDIA sin banbrytande takt genom att släppa den GV100-drivna Titan V, tillgänglig för försäljning idag. Siktad på en bestämt mer beräkningsorienterad marknad än någonsin tidigare, är 815 mm2 tjock som är GV100 nu tillgänglig för en bredare allmänhet.

NVIDIA Compute Accelerator Specification Comparison
Titan V. Tesla V100
(PCIe)
Tesla P100
(PCIe)
Titan Xp
CUDA-kärnor 5120 5120 3584 3840
Tensorkärnor 640 640 Ej tillämpligt Ej tillämpligt
Core Clock 1200 MHz ? ? 1485MHz
Boost Clock 1455MHz 1370 MHz 1300 MHz 1582MHz
Minnes klocka 1,7 Gbps HBM2 1,75 Gbps HBM2 1,4 Gbps HBM2 11,4 Gbps GDDR5X
Minnesbussbredd 3072-bitars 4096-bitars 4096-bitars 384-bitars
minnesbandbredd 653 GB / sek 900 GB / sek 720 GB / sek 547GB / sek
VRAM 12 GB 16 GB 16 GB 12 GB
L2-cache 4,5 MB 6 MB 4 MB 3 MB
Enkel precision 13.8 TFLOPS 14 TFLOPS 9.3 TFLOPS 12.1 TFLOPS
Dubbel precision 6.9 TFLOPS
(1/2 ränta)
7 TFLOPS
(1/2 ränta)
4.7 TFLOPS
(1/2 ränta)
0,38 TFLOPS
(1/32 hastighet)
Tensorprestanda
(Djup lärning)
110 TFLOPS 112 TFLOPS Ej tillämpligt Ej tillämpligt
GPU GV100
(815mm2)
GV100
(815mm2)
GP100
(610mm2)
GP102
(471mm2)
Transistorantal 21.1B 21.1B 15.3B 12B
TDP 250W 250W 250W 250W
Formfaktor PCIe PCIe PCIe PCIe
Kyl Aktiva Passiv Passiv Aktiva
Tillverkningsprocess TSMC 12nm FFN TSMC 12nm FFN TSMC 16nm FinFET TSMC 16nm FinFET
Arkitektur Volta Volta Pascal Pascal
Lanseringsdag 12/07/2017 Q3’17 Q4’16 04/07/2017
Pris 2999 $ ~ $ 10000 ~ $ 6000 $ 1299

För specifikationsbladet har vi gått vidare och ställt upp det mot NVIDAs andra Pascal-kort, och med goda skäl. Medan Titan-kortserien kan ha börjat sitt liv som ett prosumer-kort 2013, har NVIDIAs GPU-design sedan dess blivit alltmer avvikande mellan beräkning och grafik. Och även om den tidigare Titan Xp baserades på den mer grafikfokuserade GP102 GPU, var själva kortet i första hand (men inte enbart) pitchat som ett beräkningskort på grundnivå för kunder som behövde ett (relativt) billigt sätt att göra FP32 beräkna och neuralt nätverksinferens i arbetsstationer och små kluster

Titan V ser i förlängning att Titan-sortimentet äntligen byter lojalitet och börjar använda NVIDIAs avancerade beräkningsfokuserade GPU: er, i det här fallet den Volta-arkitekturen baserade V100. Slutresultatet är att snarare än att vara NVIDIAs bästa prosumer-kort, är Titan V bestämt mer fokuserad på beräkning, särskilt på grund av kombinationen av prislappen och den unika funktionsuppsättningen som kommer från att använda GV100 GPU. Vilket är inte att säga att du inte kan göra grafik på kortet – det här är fortfarande ett grafikkort, utgångar och allt – men NVIDIA främjar först och främst det som ett AI-beräkningskort på arbetsstationsnivå och i förlängning med fokus på GV100 GPU: s unika tensorkärnor och de massiva fördelarna med neurala nätverksprestanda som de erbjuder jämfört med tidigare NVIDIA-kort.

I denna bemärkelse är Titan V en återgång till olika former till den professionella sidan av prosumer för Titan-familjen. En av de ursprungliga påståendena om berömmelse för den ursprungliga Titan var dess höga prestanda i specialiserade FP64-beräkningsarbetsbelastningar, något som gick förlorat på senare Titan X och Titan Xp. Genom att byta till NVIDIA: s specialiserade avancerade beräknings-GPU: er återvinner Titan V sina tidigare förlorade beräkningsfunktioner, samtidigt som de får alla beräkningsfunktioner som NVIDIA har infört sedan dess. Det är inget misstag att Jen-Hsun introducerade kortet vid en neural nätverkskonferens, eftersom det här är en stor bit av den professionella datorpubliken som NVIDIA riktar in sig med kortet.

Intressant är att jag jämför det med PCIe Tesla V100, jag är förvånad över hur nära korten är i funktioner och prestanda. NVIDIA har bekräftat att Titan V får GV100 GPU: s fullständiga, obegränsade FP64-beräkning och tensor-kärnprestanda. Så vitt vi vet (och från vad NVIDIA kommer att kommentera) verkar det inte som om de har artificiellt har inaktiverat någon av GPU: s kärnfunktioner. Vad som skiljer Titan från Tesla från en prestationssynpunkt är ganska enkelt: minneskapacitet, minnesbandbredd och bristen på NVLink-funktionalitet. Det finns också ett antal mindre skillnader mellan korten som hjälper till att skilja dem mellan server och arbetsstation – som passiv kontra aktiv kylning, NVLink och supportpolicyerna – men annars för kunder som kör ett litet antal kort, Titan V: s funktionsuppsättning är anmärkningsvärt nära de mycket dyrare Tesla V100-enheterna, vilket är en mycket intressant utveckling eftersom det visar hur säker NVIDIA är på att detta inte undergräver Teslas försäljning.

När vi går vidare och dyker in i siffrorna har Titan V 80 strömmande multiprocessorer (SM) och 5120 CUDA-kärnor, samma mängd som sina syskon Tesla V100. Skillnaderna kommer med minnet och ROP. I det som helt klart är en bärgningsdel för NVIDIA har en av kortets 4 minnespartitioner klippts, vilket lämnar Titan V med 12 GB HBM2 ansluten via en 3072-bitars minnesbuss. Eftersom varje minneskontroll är associerad med en ROP-partition och 768 kB L2-cache, minskar detta i sin tur L2 till 4,5 MB, samt minskar ROP-antalet.

När det gäller klockhastighet har HBM2 nedklockats något till 1,7 GHz, medan 1455 MHz boost-klocka faktiskt matchar 300 W SXM2-varianten av Tesla V100, även om den gaspedalen passivt kyls. Anmärkningsvärt har antalet tensorkärnor inte berörts, även om det officiella 110 DL TFLOPS-betyget är lägre än 1370MHz PCIe Tesla V100, eftersom det verkar som om NVIDIA använder en klockhastighet lägre än deras boost-klocka i dessa beräkningar.

För själva kortet har den en ångkammarkylare med kopparfläns och 16 effektfaser, allt för 250 W TDP som har blivit standard med de enda GPU Titan-modellerna. Outputmässigt ger Titan V 3 DisplayPorts och 1 HDMI-kontakt. Och när det gäller kort-till-kort-kommunikation verkar PCB i sig ha NVLink-anslutningar på toppen, men dessa ser ut att ha avsiktligt blockerats av höljet för att förhindra att de används och är förmodligen inaktiverade.

Som tidigare nämnts driver NVIDIA överraskande detta som ett beräkningsacceleratorkort, särskilt med tanke på att Titan V har tensorkärnor och håller TITAN-märket i motsats till GeForce TITAN. Men det finns de av oss som vet bättre än att anta att folk inte tappar $ 3000 för att använda det senaste Titan-kortet för spel, och även om spel inte är det primära (eller till och med sekundära) fokus på kortet, kommer du inte heller att se NVIDIA förnekar det. I den meningen kommer Titan V att behandlas som ett jack-of-all-trades-kort av företaget.

För detta ändamål har ingen spelprestationsinformation avslöjats, men NVIDIA har bekräftat att kortet använder standard GeForce-drivrutinsstack. Och på den anteckningen släppte NVIDIA igår 388,59 med officiellt Titan V-stöd. Hur mycket dessa förare faktiskt har optimerats för GV100 är en helt annan sak; Volta är en ny arkitektur, tydligt ibland. Speaklng bara av manschetten här, för grafiska arbetsbelastningar har kortet fler resurser än Titan Xp i nästan alla meningsfulla mätvärden, men det är också en mindre skillnad på papper än du kanske tror.

När det gäller NVIDIA: s avsedda marknad för dator- och AI-användare kommer Titan V att stödjas av NVIDIA GPU Cloud, som inkluderar TensorRT, ett antal djupinlärningsramar och HPC-relaterade verktyg.

Om det gyllene höljet inte redan föreslog det, snider Titan V också ut en ny ögonvattnande prispunkt, släpper in till 2999 $ och säljs nu i NVIDIA-butiken. NVIDIA har hittills sålt Tesla V100-produkter så fort de kan producera dem, så jag kommer inte bli förvånad om Titan V ser ett liknande öde. Prislappen på $ 3000 är ganska hög, även enligt Titan-standarder, men med det sällsynta Tesla V100 PCIe-kortet som kostar cirka 10 000 dollar är Titan V betydligt billigare. I vissa avseenden är jag faktiskt förvånad att NVIDIA säljer ett GV100-kort för så lite; det här är GV100-bärgningsdelar som inte gör snittet för Tesla – så alternativet skulle vara att kasta bort dem – men det visar bara hur säker NVIDIA är att det inte undergräver Tesla-familjen.

I vilket fall som helst, för NVIDIA-professionella användare som har letat efter att doppa tårna i Volta men inte ville ha ett fullfjädrat Tesla-kort, kommer Titan V helt klart att bli ett populärt kort. Under de senaste två åren har NVIDIA: s AI-ansträngningar skjutit på alla cylindrar, och genom att sätta ner ett GV100-kort till bara $ 3000, förvänta dig att se dem knäcka marknaden så mycket längre. Jag vågar säga att “prosumer” Titan har dött med detta kort, men för den snabbt växande professionella beräkningsmarknaden ser det ut att vara exakt den typ av kort som många utvecklare har väntat på.

Uppdatering (12/8/17): Igår släppte NVIDIA också drivrutinversion 388.59 WHQL, vilket ger produktsupport till Titan V, tillsammans med Fallout 4 VR-stöd. NVIDIA har noterat att Titan V för närvarande lider av TDR-fel och visningsläckning under uppspelning av Blu-ray-skivor med höga upplösningar, liksom från G-Sync-skärmsläckning när man upprepade gånger växlar mellan olika minnesöverklockor. Slutligen har denna mindre uppdatering en buggfix, som löser flimmer på GTX 1080-utrustade G-Sync-bärbara datorer.

0 Shares