Nvidias GeForce RTX 3080 Founders Edition är här, hävdar topplaceringen på vår GPU riktmärken hierarki, och ranking som det bästa grafikkortet som för närvarande finns — förutsatt att du är efter prestanda först, med pris och kraft är mindre oro. Efter månader av väntan har vi äntligen oberoende riktmärken och testdata., Nvidia har kastat ner gauntlet, tydligt utmanande AMDs stora Navi för att försöka matcha eller slå vad Ampere-arkitekturen ger till bordet.
Vi kommer att vänta med en slutlig dom för tillfället, eftersom vi har andra RTX 3080-kort från tredje part att granska, som börjar så snart som i morgon. Det är goda nyheter, eftersom det betyder att kunderna inte kommer att begränsas till Nvidias Founders Edition för den första månaden eller så som vi var med RTX 20-seriens lansering., En annan bra nyhet är att det inte finns någon Founders Edition ” tax ” den här gången: RTX 3080 FE kostar $699, direkt från Nvidia, och det är baspriset på RTX 3080-kort för tillfället. Den dåliga nyheten är att vi fullt ut förväntar oss att utbudet är otillräckligt för att hålla jämna steg med vad vi förväntar oss att vara exceptionellt hög efterfrågan.
summan av kardemumman, om du inte har något emot spoilers, är att RTX 3080 FE är 33% snabbare än RTX 2080 Ti, i genomsnitt., Eller om du föredrar andra jämförelsepunkter är det 57% snabbare än RTX 2080 Super, 69% snabbare än RTX 2080 FE-heck, det är till och med 26% snabbare än Titan RTX!
men det finns en hake: vi mätte alla dessa ”procent snabbare” resultat i vår testsvit som körs vid 4K ultra-inställningar. Ledningen smalnar om du släpper ner till 1440p, och det minskar ännu mer på 1080p. det är fortfarande 42% snabbare än en 2080 FE på 1080p ultra, men det här är väldigt mycket ett kort för högre upplösningar., Dessutom kan du behöva en snabbare CPU för att få hela 3080 erfarenhet-kolla in vår följeslagare GeForce RTX 3080 CPU skalning artikel för fullständig information.,
Graphics Card | RTX 3080 FE | RTX 2080 Super FE | RTX 2080 FE | ||||||||
---|---|---|---|---|---|---|---|---|---|---|---|
Architecture | GA102 | TU104 | TU104 | ||||||||
Process (nm) | Samsung 8N | TSMC 12FFN | TSMC 12FFN | ||||||||
Transistors (Billion) | 28.3 | 13.6 | 13.6 | ||||||||
Die size (mm^2) | 628.,4 GPCs |
SMs |
FP32 CUDA-kärnor |
tio kärnorna |
b kärnor |
|
VRAM SP (Gbps) |
|
Sep-20 | Jul-19 | Sep-18 |
lanseringspris | $699 | $699 | $799 |
möt ga102: djurets hjärta
vi har en separat artikel som går djupt in i ampere-arkitekturen som driver GeForce RTX 3080 och andra relaterade GPU: er., Om du vill ha full genomgång av allt som har förändrats jämfört med Turing arkitektur, rekommenderar vi att du börjar där. Men här är höjdpunkten rullen av de viktigaste förändringarna:
GA102 är den första GPU från Nvidia att släppa in de enskilda siffrorna på litografi, med hjälp av Samsungs 8N-process. Det allmänna samförståndet är att TSMC: s N7 — nod är ”bättre” övergripande, men det kostar också mer och är för närvarande i mycket hög efterfrågan-inklusive från Nvidias egna A100. Kan konsumenten Ampere GPU har varit ännu bättre med 7nm? Kanske., Men de kan ha kostat mer, bara varit tillgängliga i begränsade mängder,eller kanske skulle de ha försenats några månader. Oavsett, GA102 är fortfarande ett stort och kraftfullt chip, med 28,3 miljarder transistorer packade i en 628,4 mm kvadratisk form. Om du undrar är det 52% fler transistorer än tu102-chipet som används i RTX 2080 Ti, men i ett 17% mindre område.
Ampere slutar som en delad arkitektur, med ga100 tar på Datacenter ambitioner medan GA102 och andra konsumentmarker har betydande skillnader., GA100 fokuserar mycket mer på fp64-prestanda för vetenskapliga arbetsbelastningar, samt fördubbling på djup inlärningshårdvara. Under tiden GA102 droppar de flesta av FP64 funktionalitet och istället innehåller ray tracing hårdvara, plus några andra arkitektoniska förbättringarna. Låt oss ta en närmare titt på Ampere SM finns i GA102 och GA104.,
Nvidia GPU består av flera gpcs (grafikbehandlingskluster), som var och en har ett visst antal SMS (strömmande multiprocessorer). Nvidia delar varje SM i fyra partitioner som kan fungera på separata uppsättningar data. Med Ampere har varje SM-partition nu 16 FP32 CUDA-kärnor, 16 Fp32/INT CUDA-kärnor, en tredje generationens Tensorkärna, load / store-enheter och en speciell funktionsenhet., Hela SM har tillgång till delad L1-cache och minne, och det finns en enda andra generationens RT-kärna. Totalt betyder det 64 fp32-kärnor och 64 fp32/INT-kärnor, fyra Turingkärnor och en RT-kärna. Låt oss bryta ner det lite mer.
Turing GPU lade till stöd för samtidiga FP32 (32-bitars flyttal) och INT (32-bitars heltal) operationer. FP32 tenderar att vara den viktigaste arbetsbelastningen för grafik och spel, men det finns fortfarande en anständig mängd INT — operationer-för saker som adressberäkningar, texturuppslagningar och olika andra typer av kod., Med Ampere uppgraderas INT datapath för att stödja INT eller FP32, men inte samtidigt.
om du tittar på de råa specifikationerna verkar Ampere vara ett mycket större hopp i prestanda än de 70% vi mätte. 30 TFLOPS! Men det kommer i allmänhet inte att komma någonstans nära så högt eftersom det andra datapatet är en antingen / eller situation: det kan inte göra båda typerna av instruktioner på rörledningen i samma cykel. Nvidia säger att cirka 35% av gaming beräkningar är INT verksamhet, vilket innebär att du kommer att sluta med något mer som 20 TFLOPS av FP32 och 10 TOPPAR INT på RTX 3080.,
medan vi är i ämnet, låt oss också påpeka att en stor del av den ökade prestanda kommer från ökade effektgränser. RTX 2080 var en 225W del (för Founders Edition), och RTX 3080 lägger i grunden 100W till det. Det är hälften igen mer kraft för 70% mer prestanda. Det är tekniskt en vinst i total effektivitet, men i strävan efter prestanda var Nvidia tvungen att gå vidare till höger på spännings-och frekvenskurvan., Nvidia säger RTX 3080 kan leverera en 90-procentig förbättring i prestanda per watt om du vill begränsa prestanda till samma nivå på både 2080 och 3080 … men kom igen, vem vill begränsa prestanda på det sättet? Kanske bärbara datorer, men vi åker inte dit.
en sak som inte har förändrats mycket är videoportarna. Det är bara delvis sant., För det första finns det en enda HDMI — port, men det är HDMI 2.1 istället för Turings HDMI 2.0 b, men de tre DisplayPort-anslutningarna förblir 1.4 a. och sist men inte minst finns det ingen VirtualLink-port den här rundan-tydligen är VirtualLink död. SLITA. De olika portarna kan alla 8K60 använda DSC (Display Stream Compression), en ”visuellt förlustfri” teknik som faktiskt inte är riktigt visuellt förlustfri. Men du kanske inte märker på 8K.
komma tillbaka till kärnorna, Nvidias tredje generationens tensorkärnor i GA102 arbetar på 8x4x4 FP16 matriser, så upp till 128 matrisoperationer per cykel., (Turings tensor kärnor används 4x4x4 matriser, medan GA100 använder 8x4x8 matriser.) Med FMA (smält Multiplicera-Lägg till), det är 256 FP operationer per cykel, per tensor kärna. Multiplicera med 272 totala tensor kärnor och klockhastighet, och det ger dig 119 TFLOPS av FP16 compute. Amperes tensorkärnor lägger emellertid också till stöd för finkornig sparsity-i grund och botten eliminerar det slöseri med tid att göra multiplikationer med 0, eftersom svaret alltid är 0. Sparsity kan ge upp till två gånger FP16 prestanda i program som kan använda den.,
RT-kärnorna får liknande förbättringar, med upp till dubbla ray / triangle-skärningsberäkningarna per klocka. RT-kärnorna stöder också en tidsvariabel, vilket är användbart för att beräkna saker som rörelseoskärpa. Allt sagt säger Nvidia att 3080s nya RT-kärnor är 1,7 gånger snabbare än RTX 2080-talet, och de kan vara upp till fem gånger så snabba för rörelseoskärpa.
det finns gott om andra förändringar också. L1-cache/delad minneskapacitet och bandbredd har ökats för att bättre mata kärnorna( 8704KB vs. 4416KB), och L2-cachen är också 25% större än tidigare (5120KB vs., 4096KB). L1 cache kan också konfigureras som varierande mängder av L1 vs delat minne, beroende på behoven hos programmet. Registrera filstorlek är också nästan 50% större (17408KB vs. 11776KB) med RTX 3080. GA102 kan också göra samtidiga RT + grafik + DLSS (tidigare skulle användning av RT-kärnorna stoppa CUDA-kärnorna).
slutligen har rasteroperatörerna (ROPS) flyttats ut ur minnesstyrenheterna och in i GPC: erna. Varje GPC har två ROP partitioner av åtta ROP enheter., Detta ger mer flexibilitet i prestanda, så där GA102 har upp till 112 ROPS totalt, inaktiverar RTX 3080 två minneskontroller men bara en GPC och slutar med 96 ROPS. Detta är mer kritiskt för RTX 3070 / GA104, men som fortfarande har 96 ROPS trots att den bara har åtta minneskontroller. Varje GPC innehåller också sex TPCs (Texture Processing Clusters) med åtta TMUs (Texture Mapping Units) och en polymorph-motor, även om Nvidia endast möjliggör 34 TPCs för 3080.,
med kärnförbättringarna ur vägen, låt oss också snabbt diskutera minnesundersystemet. GA102 stöder upp till tolv 32-bitars minneskanaler, varav tio är aktiverade på RTX 3080. Nvidia tillsammans med Micron för att använda sin GDDR6X minne, som använder PAM4 signalering för att öka datahastigheten ännu högre än innan. Där RTX 20-seriens kort toppade ut vid 15.,5 gbit / s i 2080 Super och 14 Gbps i andra RTX kort, GDDR6X går vid 19 Gbps i RTX 3080. Kombinerat med 320 – bitars gränssnitt, som ger 760 GBps bandbredd-en 70% förbättring jämfört med RTX 2080.
RTX 3080s minneskontroller har också förbättrats, med en ny funktion som heter EDR: Error Detection and Replay. När minnet upptäcker en misslyckad överföring, snarare än att krascha eller korrumpera data, försöker det helt enkelt igen. Det kommer att göra detta tills det är framgångsrikt, men det är fortfarande möjligt att orsaka en krasch med minnesöverklockning., Den intressanta biten är att med EDR kan högre minnesklockor vara uppnåeliga, men resulterar fortfarande i lägre prestanda. Det beror på att EDR slutar minska minnesprestandan när misslyckade överföringar inträffar. Vi har mer att säga om detta i överklockningssektionen.,
GeForce RTX 3080 Founders Edition: Design, kylning, estetik
Nvidia har radikalt förändrat utformningen av sina grundare Edition-kort för RTX 30-serien., Den nya designen innehåller fortfarande två axiella fans, men Nvidia omdesignade PCB och förkortade det så att ”baksidan” av kortet (bort från videoportarna) består av bara en fläkt, värmepipor, radiatorfenor och det vanliga grafikkortets hölje. Nvidia säger att den nya designen ger betydande förbättringar i kylningseffektiviteten, samtidigt som bullernivåerna sänks. Vi får se frukterna av designen senare.
estetik är mycket subjektiva, och vi har hört massor av människor som den nya designen, medan andra tycker att det ser tråkigt ut., Det finns ingen RGB bling om det är din sak, och den enda belysningen består av en vit GeForce RTX-logotyp på toppen av kortet med subtil belysning runt ”X” på båda sidor av kortet (men bara hälften av ” X ”tänds på sidan med” RTX 3080 ” – logotypen).
personligen tycker jag att det nya kortet ser ganska trevligt ut, och det känns väldigt solidt i handen. Det handlar faktiskt om 100g tyngre än den tidigare RTX 2080-designen, och såvitt jag vet är det det tyngsta single-GPU-kortet Nvidia någonsin har skapat., Det handlar också om 2cm längre än föregående generations kort och använder den typiska två-slot bredd. (GeForce RTX 3090 är ungefär redo att göra 3080 FE ser ynklig, men med sin massiva tre-slot kylare.)
Nvidia gav ovanstående bilder av teardown av RTX 3080 Founders Edition. Vi är inte redo att försöka demontera vårt kort ännu — och uppriktigt sagt är vi ute av tid – men vi kan återvända till ämnet snart. Vi får höra att få kortet ifrån varandra är lite svårare den här omgången, för det mesta för att Nvidia har gömt skruvarna bakom små omslag.,
huvudkortet ser mycket tätare ut än tidigare GPU-enheter, med 10 gddr6x-minneschips som omger GPU i mitten. Du kan också se den vinklade 12-stiftskontakten och den funky-snygga utklippet i slutet av PCB. Strömförsörjning är uppenbarligen viktigt med en 320W TGP, och du kan se alla fasta elektrolytkondensatorer placerade till vänster och höger om minneschipsen.,
minnesarrangemanget är också intressant, med fyra marker på vänster och höger sida av GPU, upp till tre marker ovanför GPU (två monteringspositioner är tomma för RTX 3080) och ett sista enda chip under GPU. Återigen spenderade Nvidia tydligt mycket för att minska storleken på brädet och andra komponenter för att rymma den nya och förbättrade kyldesignen. Spoiler: det fungerar mycket bra.
en intressant sak är att ”front” — fläkten (nära videoportarna) snurrar i vanlig riktning-moturs., ”Back” – fläkten, som vanligtvis kommer att vända uppåt när du installerar kortet i ett ATX-fall, snurrar medurs. Om man tittar på fenorna betyder det att backfläkten snurrar motsatt riktning från vad vi normalt förväntar oss. Anledningen är att Nvidia hittade detta arrangemang drar luft genom radiatorn bättre och genererar mindre ljud. Observera också att bakfläkten är något tjockare, och den integrerade ringen bidrar till att öka det statiska trycket på båda fläktarna samtidigt som varv är låga.
om du inte gillar utseendet på Founders Edition, vara säker på att det kommer att finnas gott om andra alternativ., Vi har några RTX 3080-kort från tredje part för testning, som alla naturligtvis inkluderar RGB-belysning. Ingen av de tredje part kort använder 12-pin strömkontakt, antingen-inte att det verkligen spelar någon roll, eftersom den nödvändiga adaptern kommer med kortet. Ändå ser den vertikalt monterade 12-pin-porten bara lite mindre robust ut om du råkar byta GPU regelbundet. Jag planerar att lämna adaptern permanent ansluten och bara ansluta eller koppla bort de vanliga 8-pin PEG-kablarna., 12-stiftskontakten verkar vara klassad för 25-cykler, och jag har redan bränt igenom hälften av dem (inte för att jag förväntar mig att det misslyckas när som helst snart).