for Nvidia’ s GeForce RTX 3080 Grundlæggerne Edition er her, hævder topplacering på vores GPU benchmarks hierarki, og placeringen som den bedste grafik kort i øjeblikket til rådighed, forudsat at du er ude efter ydelse første, med pris og magt bliver mindre bekymringer. Efter måneders ventetid har vi endelig uafhængige benchmarks og testdata., Nvidia har kastet gauntlet ned og klart udfordret AMDs Store Navi for at prøve at matche eller slå, hvad Ampere-arkitekturen bringer til bordet.
Vi vil holde en endelig dom for nu, da vi har andre tredjeparts rt.3080-kort at gennemgå, som begynder så snart som i morgen. Det er gode nyheder, da det betyder, at kunderne ikke vil være begrænset til Nvidias Founders Edition for den første måned eller deromkring, som vi var med RT.20-serien lancering., En anden god nyhed er, at der ikke er nogen Founders Edition ‘skat’ denne gang: rt.3080 FE koster $699, direkte fra Nvidia, og det er basisprisen på RT. 3080-kort for tiden. Den dårlige nyhed er, at vi fuldt ud forventer, at udbuddet er utilstrækkeligt til at holde trit med det, vi forventer at være usædvanligt stor efterspørgsel.
den nederste linje, hvis du ikke har noget imod spoilere, er, at rt.3080 FE i gennemsnit er 33% hurtigere end RT. 2080 Ti., Eller hvis du foretrækker andre sammenligningspunkter, er det 57% hurtigere end RT!2080 Super, 69% hurtigere end RT! 2080 FE — heck, det er endda 26% hurtigere end Titan rt!!
men der er en fangst: vi målte alle disse ‘procent hurtigere’ resultater på tværs af vores testpakke, der kører ved 4K ultra-indstillinger. Føringen indsnævres, hvis du falder ned til 1440p, og den falder endnu mere ved 1080p. den er stadig 42% hurtigere end en 2080 FE ved 1080p ultra, men dette er meget et kort lavet til højere opløsninger., Du har muligvis også brug for en hurtigere CPU for at få den fulde 3080 — oplevelse-Tjek vores følgesvend GeForce rt.3080 CPU-Skaleringsartikel for de fulde detaljer.,
Graphics Card | RTX 3080 FE | RTX 2080 Super FE | RTX 2080 FE | |||||||
---|---|---|---|---|---|---|---|---|---|---|
Architecture | GA102 | TU104 | TU104 | |||||||
Process (nm) | Samsung 8N | TSMC 12FFN | TSMC 12FFN | |||||||
Transistors (Billion) | 28.3 | 13.6 | 13.6 | |||||||
Die size (mm^2) | 628.,4 GPCs |
SMs |
FP32 CUDA Kerner |
ti Kerner |
B Kerner |
VRAM Sp (Gbps) |
Sep-20 |
Jul-19 |
Sep-18 |
|
Lancering Pris | $699 | $699 | $799 |
Mød GA102: The Heart of the Beast
Vi har en særskilt artikel, går dybt ind i Ampere-arkitektur, som driver GeForce RTX 3080 og andre relaterede Gpu ‘ er., Hvis du vil have den fulde gennemgang af alt, hvad der er ændret i forhold til Turing-arkitekturen, anbefaler vi at starte der. Men her er højdepunktsrullen for de vigtigste ændringer:
GA102 er den første GPU fra Nvidia, der falder ind i de enkelte cifre på litografi ved hjælp af Samsungs 8N-proces. Den generelle konsensus er, at TSMCs N7 — knude generelt er ‘bedre’, men det koster også mere og er i øjeblikket meget efterspurgt-inklusive fra Nvidias egen A100. Kunne forbrugeren Ampere GPU ‘ er have været endnu bedre med 7nm? Måske., Men de kunne have kostet mere, kun været tilgængelige i begrænsede mængder, eller måske ville de have været forsinket et par måneder til. Uanset hvad er GA102 stadig en stor og kraftfuld chip, der kan prale af 28.3 milliarder transistorer pakket ind i en 628.4 mm Firkantet dør. Hvis du undrer dig, er det 52% flere transistorer end TU102-chippen, der bruges i RT.2080 Ti, men i et 17% mindre område.Ampere ender som en delt arkitektur, hvor GA100 påtager sig datacenterambitioner, mens GA102 og andre forbrugerchips har betydelige forskelle., GA100 fokuserer langt mere på fp64-præstationer for videnskabelige arbejdsbelastninger samt fordobling af dyb læringshard .are. I mellemtiden falder GA102 det meste af fp64-funktionaliteten og inkluderer i stedet strålesporingshard .are plus nogle andre arkitektoniske forbedringer. Lad os se nærmere på Ampere SM fundet i GA102 og GA104.,
for Nvidia Gpu ‘ er består af flere GPCs (Graphics Processing Klynger), som hver har nogle antallet af SMs (Streaming Multiprocessors). Nvidia opdeler hver SM i fire partitioner, der kan fungere på separate datasæt. Med Ampere har hver SM-partition nu 16 FP32 CUDA-kerner, 16 FP32/INT CUDA-kerner, en tredje gen-tensor-kerne, load / store-enheder og en speciel funktionsenhed., Hele SM har adgang til delt L1 cache og hukommelse, og der er en enkelt anden gen RT kerne. I alt betyder det 64 FP32 kerner og 64 FP32 / INT kerner, fire Turing kerner og en RT kerne. Lad os bryde det ned lidt mere.
Turing GPU ‘ erne tilføjede support til samtidige FP32 (32-bit floating point) og INT (32-bit heltal) operationer. FP32 har en tendens til at være den vigtigste arbejdsbyrde for grafik og spil, men der er stadig en anstændig mængde int — operationer-til ting som adresseberegninger, teksturopslag og forskellige andre typer kode., Med Ampere opgraderes int datapath til at understøtte INT eller FP32, men ikke på samme tid.
Hvis du ser på de rå SPECIFIKATIONER, ser Ampere ud til at være et langt større spring i ydeevne end de 70%, vi målte. 30 TFLOPS! Men det vil generelt ikke komme nogen steder i nærheden af det høje, fordi den anden datapath er en enten/eller situation: den kan ikke udføre begge typer instruktioner på rørledningen i samme cyklus. Nvidia siger, at omkring 35% af gaming beregninger er INT operationer, hvilket betyder, at du vil ende op med noget mere som 20 TFLOPS af FP32 og 10 TOPPE af INT på RTX 3080.,
mens vi er på emnet, lad os også påpege, at en stor del af den øgede ydeevne kommer fra øgede effektgrænser. Rt.2080 var en 225. del (til Founders Edition), og rt. 3080 tilføjer dybest set 100. til det. Det er halvdelen igen mere strøm til 70% mere ydelse. Det er teknisk set en sejr i den samlede effektivitet, men i forfølgelsen af ydeevne måtte Nvidia bevæge sig længere til højre på spændings-og frekvenskurven., Nvidia siger rt?3080 kan levere en 90% forbedring i performance-per-watatt, hvis du begrænser ydeevnen til det samme niveau på både 2080 og 3080 … men kom nu, hvem vil begrænse ydeevnen på den måde? Nå, måske bærbare computere, men lad os ikke gå der.
En ting der ikke har ændret sig meget, er video-porte. Okay, det er kun delvist sandt., For det første, at der er en enkelt HDMI-port, men det er HDMI 2.1 i stedet for Turing ‘ s HDMI-2.0 b, men tre DisplayPort forbindelser er fortsat 1.4 en. Og sidst, men ikke mindst, er der ingen VirtualLink port denne runde — tilsyneladende, VirtualLink er død. RIP. De forskellige porte er alle i stand til 8K60 ved hjælp af DSC (Display Stream Compression), en “visuelt tabsfri” teknik, der faktisk ikke rigtig visuelt tabsfri. Men du bemærker måske ikke ved 8K.
Når du kommer tilbage til kernerne, arbejder Nvidias tredje gen tensor-kerner i GA102 på 8 .4 .4 FP16 matricer, så op til 128 Matri operationsoperationer pr., (Turings tensorkerner brugte 4 .4 .4 matricer, mens GA100 bruger 8 .4 .8 matricer.) Med FMA (fused multiplier-add)er det 256 FP-operationer pr. Gang med 272 samlede tensor kerner og clockhastighed, og det giver dig 119 TFLOPS af FP16 beregne. Ampere ‘ s tensor-kerner tilføjer dog også support til finkornet sparsity-dybest set eliminerer det spild af tid med at gøre multiplikationer med 0, da svaret altid er 0. Sparsity kan give op til to gange FP16-ydeevnen i applikationer, der kan bruge den.,
RT-kernerne modtager lignende forbedringer med op til det dobbelte af ray / triangle-skæringsberegningerne pr. RT-kernerne understøtter også en tidsvariabel, som er nyttig til beregning af ting som bevægelsessløring. Alt i alt siger Nvidia, at 3080s nye RT-kerner er 1,7 gange hurtigere end RT.2080 ‘ erne, og de kan være op til fem gange så hurtige til bevægelsessløring.
Der er også mange andre ændringer. L1-cache/delt hukommelseskapacitet og båndbredde er blevet øget for bedre at fodre kernerne (8704KB vs. 4416KB), og L2-cachen er også 25% større end før (5120KB vs., 4096KB). L1-cachen kan også konfigureres som forskellige mængder L1 vs. delt hukommelse, afhængigt af applikationens behov. Registrer filstørrelsen er også næsten 50% større (17408KB vs. 11776KB) med RT.3080. GA102 kan også udføre samtidige rt + grafik + DLSS (tidligere ville brug af RT-kernerne stoppe CUDA-kernerne).
endelig er raster-operatørerne (ROPS) flyttet ud af hukommelsescontrollerne og ind i GPC ‘ erne. Hver GPC har to ROP-partitioner på otte ROP-enheder hver., Dette giver mere fleksibilitet i ydeevnen, så hvor GA102 har op til 112 ROPS i alt, deaktiverer rt.3080 to hukommelsescontrollere, men kun en GPC og ender med 96 ROPS. Dette er dog mere kritisk for RT.3070 / GA104, som stadig har 96 ROPS, selvom den kun har otte hukommelsescontrollere. Hver GPC indeholder også seks TPC ‘er (te .ture Processing Clusters) med otte tmus (te .ture Mapping Units) og en polymorph-motor, selvom Nvidia kun muliggør 34 TPC’ er til 3080.,
Med den centrale forbedringer ud af vejen, lad os også hurtigt drøfte hukommelse delsystem. GA102 understøtter op til tolv 32-bit hukommelseskanaler, hvoraf ti er aktiveret på RT.3080. Nvidia gik sammen med Micron for at bruge sin GDDR6. – hukommelse, der bruger PAM4-signalering til at øge datahastighederne endnu højere end før. Hvor RT.20-serien kort toppet ud på 15.,5 Gbps i 2080 Super og 14 Gbps i de andre rt. – kort kører GDDR6. på 19 Gbps i RT. 3080. Kombineret med 320-bit interface, der giver 760 GBps båndbredde – en 70% forbedring i forhold til RT.2080.
rt.3080 ‘ s memory controller er også blevet forbedret med en ny funktion kaldet EDR: Error Detection and Replay. Når hukommelsen registrerer en mislykket transmission, snarere end at gå ned eller ødelægge data, forsøger den simpelthen igen. Det vil gøre dette, indtil det er vellykket, selvom det stadig er muligt at forårsage et nedbrud med hukommelsesoverclocking., Den interessante bit er, at med EDR kan højere hukommelsesure være opnåelige, men resulterer stadig i lavere ydelse. Det skyldes, at EDR ender med at reducere hukommelsesydelsen, når mislykkede transmissioner forekommer. Vi har mere at sige om dette i overclocking sektionen.,
GeForce RTX 3080 Grundlæggerne Udgave: Design, Køling, Æstetik
Nvidia har radikalt ændret design af dets Grundlæggere Edition kort til RTX 30-serien., Det nye design inkluderer stadig to aksiale ventilatorer, men Nvidia redesignede printet kraftigt og forkortede det, så kortets ‘bagside’ (væk fra videoportene) kun består af en ventilator, varmerør, radiatorfinner og det sædvanlige grafikkort. Nvidia siger, at det nye design leverer betydelige forbedringer i køleeffektiviteten, samtidig med at støjniveauet sænkes. Vi ser frugterne af designet senere.æstetik er meget subjektiv, og vi har hørt masser af mennesker som det nye design, mens andre synes, det ser kedeligt ud., Der er ingen RGB-bling, hvis det er din ting, og den eneste belysning består af en hvid GeForce RTX logo på toppen af kortet med subtile belysning omkring ‘X’ på begge sider af kortet (men kun halvdelen af “X”, som er oplyst på siden med “RTX 3080” – logo).personligt synes jeg, at det nye kort ser godt ud, og det føles meget solidt i hånden. Det handler faktisk om 100g tungere end det tidligere rt.2080-design, og så vidt jeg ved, er det det tyngste single-GPU-kort, Nvidia nogensinde har oprettet., Det er også omkring 2cm længere end den foregående generation kort og bruger den typiske to-slot bredde. (GeForce rt.3090 handler om klar til at få 3080 FE til at se svag ud med sin massive tre-slot køler.)
Nvidia leverede ovenstående billeder af nedrivningen af RT.3080 Founders Edition. Vi er ikke klar til at forsøge demontering af vores kort endnu — og helt ærligt, vi er ude af tid — men vi kan vende tilbage til emnet snart. Vi får at vide at få kortet fra hinanden er lidt vanskeligere denne runde, mest fordi Nvidia har skjult skruerne bag små dæksler.,
hovedkortet ser langt tættere befolket ud end tidligere GPU ‘er, med de 10 GDDR6.hukommelseschips, der omgiver GPU’ en i midten. Du kan også se den vinklede 12-bens strømstik og den funky udseende udskæring i slutningen af printet. Strømforsyning er naturligvis vigtig med en 320.TGP, og du kan se alle de faste elektrolytkondensatorer placeret til venstre og højre for hukommelseschips.,
hukommelse arrangement er også interessant, med fire jetoner på venstre og højre side af GPU ‘ en, op til tre chips over GPU (to monteringspositioner er tom for RTX 3080), og en sidste single chip under GPU. Igen brugte NVIDIA klart en stor indsats for at reducere størrelsen på brættet og andre komponenter for at imødekomme det nye og forbedrede køledesign. Spoiler: det fungerer meget godt.
en interessant ting er, at ‘front’ — ventilatoren (nær videoportene) drejer i den sædvanlige retning-mod uret., ‘Tilbage’ ventilatoren, som typisk vender opad, når du installerer kortet i en AT. – sag, drejer med uret. Hvis man ser på finnerne, betyder det, at rygventilatoren drejer den modsatte retning fra det, vi normalt forventer. Årsagen er, at Nvidia fandt dette arrangement trækker luft gennem radiatoren bedre og genererer mindre støj. Bemærk også, at rygventilatoren er lidt tykkere, og den integrerede ring hjælper med at øge det statiske tryk på begge ventilatorer, mens RPM ‘ erne holdes lave.
Hvis du ikke kan lide udseendet af Founders Edition, kan du være sikker på, at der vil være masser af andre muligheder., Vi har et par tredjeparts rt.3080-kort til test, som alle naturligt inkluderer RGB-belysning. Ingen af tredjepartskortene bruger 12-polet strømstik-heller ikke at det virkelig betyder noget, da den krævede adapter leveres med kortet. Alligevel ser den vertikalt monterede 12-pin port bare lidt mindre robust ud, hvis du tilfældigvis bytter GPU ‘ er regelmæssigt. Jeg planlægger at forlade adapteren permanent tilsluttet og bare tilslutte eller frakoble de normale 8-pin PEG kabler., 12-pin-stikket ser ud til at være bedømt til 25 ‘cykler’, og jeg har allerede brændt gennem halvdelen af dem (ikke at jeg forventer, at det snart vil mislykkes).