Nvidia GeForce RTX 3080 Grunnleggerne Edition Vurdering: Et Stort Generasjonsskifte Hopp i Ytelse | Tom 's Hardware

Nvidia’ s GeForce RTX 3080 Grunnleggerne Edition er her, hevder topplasseringen på våre GPU milepæler hierarki, og rangering som den beste grafikk-kort for tiden er tilgjengelig, forutsatt at du er ute etter ytelse første, med pris og makt blir mindre bekymringer. Etter måneder med venting, vi har endelig uavhengige tester og tester data., Nvidia har kastet ned gapestokk, helt klart utfordrende AMD er Stor Navi å prøve å matche eller slå på hva Ampere arkitektur bringer til bordet.

Vi kommer til å holde ut på en endelige dommen for nå, som vi har andre tredjeparts RTX 3080 kort til å skrive en anmeldelse, som vil starte så snart som i morgen. Det er gode nyheter, så det betyr at kundene vil ikke være begrenset til Nvidia ‘ s Grunnleggere Edition for den første måneden eller så, som om vi var med RTX 20-serien, start., En annen del av gode nyheter er at det er ingen Grunnleggerne Edition ‘skatt’ denne gangen: Den RTX 3080 FE koster $699, direkte fra Nvidia, og det er grunnpris RTX 3080 kort for tiden. Den dårlige nyheten er at vi fullt ut kan forvente tilførsel å være utilstrekkelig for å holde tritt med hva vi forventer å være usedvanlig høy etterspørsel.

The bottom line, hvis du ikke tankene spoilere, er at RTX 3080 FE, er 33% raskere enn RTX 2080 Ti, i gjennomsnitt., Eller, hvis du foretrekker andre punkter av sammenligningen, er det 57% raskere enn RTX 2080 Super, 69% raskere enn RTX 2080 FE — pokker, det er til og med 26% raskere enn Titan RTX!

Men det er en catch: Vi målte alle disse ‘prosent raskere’ resultater på tvers av våre test suite kjører på 4K ultra-innstillinger. Ledelsen smalner hvis du rullegardinmenyen til å 1440p, og synker enda mer på 1080p. Det er fortsatt 42% raskere enn en 2080 FE i 1080p ultra, men dette er veldig mye et kort som er laget for høyere oppløsninger., Også, du kan ha behov for en raskere CPU for å få full 3080 erfaring — sjekk ut vår følgesvenn GeForce RTX 3080 CPU Skalering artikkelen for detaljer.,

6 6 6

68 48 46

8704 3072 2944

272 384 368

68 48 46 Boost Clock (Lag) 1710 1815 1800

19 15.,Start Dato

Nvidia GPU Specifications
Graphics Card	RTX 3080 FE	RTX 2080 Super FE	RTX 2080 FE
Architecture	GA102	TU104	TU104
Process (nm)	Samsung 8N	TSMC 12FFN	TSMC 12FFN
Transistors (Billion)	28.3	13.6	13.6
Die size (mm^2)	628.,4 545 545	GPCs	SMs	FP32 CUDA-Kjerner	ti Kjernene	B Kjerner	VRAM Sp (Gbps)	Sep-20	Jul-19	Sep-18
Start Pris	$699	$699	$799

Møte GA102: Hjertet av Dyret

Vi har en egen artikkel som går dypt inn i Ampere arkitektur som driver GeForce RTX 3080 og andre relaterte Gpu-er., Hvis du vil ha den fulle oversikt over alt som er endret i forhold til Turing arkitektur, anbefaler vi at du starter det. Men her er høydepunktet hjul av de viktigste endringer:

GA102 er den første fra Nvidia GPU for å slippe inn i ett siffer på litografi, ved hjelp av Samsungs 8N prosessen. Den generelle konsensus er at TSMC er N7-noden som er «bedre» sett, men det koster også mer, og er i dag i svært høy etterspørsel — blant annet fra Nvidia ‘ s egen A100. Kan forbrukeren Ampere Gpuer har blitt enda bedre med 7nm? Muligens., Men de har kanskje koste mer, kun vært tilgjengelig i begrensede mengder, eller kanskje de ville ha blitt forsinket et par måneder til. Uansett, GA102 er fortsatt en stor og kraftig chip, og kan skilte med 28.3 milliarder transistorer som er pakket inn i en 628.4 mm square dø. Hvis du lurer på, det er 52% flere transistorer enn TU102 chip brukes i RTX 2080 Ti, men i en 17% mindre område.

Ampere ender opp som en splitt-arkitektur, med GA100 å ta på data center ambisjoner, mens de GA102 og andre forbruker chips har betydelige forskjeller., Den GA100 fokuserer langt mer på FP64 ytelse for vitenskapelig arbeidsmengde, samt dobling ned på dyp læring maskinvare. I mellomtiden, den GA102 faller mest av FP64 funksjonalitet og i stedet har ray tracing maskinvare, pluss noen andre arkitektoniske forbedringer. La oss ta en nærmere titt på Ampere SM funnet i GA102 og GA104.,

Nvidia Gpu-er, som består av flere GPCs (Graphics Processing Klynger), som hver har noen nummer for SMs-meldinger (Streaming Multiprocessors). Nvidia deler hver SM i fire partisjoner som kan operere på separate sett av data. Med Ampere, hver SM partisjon nå har 16 FP32 CUDA-kjerner, 16 FP32/INT CUDA-kjerner, en tredje generasjons Tensoren core, load/store-enheter, og en spesiell funksjon enhet., Hele SM har tilgang til felles L1 cache og minne, og det er et eneste sekund-gen RT kjerne. I sum, som betyr at 64 FP32 kjerner og 64 FP32/INT kjerner, fire Turing-kjerner, og en RT-core. La oss bryte det ned litt mer.

The Turing Gpu-lagt til støtte for samtidig FP32 (32-bit floating point) og INT (32-biters heltall) operasjoner. FP32 har en tendens til å være den viktigste oppgaven for grafikk og spill, men det er fortsatt en anstendig mengde INT operasjoner — for ting som adresse beregninger, tekstur oppslag, og ulike andre typer kode., Med Ampere, INT datapath er oppgradert for å støtte INT eller FP32, men ikke på samme tid.

Hvis du ser på rå spesifikasjoner, Ampere ser ut til å være en langt større hopp i ytelse enn 70% vi målte. 30 TFLOPS! Men det vil vanligvis ikke få noe i nærheten av så høy, fordi den andre datapath er en enten/eller-situasjon: Det kan ikke gjøre begge typer instruksjonene på rørledning i samme syklus. Nvidia sier at rundt 35% av gaming beregningene er INT operasjoner, noe som betyr at du vil ende opp med noe mer som 20 TFLOPS av FP32 og 10 TOPPER av INT på RTX 3080.,

Mens vi er på emnet, la oss også påpeke at en stor del av den økte ytelsen kommer fra økt makt grenser. RTX 2080 var en 225W del (for Grunnleggerne Edition), og RTX 3080 i utgangspunktet legger 100W til det. Det er halvparten igjen mer kraft for 70% mer ytelse. Det er teknisk sett en vinner i samlet effektivitet, men i jakten på ytelse, Nvidia hadde å gå videre til høyre på spenning og frekvens kurve., Nvidia sier RTX 3080 kan levere en 90% forbedring i ytelse per watt hvis du begrense ytelsen til samme nivå på både 2080 og 3080 … men kommer på, som ønsker å begrense ytelsen på den måten? Vel, kanskje bærbare datamaskiner, men la oss ikke gå dit.

En ting som ikke har endret seg mye video-porter. Ok, det er bare delvis sant., Først, det er en enkel HDMI-port, men det er HDMI-2.1 i stedet turings HDMI 2.0 b, men de tre DisplayPort-tilkoblinger forbli 1.4 en. Og sist, men ikke minst, det er ingen VirtualLink port denne runden — tilsynelatende, VirtualLink er død. RIP. De ulike havnene er alle i stand til 8K60 ved hjelp av DSC (Vis Stream Komprimering), et «visuelt lossless» teknikk det er egentlig ikke så veldig visuelt lossless. Men du kan ikke merke til 8K.

Komme tilbake til kjerner, Nvidia ‘ s tredje generasjons tensoren kjerner i GA102 arbeid på 8x4x4 FP16 matriser, så opp til 128 matrise operasjoner per syklus., (Turings tensoren kjerner brukes 4x4x4 matriser, mens GA100 bruker 8x4x8 matriser.) Med FMA (smeltet multiply-add), som er 256 FP operasjoner per syklus, per tensoren kjerne. Multiplisere med 272 sum tensoren kjerner og klokkefrekvens, og som gir deg 119 TFLOPS av FP16 beregne. Imidlertid, Ampere er tensoren kjerner også legge til støtte for finkornet sparsity — i utgangspunktet er det eliminerer å kaste bort tid på å gjøre multiplications ved 0, siden svaret er alltid 0. Sparsity kan gi opp til to ganger FP16 ytelse i programmer som kan bruke det.,

RT kjerner motta lignende ekstrautstyr, med opp til dobbel ray/trekant skjæringspunktet beregninger per klokke. I RT-kjerner også støtte en gang variabel, noe som er nyttig for beregning av ting som motion blur. Alle fortalt, Nvidia sier 3080 nye RT-kjerner er 1,7 ganger raskere enn RTX 2080-tallet, og de kan være opp til fem ganger så høy for motion blur.

Det er nok av andre endringer. L1 cache/delt minne kapasitet og båndbredde har blitt økt for å bedre mate kjerner (8704KB vs. 4416KB), og L2-hurtigbuffer er også 25% større enn før (5120KB vs., 4096KB). L1-cache kan også være konfigurert som varierende mengder L1 versus delt minne, avhengig av behovene til programmet. Registrer fil-størrelse er også nesten 50% større (17408KB vs. 11776KB) med RTX 3080. GA102 kan også gjøre samtidige RT + grafikk + DLSS (tidligere, ved hjelp av RT-kjerner ville stoppe CUDA-kjerner).

til Slutt, raster operatører (ROPS) har blitt flyttet ut av minnet kontrollere og i GPCs. Hver GPC har to ROP partisjoner av åtte ROP enheter hver., Dette gir mer fleksibilitet i ytelse, så der GA102 har opp til 112 ROPS sum RTX 3080 deaktiverer to minne kontrollere, men bare én GPC og ender opp med 96 ROPS. Dette er mer kritisk for RTX 3070 / GA104, men som fortsatt har 96 ROPS selv om det bare har åtte minne kontrollere. Hver GPC inneholder også seks TPCs (Tekstur Behandling Klynger) med åtte TMUs (Texture Mapping-Enheter) og en polymorph motoren, selv om Nvidia bare gjør 34 TPCs for 3080.,

Med kjernen forbedringer ut av veien, la oss også raskt diskutere minne delsystem. GA102 støtter opp til tolv 32-bit minne-tv, hvorav ti er aktivert på RTX 3080. Nvidia slått seg sammen med Micron til å bruke sin GDDR6X minne, som bruker PAM4 signalering for å øke data priser enda høyere enn før. Der RTX 20-serien kort toppet ut på 15.,5 Gbps i 2080 Super og 14 Gbps i andre RTX kort, GDDR6X går ved 19 Gbps i RTX 3080. Kombinert med 320-bit grensesnitt, som gir 760 GBps båndbredde – 70% forbedring over RTX 2080.

RTX 3080 minne kontrolleren har også blitt forbedret med en ny funksjon kalt EDR: feilregistrering og Replay. Når minnet oppdager en mislykket overføring, snarere enn å krasje eller ødelegge data, er det bare prøver igjen. Det vil gjøre dette til den er vellykket, men det er fortsatt mulig å føre en kollisjon med minne overklokking., Det interessante biten er at med EDR, høyere minne klokker kan være oppnåelig, men likevel resultere i lavere ytelse. Det er fordi EDR ender opp med å redusere minne ytelse når mislykkede overføringer oppstå. Vi skal ha mer å si på dette i overklokking delen.,

GeForce RTX 3080 Grunnleggerne Utgave: Design, Kjøling, Estetikk

Nvidia har radikalt endret utformingen av Grunnleggerne Edition kort for RTX 30-serien., Den nye designen er fortsatt inneholder to aksial vifter, men Nvidia tungt redesignet PCB og forkortet det slik at «tilbake» av kortet (bort fra video-porter) består av bare en fan, heatpipes, radiator finnene, og den vanlige grafikk-kort likkledet. Nvidia sier nytt design leverer betydelige forbedringer i kjøleeffekt, mens på samme tid å senke støynivået. Vi får se fruktene av design senere.

Estetikk er svært subjektive, og vi har hørt mange mennesker liker den nye designen, mens andre synes det ser kjedelig., Det er ingen RGB-bling hvis det er din greie, og den eneste belysningen består av en hvit GeForce RTX-logoen på toppen av kortet med subtile lys rundt ‘X’ på begge sider av kortet (men bare halvparten av en ‘X’ er tent på siden med «RTX 3080» – logoen).

Personlig, jeg tror det nye kortet ser ganske fint, og det føles svært solid i hånden. Det er faktisk om 100g tyngre enn den forrige RTX 2080 design, og så langt som jeg er klar, det er den tyngste enkelt-GPU-kort Nvidia noen gang har laget., Det er også ca 2 cm lenger enn den forrige generasjonen kort og bruker typisk to-sporet bredde. (GeForce RTX 3090 er omtrent klar til å gjøre den 3080 FE ser ynkelig, skjønt, med sine massive tre-sporet kjøligere.)

Nvidia gitt ovenfor bilder av teardown av RTX 3080 Grunnleggerne Edition. Vi er ikke klar for å forsøke demontering av våre kort ennå — og ærlig talt, vi er ute av tid — men vi kan gå tilbake til emnet snart. Vi er blitt fortalt at å få kortet bortsett er litt komplisert i denne runden, for det meste fordi Nvidia har skjult skruene bak små dekker.,

Den viktigste styret ser langt tettere befolket enn tidligere Gpu-er, med 10 GDDR6X minnebrikker rundt GPU i sentrum. Du kan også se den vinklede 12-pin strømkontakt og funky-se utsnitt på slutten av PCB. Makt levering er selvsagt viktig med en bruk formatene 320 bredde TGP, og du kan se alle den faste elektrolytiske kondensatorer plassert til venstre og høyre på minnebrikker.,

minne arrangement er også interessant, med fire brikker på venstre og høyre sider av GPU, opp til tre sjetonger over GPU (to festeposisjoner er tomme for RTX 3080), og en siste single chip under GPU. Igjen, Nvidia klart brukt mye innsats for å redusere størrelsen på styret og andre komponenter for å imøtekomme nye og bedre kjøling design. Spoiler: Det fungerer veldig bra.

En interessant ting er at ‘foran’ vifte (i nærheten av video-porter) spins i den vanlige retning — mot klokken., Den «tilbake» – fan, som vil vanligvis ansiktet oppover når du installerer kortet i et ATX-saken, roterer med klokken. Hvis du ser på finnene, som betyr tilbake fan spinner i motsatt retning fra hva vi normalt forventer. Årsaken er at Nvidia funnet denne ordningen trekker luft gjennom radiatoren bedre og genererer mindre støy. Merk også at back-fan er litt tykkere, og den integrerte ring bidrar til å øke statiske trykket på både fans mens du holder lave Turtall.

Hvis du ikke liker utseendet av Grunnleggerne Edition, trygg vil det være nok av andre alternativer., Vi har noen tredjepart RTX 3080 kort i for testing, alle som selvsagt inkluderer RGB-belysning. Ingen av tredjepart kort bruke 12-pin strømkontakt, heller ikke at det som virkelig teller, siden den nødvendige adapteren som følger med kortet. Likevel, som vertikalt montert 12-pinners port ser bare litt mindre robust hvis du skje for å bytte Gpuer på en jevnlig basis. Jeg har tenkt til å forlate adapter koblet og bare koble til eller koble fra den normale 8-pin PLUGG kabler., 12-pinners kontakt ser ut til å bli vurdert for 25 ‘sykluser,» og jeg har allerede brent gjennom halvparten av disse (ikke at jeg forventer at det å mislykkes som helst snart).

Møte GA102: Hjertet av Dyret

GeForce RTX 3080 Grunnleggerne Utgave: Design, Kjøling, Estetikk

Legg igjen en kommentar Avbryt svar