Nvidia GeForce RTX 3080 Fondatori Edizione è qui, sostenendo il primo posto sul nostro benchmark GPU gerarchia, e si classifica come la migliore scheda grafica attualmente disponibili — se ci si trova dopo le prestazioni, con il prezzo e la potenza meno preoccupazioni. Dopo mesi di attesa, abbiamo finalmente benchmark e dati di test indipendenti., Nvidia ha lanciato il guanto di sfida, sfidando chiaramente Big Navi di AMD per cercare di abbinare o battere ciò che l’architettura Ampere porta in tavola.
Stiamo andando a tenere a bada su un verdetto finale per ora, come abbiamo altre carte RTX 3080 di terze parti per la revisione, che inizierà non appena domani. Questa è una buona notizia, in quanto significa che i clienti non saranno limitati alla Nvidia Founders Edition per il primo mese o giù di lì come eravamo con il lancio della serie RTX 20., Un’altra buona notizia è che questa volta non ci sono Founders Edition ‘tax’: RTX 3080 FE costa $699, direttamente da Nvidia, e questo è il prezzo base delle schede RTX 3080 per il momento. La cattiva notizia è che ci aspettiamo che l’offerta sia insufficiente per tenere il passo con quella che ci aspettiamo essere una domanda eccezionalmente elevata.
La linea di fondo, se non ti dispiace spoiler, è che l’RTX 3080 FE è 33% più veloce rispetto al RTX 2080 Ti, in media., Oppure, se preferisci altri punti di confronto, è il 57% più veloce dell’RTX 2080 Super, il 69% più veloce dell’RTX 2080 FE — diamine, è anche il 26% più veloce del Titan RTX!
Ma c’è un problema: abbiamo misurato tutti quei risultati “percentuali più veloci” nella nostra suite di test in esecuzione con le impostazioni 4K ultra. Il piombo si restringe se si scende a 1440p, e diminuisce ancora di più a 1080p. È ancora 42% più veloce di un 2080 FE a 1080p ultra, ma questa è molto una carta fatta per risoluzioni più elevate., Inoltre, potrebbe essere necessario una CPU più veloce per ottenere l’esperienza completa 3080-controlla il nostro compagno GeForce RTX 3080 Scaling articolo CPU per tutti i dettagli.,
Graphics Card | RTX 3080 FE | RTX 2080 Super FE | RTX 2080 FE | |||||||
---|---|---|---|---|---|---|---|---|---|---|
Architecture | GA102 | TU104 | TU104 | |||||||
Process (nm) | Samsung 8N | TSMC 12FFN | TSMC 12FFN | |||||||
Transistors (Billion) | 28.3 | 13.6 | 13.6 | |||||||
Die size (mm^2) | 628.,4 GPCs |
SMs |
FP32 CUDA Core |
dieci il Core |
B Core |
VRAM Sp (Gbps) |
Set-20 |
Lug-19 |
Set-18 |
|
Prezzo di Lancio | $699 | $699 | $799 |
Soddisfare GA102: Il Cuore della Bestia
Abbiamo un articolo separato di andare in profondità in Ampere architettura che alimenta la GeForce RTX 3080 e altre Gpu., Se vuoi il riepilogo completo di tutto ciò che è cambiato rispetto all’architettura di Turing, ti consigliamo di iniziare da lì. Ma ecco il momento clou dei cambiamenti più importanti:
La GA102 è la prima GPU di Nvidia a cadere nelle singole cifre sulla litografia, utilizzando il processo 8N di Samsung. Il consenso generale è che il nodo N7 di TSMC è “migliore” nel complesso, ma costa anche di più ed è attualmente molto richiesto, incluso l’A100 di Nvidia. Le GPU consumer Ampere potrebbero essere state ancora migliori con 7nm? Forse., Ma avrebbero potuto costare di più, erano disponibili solo in quantità limitate, o forse sarebbero stati ritardati di qualche altro mese. Indipendentemente da ciò, GA102 è ancora un chip grande e potente, che vanta 28,3 miliardi di transistor racchiusi in un dado quadrato da 628,4 mm. Se ti stai chiedendo, questo è il 52% in più di transistor rispetto al chip TU102 utilizzato in RTX 2080 Ti, ma in un’area più piccola del 17%.
Ampere finisce come un’architettura divisa, con il GA100 che assume ambizioni di data center mentre il GA102 e altri chip consumer hanno differenze significative., Il GA100 si concentra molto di più sulle prestazioni FP64 per i carichi di lavoro scientifici, così come il raddoppio su hardware di apprendimento profondo. Nel frattempo, GA102 elimina la maggior parte delle funzionalità FP64 e include invece l’hardware ray tracing, oltre ad alcuni altri miglioramenti architettonici. Diamo uno sguardo più da vicino l’Ampere SM trovato nel GA102 e GA104.,
Gpu Nvidia sono costituite da diverse GPCs (Graphics Processing Cluster), ognuno dei quali ha un certo numero di SMs (in Streaming Multiprocessors). Nvidia divide ogni SM in quattro partizioni che possono operare su set di dati separati. Con Ampere, ogni partizione SM ha ora 16 core CUDA FP32, 16 core CUDA FP32 / INT, un core Tensore di terza generazione, unità di carico/archiviazione e un’unità funzione speciale., L’intero SM ha accesso alla cache L1 condivisa e alla memoria, e c’è un singolo core RT di seconda generazione. In totale, ciò significa 64 core FP32 e 64 core FP32/INT, quattro core Turing e un core RT. Diciamo che giù un po ‘ di più.
Le GPU di Turing hanno aggiunto il supporto per le operazioni simultanee FP32 (32-bit floating point) e INT (32-bit integer). FP32 tende ad essere il carico di lavoro più importante per la grafica e i giochi, ma c’è ancora una discreta quantità di operazioni INT — per cose come i calcoli degli indirizzi, le ricerche di texture e vari altri tipi di codice., Con Ampere, il datapath INT viene aggiornato per supportare INT o FP32, ma non allo stesso tempo.
Se si guardano le specifiche grezze, Ampere sembra essere un salto molto più grande in termini di prestazioni rispetto al 70% che abbiamo misurato. 30 TFLOPS! Ma generalmente non si avvicina a quel livello perché il secondo datapath è una situazione o/o: non può eseguire entrambi i tipi di istruzioni sulla pipeline nello stesso ciclo. Nvidia dice che circa il 35% dei calcoli di gioco sono operazioni INT, il che significa che finirai con qualcosa di più simile a 20 TFLOPS di FP32 e 10 TOP di INT su RTX 3080.,
Mentre siamo sull’argomento, facciamo anche notare che una grande parte dell’aumento delle prestazioni deriva da un aumento dei limiti di potenza. RTX 2080 era una parte da 225W (per la Founders Edition), e RTX 3080 aggiunge fondamentalmente 100W a questo. Questa è la metà di nuovo più potenza per il 70% in più di prestazioni. Tecnicamente è una vittoria in termini di efficienza complessiva, ma nel perseguimento delle prestazioni, Nvidia ha dovuto spostarsi ulteriormente a destra sulla curva di tensione e frequenza., Nvidia afferma che RTX 3080 può offrire un miglioramento del 90% delle prestazioni per watt se si limitano le prestazioni allo stesso livello sia su 2080 che su 3080 … ma dai, chi vuole limitare le prestazioni in questo modo? Beh, forse i portatili, ma non andiamo lì.
Una cosa che non è cambiato è l’porte video. Ok, e ‘ solo parzialmente vero., Innanzitutto, c’è una singola porta HDMI, ma è HDMI 2.1 invece di HDMI 2.0 b di Turing, ma le tre connessioni DisplayPort rimangono 1.4 a. E ultimo ma non meno importante, non c’è nessuna porta VirtualLink questo round — apparentemente, VirtualLink è morto. RIP. Le varie porte sono tutte in grado di 8K60 utilizzando DSC (Display Stream Compression), una tecnica “visivamente lossless” che in realtà non è davvero visivamente lossless. Ma potresti non notare a 8K.
Tornando ai core, i core tensoriali di terza generazione di Nvidia in GA102 funzionano su matrici 8x4x4 FP16, quindi fino a 128 operazioni di matrice per ciclo., (I tensor core di Turing utilizzavano matrici 4x4x4, mentre il GA100 utilizza matrici 8x4x8.) Con FMA (fuso multiply-add), sono 256 operazioni FP per ciclo, per nucleo del tensore. Moltiplica per i 272 tensori totali e la velocità di clock, e questo ti dà 119 TFLOPS di calcolo FP16. Tuttavia, i tensor core di Ampere aggiungono anche il supporto per la sparsità a grana fine-in pratica, elimina le perdite di tempo facendo moltiplicazioni per 0, poiché la risposta è sempre 0. Sparsity può fornire fino al doppio delle prestazioni FP16 nelle applicazioni che possono utilizzarlo.,
I core RT ricevono miglioramenti simili, con fino a raddoppiare i calcoli di intersezione ray / triangolo per clock. I core RT supportano anche una variabile temporale, che è utile per calcolare cose come motion blur. Tutto sommato, Nvidia afferma che i nuovi core RT del 3080 sono 1,7 volte più veloci degli RTX 2080 e possono essere fino a cinque volte più veloci per motion blur.
Ci sono anche molte altre modifiche. La cache L1 / capacità di memoria condivisa e la larghezza di banda è stata aumentata per alimentare meglio i core (8704KB vs. 4416KB), e la cache L2 è anche il 25% più grande di prima (5120KB vs., 4096 KB). La cache L1 può anche essere configurata come quantità variabili di L1 rispetto alla memoria condivisa, a seconda delle esigenze dell’applicazione. La dimensione del file di registro è anche quasi il 50% più grande (17408KB contro 11776KB) con RTX 3080. GA102 può anche eseguire RT + graphics + DLSS simultanei (in precedenza, l’utilizzo dei core RT fermava i core CUDA).
Infine, gli operatori raster (ROP) sono stati spostati dai controller di memoria e nei GPC. Ogni GPC ha due partizioni ROP di otto unità ROP ciascuna., Ciò fornisce una maggiore flessibilità nelle prestazioni, quindi dove GA102 ha fino a 112 ROP totali, RTX 3080 disabilita due controller di memoria ma solo un GPC e finisce con 96 ROP. Questo è più critico per RTX 3070 / GA104, tuttavia, che ha ancora 96 ROP anche se ha solo otto controller di memoria. Ogni GPC include anche sei TPC (cluster di elaborazione texture) con otto TMU (unità di mappatura texture) e un motore polymorph, sebbene Nvidia abiliti solo 34 TPC per il 3080.,
Con il core miglioramenti fuori del modo, diamo anche rapidamente discutere il sottosistema di memoria. GA102 supporta fino a dodici canali di memoria a 32 bit, di cui dieci sono abilitati su RTX 3080. Nvidia ha collaborato con Micron per utilizzare la sua memoria GDDR6X, che utilizza la segnalazione PAM4 per aumentare le velocità di trasmissione dati ancora più elevate di prima. Dove le carte RTX 20-series superato fuori a 15.,5 Gbps nel 2080 Super e 14 Gbps nelle altre schede RTX, GDDR6X funziona a 19 Gbps nell’RTX 3080. Combinato con l’interfaccia a 320 bit, che produce 760 Gbps di larghezza di banda – un miglioramento del 70% rispetto RTX 2080.
Anche il controller di memoria di RTX 3080 è stato migliorato, con una nuova funzionalità chiamata EDR: Error Detection and Replay. Quando la memoria rileva una trasmissione non riuscita, piuttosto che schiantarsi o corrompere i dati, semplicemente ci riprova. Lo farà fino a quando non avrà successo, anche se è ancora possibile causare un arresto anomalo con l’overclocking della memoria., Il bit interessante è che con EDR, gli orologi di memoria più alti potrebbero essere realizzabili, ma si traducono comunque in prestazioni inferiori. Questo perché l’EDR finisce per ridurre le prestazioni della memoria quando si verificano trasmissioni non riuscite. Avremo più da dire su questo nella sezione overclocking.,
GeForce RTX 3080 Fondatori Edizione: Progettazione, di Raffreddamento, di Estetica
Nvidia ha radicalmente modificato il design dei suoi Fondatori Edizione carte per il RTX 30-serie., Il nuovo design include ancora due ventilatori assiali, ma Nvidia ha ridisegnato pesantemente il PCB e lo ha accorciato in modo che il “retro” della scheda (lontano dalle porte video) sia costituito da una ventola, heatpipes, alette del radiatore e il solito schermo della scheda grafica. Nvidia afferma che il nuovo design offre sostanziali miglioramenti nell’efficienza di raffreddamento, riducendo allo stesso tempo i livelli di rumore. Vedremo i frutti del design più tardi.
L’estetica è altamente soggettiva e abbiamo sentito molte persone come il nuovo design, mentre altri pensano che sembri noioso., Non c’è bling RGB se è la tua passione, e l’unica illuminazione consiste in un logo GeForce RTX bianco sulla parte superiore della scheda con una sottile illuminazione attorno alla “X” su entrambi i lati della scheda (ma solo metà della ” X “è illuminata sul lato con il logo “RTX 3080”).
Personalmente, penso che la nuova carta sia abbastanza bella, e si sente molto solida nella mano. In realtà è circa 100g più pesante del precedente design RTX 2080 e, per quanto ne so, è la scheda single-GPU più pesante che Nvidia abbia mai creato., È anche circa 2 cm più lungo delle schede di generazione precedente e utilizza la tipica larghezza a due slot. (La GeForce RTX 3090 è pronta a rendere il 3080 FE un aspetto gracile, però, con il suo enorme dispositivo di raffreddamento a tre slot.)
Nvidia ha fornito le immagini sopra del teardown della RTX 3080 Founders Edition. Non siamo ancora pronti a tentare lo smontaggio della nostra carta — e francamente, siamo fuori tempo — ma potremmo tornare presto sull’argomento. Ci è stato detto che separare la carta è un po ‘ più complicato in questo round, soprattutto perché Nvidia ha nascosto le viti dietro piccole coperture.,
La scheda principale sembra molto più densamente popolata rispetto alle GPU precedenti, con i 10 chip di memoria GDDR6X che circondano la GPU al centro. È anche possibile vedere il connettore di alimentazione a 12 pin angolato e il ritaglio dall’aspetto funky alla fine del PCB. L’erogazione di potenza è ovviamente importante con un TGP da 320W, e puoi vedere tutti i condensatori elettrolitici solidi posizionati a sinistra ea destra dei chip di memoria.,
Anche la disposizione della memoria è interessante, con quattro chip sui lati sinistro e destro della GPU, fino a tre chip sopra la GPU (due posizioni di montaggio sono vuote per l’RTX 3080) e un singolo chip finale sotto la GPU. Ancora una volta, Nvidia ha chiaramente speso un grande sforzo per ridurre le dimensioni della scheda e di altri componenti per adattarsi al nuovo e migliorato design di raffreddamento. Spoiler: Funziona molto bene.
Una cosa interessante è che la ventola ‘anteriore’ (vicino alle porte video) gira nella solita direzione — in senso antiorario., La ventola ‘indietro’, che in genere rivolto verso l’alto quando si installa la scheda in un caso ATX, gira in senso orario. Se guardi le pinne, significa che la ventola posteriore gira nella direzione opposta a quella che normalmente ci aspettiamo. Il motivo è che Nvidia ha trovato questa disposizione tira aria attraverso il radiatore meglio e genera meno rumore. Si noti inoltre che la ventola posteriore è leggermente più spessa e l’anello integrato aiuta ad aumentare la pressione statica su entrambe le ventole mantenendo bassi gli RPM.
Se non ti piace l’aspetto della Founders Edition, ti assicuro che ci saranno molte altre opzioni., Abbiamo alcune schede RTX 3080 di terze parti per i test, che includono naturalmente l’illuminazione RGB. Nessuna delle schede di terze parti utilizza il connettore di alimentazione a 12 pin, non che sia davvero importante, dal momento che l’adattatore richiesto viene fornito con la scheda. Tuttavia, quella porta a 12 pin montata verticalmente sembra un po ‘ meno robusta se ti capita di scambiare GPU su base regolare. Ho intenzione di lasciare l’adattatore collegato in modo permanente e basta collegare o scollegare i normali cavi PEG a 8 pin., Il connettore a 12 pin sembra essere valutato per 25 ‘cicli’, e ho già bruciato la metà di quelli(non che mi aspetto che fallisca presto).