Nvidia GeForce RTX 3080 Fondatorii Edition este aici, susținând că la fața locului de top pe GPU criterii ierarhizare și clasare cât mai bună grafică de carte disponibile în prezent — cu condiția că sunteți după performanță în primul rând, cu preț și de putere fiind mai mică preocupări. După luni de așteptare, avem în sfârșit repere independente și date de testare., Nvidia a aruncat mănușa, provocând în mod clar marele Navi al AMD pentru a încerca să se potrivească sau să bată ceea ce arhitectura Ampere aduce la masă.
vom amâna un verdict final pentru moment, deoarece avem alte carduri RTX 3080 terțe de revizuit, care vor începe imediat ce mâine. Aceasta este o veste bună, deoarece înseamnă că clienții nu se vor limita la Nvidia Founders Edition pentru prima lună sau așa cum am fost cu lansarea seriei RTX 20., O altă veste bună este că de data aceasta nu există o „taxă” a Founders Edition: RTX 3080 Fe costă $699, direct de la Nvidia, și acesta este prețul de bază al cardurilor RTX 3080 pentru moment. Vestea proastă este că ne așteptăm pe deplin ca oferta să fie insuficientă pentru a ține pasul cu ceea ce ne așteptăm să fie o cerere excepțional de mare.linia de jos, dacă nu vă deranjează spoilerele, este că RTX 3080 FE este cu 33% mai rapid decât RTX 2080 Ti, în medie., Sau, dacă preferați alte puncte de comparație, este cu 57% mai rapid decât RTX 2080 Super, cu 69% mai rapid decât RTX 2080 FE — heck, este chiar cu 26% mai rapid decât Titan RTX!
dar există o captură: am măsurat toate rezultatele „procente mai rapide” din suita noastră de teste care rulează la setările 4K ultra. Avantajul se îngustează dacă coborâți la 1440p și scade și mai mult la 1080p. este încă cu 42% mai rapid decât un 2080 FE la 1080p ultra, dar acesta este foarte mult un card făcut pentru rezoluții mai mari., De asemenea, este posibil să aveți nevoie de un procesor mai rapid pentru a obține experiența completă 3080 — consultați articolul nostru de scalare a procesorului GeForce RTX 3080 pentru detalii complete.,
Graphics Card | RTX 3080 FE | RTX 2080 Super FE | RTX 2080 FE | |||||||
---|---|---|---|---|---|---|---|---|---|---|
Architecture | GA102 | TU104 | TU104 | |||||||
Process (nm) | Samsung 8N | TSMC 12FFN | TSMC 12FFN | |||||||
Transistors (Billion) | 28.3 | 13.6 | 13.6 | |||||||
Die size (mm^2) | 628.,4 Țigări |
SMs |
FP32 Nuclee CUDA |
zece Nuclee |
B Nuclee |
VRAM Sp (Gbps) |
Sep-20 |
Jul-19 |
Sep-18 |
|
Preț de Lansare | $699 | $699 | $799 |
Cunosc GA102: Inima de Fiara
Avem un articol separat merge adânc în Amperi arhitectura că puterile GeForce RTX 3080 și alte legate de Gpu-uri., Dacă doriți o trecere în revistă completă a tot ceea ce sa schimbat în comparație cu arhitectura Turing, vă recomandăm să începeți acolo. GA102 este primul GPU de la Nvidia care a căzut în cifrele unice pe litografie, folosind procesul 8n al Samsung. Consensul general este că nodul N7 al TSMC este „mai bun” în general, dar costă și mai mult și este în prezent în cerere foarte mare — inclusiv de la propriul A100 al Nvidia. Ar putea GPU-urile amperi de consum să fie și mai bune cu 7nm? Poate., Dar ar fi putut costa mai mult, au fost disponibile doar în cantități limitate sau poate ar fi fost amânate încă câteva luni. Indiferent, GA102 este încă o mare și puternic cip, oferind 28,3 miliarde de tranzistori ambalate într-o 628.4 mm pătrat muri. Dacă vă întrebați, este cu 52% mai mulți tranzistori decât cipul TU102 utilizat în RTX 2080 Ti, dar într-o zonă cu 17% mai mică.
Ampere se termină ca o fracțiune de arhitectura, cu GA100 lua pe centru de date ambiții în timp ce GA102 și alte chips-uri de consum au diferențe semnificative., GA100 se concentrează mult mai mult pe performanța FP64 pentru fluxurile de lucru științifice, precum și pe dublarea hardware-ului deep learning. Între timp, GA102 picături de cele mai multe FP64 funcționalitate și, în loc să include ray tracing hardware, plus alte îmbunătățiri arhitecturale. Să aruncăm o privire mai atentă la Ampere SM găsit în GA102 și GA104.,
Gpu Nvidia consta din mai multe Țigări de Procesare Grafică (Clustere), fiecare dintre care are un număr de SMs-uri (de Streaming Multiprocessors). Nvidia împarte fiecare SM în patru partiții care pot funcționa pe seturi separate de date. Cu Ampere, fiecare partiție SM are acum 16 nuclee CUDA FP32, 16 nuclee CUDA FP32 / INT, un nucleu Tensor de a treia generație, unități de încărcare/stocare și o unitate de funcții speciale., Întregul SM are acces la cache-ul L1 partajat și memorie, și există un singur nucleu RT al doilea gen. În total, aceasta înseamnă 64 de nuclee FP32 și 64 de nuclee FP32/INT, patru nuclee Turing și un nucleu RT. Hai să mai discutăm puțin.GPU-urile Turing au adăugat suport pentru operațiile simultane FP32 (virgulă mobilă pe 32 de biți) și int (număr întreg pe 32 de biți). FP32 tinde să fie cel mai important volum de muncă pentru grafica si jocuri, dar există încă o sumă decentă de INT operațiuni — pentru lucruri cum ar fi adresa de calcule, textura căutări, și diverse alte tipuri de cod., Cu Ampere, INT datapath este actualizat pentru a sprijini INT sau FP32, dar nu în același timp.
Dacă te uiți la specificațiile brute, Ampere pare să fie un salt mult mai mare în performanță decât 70% am măsurat. 30 TFLOPS! Dar, în general, nu se va apropia de atât de mare, deoarece a doua cale de date este o situație fie/fie: nu poate face ambele tipuri de instrucțiuni pe conductă în același ciclu. Nvidia spune că aproximativ 35% din calculele jocurilor sunt operațiuni INT, ceea ce înseamnă că veți ajunge la ceva mai mult ca 20 TFLOPS de FP32 și 10 topuri de INT pe RTX 3080.,
în timp ce suntem pe această temă, să subliniem, de asemenea, că o mare parte din performanța crescută provine din limitele de putere crescute. RTX 2080 a fost o parte 225W (pentru ediția Fondatorilor), iar RTX 3080 adaugă practic 100W la asta. Aceasta este din nou jumătate mai multă putere pentru o performanță cu 70% mai mare. Este din punct de vedere tehnic o victorie în eficiența generală, dar în urmărirea performanței, Nvidia a trebuit să se deplaseze mai departe spre dreapta pe curba de tensiune și frecvență., Nvidia spune RTX 3080 poate oferi o îmbunătățire de 90% a performanței pe watt dacă limitați performanța la același nivel atât pe 2080, cât și pe 3080 … dar haideți, cine vrea să limiteze performanța în acest fel? Ei bine, poate laptopuri, dar să nu mergem acolo.
Un lucru care nu s-a schimbat mult este porturi video. Bine, asta e doar parțial adevărat., În primul rând, există un singur port HDMI, dar e HDMI 2.1 in loc de a lui Turing HDMI 2.0 b, dar cele trei conexiuni DisplayPort rămâne 1.4 a. Și ultimul, dar nu cel mai puțin, nu e nici VirtualLink port această rundă — aparent, VirtualLink este mort. RIP. Diferitele porturi sunt capabile de 8K60 folosind DSC (Display Stream Compression), o tehnică” fără pierderi vizuale”, care nu este de fapt fără pierderi vizuale. Dar s-ar putea să nu observați la 8K.
Obtinerea înapoi la nuclee, Nvidia-al treilea gen tensor nuclee în GA102 munca pe 8x4x4 FP16 matrici, deci până la 128 de operațiunile de matrice pe ciclu., (Miezurile tensor Turing au folosit matrice 4x4x4, în timp ce GA100 folosește matrice 8x4x8.) Cu FMA (fused multiply-add), adică 256 operații FP pe ciclu, pe miez tensor. Înmulțiți cu cele 272 de nuclee de tensor total și viteza ceasului, ceea ce vă oferă 119 TFLOPS de calcul FP16. Cu toate acestea, miezurile Tensor Ampere adaugă, de asemenea, suport pentru sparsity cu granulație fină-practic, elimină pierderea timpului făcând multiplicări cu 0, deoarece răspunsul este întotdeauna 0. Sparsity poate oferi până la de două ori performanța FP16 în aplicațiile care îl pot utiliza.,
nucleele RT primesc îmbunătățiri similare, cu până la dublul calculelor de intersecție a razei/triunghiului pe ceas. Nucleele RT acceptă, de asemenea, o variabilă de timp, care este utilă pentru calcularea unor lucruri precum motion blur. Cu toate acestea, Nvidia spune că noile nuclee RT ale lui 3080 sunt de 1.7 ori mai rapide decât RTX 2080 și pot fi de până la cinci ori mai rapide pentru motion blur.
există o mulțime de alte modificări, de asemenea. L1 cache/memorie partajată capacitatea și lățimea de bandă a crescut de mai bine hrana nuclee (8704KB vs 4416KB), iar L2 cache-ul este, de asemenea, cu 25% mai mare decât înainte (5120KB vs, 4096 KB). Cache-ul L1 poate fi, de asemenea, configurat ca cantități diferite de L1 vs.memorie partajată, în funcție de nevoile aplicației. Dimensiunea fișierului de înregistrare este, de asemenea, cu aproape 50% mai mare (17408kb față de 11776kb) cu RTX 3080. GA102 poate face, de asemenea, concurente RT + graphics + DLSS (anterior, folosind nucleele RT ar opri nucleele CUDA).
în cele din urmă, operatorii raster (ROPS) au fost mutați din controlerele de memorie și în GPC-uri. Fiecare GPC are două partiții por de câte opt unități POR fiecare., Acest lucru oferă mai multă flexibilitate în performanță, astfel încât în cazul în care GA102 are până la 112 Rops total, RTX 3080 dezactivează două controlere de memorie, dar numai un GPC și se termină cu 96 ROPS. Acest lucru este mai critic pentru RTX 3070 / GA104, care are încă 96 ROP, chiar dacă are doar opt controlere de memorie. Fiecare GPC include, de asemenea, șase TPCs (Textura de Prelucrare Clustere) cu opt TMUs (Texture Mapping Units) și un polimorf motor, desi Nvidia numai vă permite 34 TPCs pentru 3080.,
Cu core accesorii din drum, să, de asemenea, rapid a discuta despre subsistemului de memorie. GA102 acceptă până la douăsprezece canale de memorie pe 32 de biți, dintre care zece sunt activate pe RTX 3080. Nvidia a făcut echipă cu Micron pentru a-și folosi memoria GDDR6X, care folosește semnalizarea PAM4 pentru a crește ratele de date chiar mai mari decât înainte. În cazul în care cardurile RTX 20-series depasit la 15.,5 Gbps în 2080 Super și 14 Gbps în celelalte carduri RTX, GDDR6X rulează la 19 Gbps în RTX 3080. În combinație cu interfața pe 320 de biți, aceasta oferă o lățime de bandă de 760 GBps – o îmbunătățire de 70% față de RTX 2080.controlerul de memorie RTX 3080 a fost, de asemenea, îmbunătățit, cu o nouă caracteristică numită EDR: detectarea erorilor și reluarea. Atunci când memoria detectează o transmisie eșuată, mai degrabă decât crashing sau coruperea datelor, pur și simplu încearcă din nou. Va face acest lucru până când va avea succes, deși este încă posibil să provocați un accident cu overclockarea memoriei., Interesant este faptul că, cu EDR, Ceasuri de memorie mai mari ar putea fi realizabile, dar totuși duce la performanțe mai mici. Acest lucru se datorează faptului că EDR sfârșește prin reducerea performanței memoriei atunci când apar transmisii eșuate. Vom avea mai multe de spus despre acest lucru în secțiunea de overclocking.,
GeForce RTX 3080 Fondatorii Ediție: Design, Răcire, Estetica
Nvidia s-a schimbat radical design-ul de Fondatorii săi Ediție carduri pentru RTX 30-serie., Noul design include încă două ventilatoare axiale, dar Nvidia puternic reproiectat PCB și scurtat, astfel încât „înapoi” de pe card (departe de porturi video) constă dintr-un ventilator, heatpipes, aripioarele radiatorului, și de obicei placa grafica giulgiu. Nvidia spune că noul design oferă îmbunătățiri substanțiale în eficiența răcirii, reducând în același timp nivelurile de zgomot. Vom vedea fructele designului mai târziu.
estetica este extrem de subiectivă și am auzit o mulțime de oameni ca noul design, în timp ce alții cred că pare plictisitor., Nu există RGB bling dacă asta e treaba ta, iar singura iluminare constă dintr-un logo alb GeForce RTX în partea de sus a cardului, cu iluminare subtilă în jurul „X” de pe ambele părți ale cardului (dar numai jumătate din ” X „este aprins pe partea laterală cu sigla „RTX 3080”).personal ,cred că noua carte arată destul de frumos și se simte foarte solidă în mână. De fapt, este vorba despre 100g mai greu decât designul RTX 2080 anterior și, din câte știu, este cea mai grea placă single-GPU pe care Nvidia a creat-o vreodată., De asemenea, este cu aproximativ 2 cm mai lung decât cardurile de generație anterioară și utilizează lățimea tipică cu două sloturi. (GeForce RTX 3090 este gata să facă ca 3080 FE să pară subțire, cu răcitorul său masiv cu trei sloturi.)
Nvidia a furnizat imaginile de mai sus ale ediției RTX 3080 Founders Edition. Încă nu suntem pregătiți să încercăm dezasamblarea cardului nostru — și sincer, nu mai avem timp — dar s-ar putea să revenim la subiect în curând. Ni s-a spus că scoaterea cardului este un pic mai complicată în această rundă, mai ales pentru că Nvidia a ascuns șuruburile în spatele capacelor minuscule.,placa principală arată mult mai dens populată decât GPU-urile anterioare, cu cipurile de memorie 10 GDDR6X care înconjoară GPU-ul în centru. Puteți vedea, de asemenea, conectorul de alimentare cu 12 pini în unghi și decupajul cu aspect funky la capătul PCB. Livrarea de energie este evident importantă cu un TGP de 320W și puteți vedea toate condensatoarele electrolitice solide plasate la stânga și la dreapta cipurilor de memorie.,aranjamentul de memorie este, de asemenea, interesant, cu patru cipuri pe partea stângă și dreaptă a GPU-ului, până la trei cipuri deasupra GPU-ului (două poziții de montare sunt goale pentru RTX 3080) și un singur cip final sub GPU. Din nou, Nvidia a depus în mod clar mult efort pentru a reduce dimensiunea plăcii și a altor componente pentru a se potrivi designului de răcire nou și îmbunătățit. Spoiler: funcționează foarte bine.un lucru interesant este că ventilatorul „frontal” (lângă porturile video) se rotește în direcția obișnuită — în sens invers acelor de ceasornic., Ventilatorul „înapoi”, care se va confrunta de obicei în sus atunci când instalați cardul într-un caz ATX, se învârte în sensul acelor de ceasornic. Dacă te uiți la aripioare, asta înseamnă că ventilatorul din spate se învârte în direcția opusă față de ceea ce ne așteptăm în mod normal. Motivul este că Nvidia a găsit acest aranjament trage aer prin radiator mai bine și generează mai puțin zgomot. De asemenea, rețineți că ventilatorul din spate este puțin mai gros, iar inelul integrat ajută la creșterea presiunii statice pe ambele ventilatoare, menținând în același timp rpm-urile scăzute.dacă nu vă place aspectul ediției Fondatorilor, fiți siguri că vor exista o mulțime de alte opțiuni., Avem câteva carduri RTX 3080 terțe pentru testare, toate incluzând în mod natural iluminarea RGB. Nici una dintre cărțile terțe nu utilizează conectorul de alimentare cu 12 pini-nu că contează cu adevărat, deoarece adaptorul necesar vine cu cardul. Totuși, acel port cu 12 pini montat vertical arată doar un pic mai puțin robust dacă se întâmplă să schimbați GPU-urile în mod regulat. Intenționez să las adaptorul conectat permanent și să conectez sau să deconectez cablurile normale cu 8 pini., Conectorul cu 12 pini pare să fie evaluat pentru ciclurile 25 și am ars deja jumătate din acestea (nu că mă aștept să eșueze în orice moment în curând).