Nvidia’ s GeForce RTX 3080 Founders Edition is hier, het Claimen van de top plek op onze GPU benchmarks hiërarchie, en ranking als de beste grafische kaart momenteel beschikbaar — op voorwaarde dat je na de prestaties eerst, met prijs en macht zijn minder zorgen. Na maanden wachten hebben we eindelijk onafhankelijke benchmarks en testgegevens., Nvidia heeft gegooid naar beneden de handschoen, duidelijk uitdagend AMD ‘ s grote Navi om te proberen en overeenkomen Of verslaan wat de Ampere architectuur brengt aan de tafel.
We gaan een eindoordeel voorlopig uitstellen, omdat we andere RTX 3080 kaarten van Derden moeten bekijken, die morgen al beginnen. Dat is goed nieuws, want het betekent dat klanten niet worden beperkt tot Nvidia ‘ s Founders Edition voor de eerste maand of zo, zoals we waren met de RTX 20-serie lancering., Een ander goed nieuws is dat er geen Founders Edition ‘belasting’ deze keer: de RTX 3080 FE kost $699, rechtstreeks van Nvidia, en dat is de basisprijs van RTX 3080 kaarten voor het moment. Het slechte nieuws is dat we volledig verwachten dat het aanbod onvoldoende zal zijn om te voldoen aan wat we verwachten dat de vraag uitzonderlijk hoog zal zijn.
De bottom line, als je spoilers niet erg vindt, is dat de RTX 3080 FE gemiddeld 33% sneller is dan de RTX 2080 Ti., Of, als u liever andere vergelijkingspunten, het is 57% sneller dan de RTX 2080 Super, 69% sneller dan de RTX 2080 FE-heck, het is zelfs 26% sneller dan de Titan RTX!
maar er is een addertje onder het gras: we hebben al die ‘procent snellere’ resultaten gemeten in onze test suite met 4K ultra instellingen. De lead vernauwt als je daalt tot 1440p, en het daalt nog meer bij 1080p. het is nog steeds 42% sneller dan een 2080 FE bij 1080p ultra, maar dit is zeer veel een kaart gemaakt voor hogere resoluties., Ook heeft u mogelijk een snellere CPU nodig om de volledige 3080 — ervaring te krijgen-bekijk ons metgezel GeForce RTX 3080 CPU-Scaling artikel voor de volledige details.,
Graphics Card | RTX 3080 FE | RTX 2080 Super FE | RTX 2080 FE | |||||||
---|---|---|---|---|---|---|---|---|---|---|
Architecture | GA102 | TU104 | TU104 | |||||||
Process (nm) | Samsung 8N | TSMC 12FFN | TSMC 12FFN | |||||||
Transistors (Billion) | 28.3 | 13.6 | 13.6 | |||||||
Die size (mm^2) | 628.,4 – GPCs |
SMs |
FP32 CUDA-Cores |
tien van de Kernen |
B-Kernen |
VRAM Sp (Gbps) |
Sep-20 |
Jul-19 |
Sep-18 |
|
Lancering Prijs | $699 | $699 | $799 |
Voldoen aan GA102: Het Hart van het Beest
We hebben een apart artikel gaan diep in de Ampere-architectuur die de bevoegdheden van de GeForce RTX 3080 en andere gerelateerde Gpu ‘ s., Als je het volledige overzicht wilt van alles wat is veranderd ten opzichte van de Turing-architectuur, raden we je aan om daar te beginnen. Maar hier is de highlight reel van de belangrijkste veranderingen:
De GA102 is de eerste GPU van Nvidia om te vallen in de enkele cijfers op lithografie, met behulp van Samsung ‘ s 8N proces. De algemene consensus is dat TSMC ’s N7 knooppunt is’ beter ‘in het algemeen, maar het kost ook meer en is momenteel in zeer hoge vraag — met inbegrip van Nvidia’ s eigen A100. Zou de consument Ampere GPU ‘ s nog beter zijn geweest met 7nm? Misschien., Maar misschien kostten ze meer, waren ze slechts in beperkte hoeveelheden verkrijgbaar, of hadden ze misschien nog een paar maanden vertraging opgelopen. Hoe dan ook, GA102 is nog steeds een grote en krachtige chip, met 28,3 miljard transistors verpakt in een 628,4 mm vierkante sterven. Als je je afvraagt, dat is 52% meer transistors dan de tu102 chip gebruikt in RTX 2080 Ti, maar in een 17% kleiner gebied.
Ampere eindigt als een gesplitste architectuur, waarbij de ga100 ambities op zich neemt voor datacenters, terwijl de GA102 en andere consumentenchips aanzienlijke verschillen vertonen., De GA100 richt zich veel meer op FP64 prestaties voor wetenschappelijke workloads, evenals een verdubbeling op deep learning hardware. Ondertussen, de GA102 laat het grootste deel van de fp64 functionaliteit en in plaats daarvan bevat ray tracing hardware, plus een aantal andere architectonische verbeteringen. Laten we eens een kijkje nemen op de Ampere SM gevonden in de GA102 en GA104.,
Nvidia Gpu ‘ s bestaan uit verschillende GPCs (Graphics Processing Clusters), die elk een aantal SMs (Streaming Multiprocessors). Nvidia splitst elke SM in vier partities die kunnen werken op afzonderlijke sets van gegevens. Met Ampere heeft elke SM-partitie nu 16 FP32 CUDA-kernen, 16 FP32 / int CUDA-kernen, een Tensorkern van de derde generatie, load/store-eenheden en een speciale functie-eenheid., De hele SM heeft toegang tot gedeelde L1 cache en geheugen, en er is een enkele tweede generatie RT-kern. In totaal betekent dit 64 FP32-kernen en 64 FP32 / int-kernen, vier Turing-kernen en één RT-kern. Laten we dat wat meer uitleggen.
De Turing GPU ‘ s hebben ondersteuning toegevoegd voor gelijktijdige FP32 (32-bits floating point) en int (32-bits integer) operaties. FP32 heeft de neiging om de belangrijkste werklast voor graphics en games, maar er is nog steeds een behoorlijke hoeveelheid int — bewerkingen-voor dingen zoals adres berekeningen, textuur lookups, en diverse andere soorten code., Met Ampere wordt de INT Datapath geüpgraded om INT of FP32 te ondersteunen, maar niet tegelijkertijd.
als je naar de Raw specs kijkt, lijkt Ampere een veel grotere sprong in prestaties te zijn dan de 70% die we gemeten hebben. 30 TFLOPS! Maar over het algemeen zal het niet ergens in de buurt van dat hoog, omdat de tweede datapath is een of/of situatie: het kan niet beide soorten instructies op de pijplijn in dezelfde cyclus. Nvidia zegt ongeveer 35% van de gaming berekeningen zijn int operaties, wat betekent dat je eindigt met iets meer als 20 TFLOPS van FP32 en 10 toppen van INT op de RTX 3080.,
nu we het over dit onderwerp hebben, laten we er ook op wijzen dat een groot deel van de verbeterde prestaties afkomstig is van verhoogde vermogenslimieten. RTX 2080 was een 225W onderdeel (voor de Founders Edition), en RTX 3080 voegt daar in principe 100W aan toe. Dat is de helft weer meer vermogen voor 70% meer prestaties. Het is technisch een overwinning in de algehele efficiëntie,maar in het nastreven van de prestaties, Nvidia moest verder naar rechts op de spanning en frequentie curve., NVIDIA zegt RTX 3080 kan leveren een 90% verbetering van de prestaties-per-watt als je de prestaties te beperken tot hetzelfde niveau op zowel de 2080 en 3080 … maar kom op, wie wil de prestaties te beperken op die manier? Misschien laptops, maar laten we het daar niet over hebben.
een ding dat niet veel veranderd is, zijn de videopoorten. Oké, dat is maar gedeeltelijk waar., Ten eerste is er een enkele HDMI — poort, maar het is HDMI 2.1 in plaats van Turing ‘ s HDMI 2.0 b, maar de drie DisplayPort-aansluitingen blijven 1.4 A. en last but not least, er is geen VirtualLink-poort deze ronde-blijkbaar, VirtualLink is dood. SCHEUREN. De verschillende poorten zijn allemaal geschikt voor 8K60 met behulp van DSC( Display Stream Compression), een” visueel verliesloos ” techniek die eigenlijk niet echt visueel verliesloos is.
om terug te keren naar de kernen, werken NVIDIA ‘ s third-gen tensor kernen in GA102 op 8X4X4 FP16 matrices, dus tot 128 matrixbewerkingen per cyclus., (Turing ‘ s tensorkernen gebruikten 4x4x4 matrices, terwijl de GA100 8x4x8 matrices gebruikt.) Met FMA (fused multiply-add), dat is 256 FP operaties per cyclus, per tensor kern. Vermenigvuldig met de 272 Totale tensorkernen en kloksnelheid, en dat geeft je 119 TFLOPS van FP16 berekenen. De tensorkernen van Ampere voegen echter ook ondersteuning toe voor fijnkorrelige sparsity-in principe elimineert het tijdverspilling door vermenigvuldigingen met 0, omdat het antwoord altijd 0 is. Sparsity kan tot tweemaal de FP16 prestaties leveren in toepassingen die het kunnen gebruiken.,
de RT-Kernen ontvangen soortgelijke verbeteringen, met tot het dubbele van de Ray/driehoek-snijberekeningen per klok. De RT-kernen ondersteunen ook een tijdvariabele, die handig is voor het berekenen van dingen zoals bewegingsonscherpte. Al met al, NVIDIA zegt dat de 3080 ’s nieuwe RT cores zijn 1,7 keer sneller dan de RTX 2080′ s, en ze kunnen tot vijf keer zo snel voor motion blur.
Er zijn ook tal van andere wijzigingen. De L1 cache / gedeelde geheugencapaciteit en bandbreedte is verhoogd om de cores beter te voeden (8704KB vs. 4416KB), en de L2 cache is ook 25% groter dan voorheen (5120KB vs., 4096KB). De L1 cache kan ook worden geconfigureerd als variërende hoeveelheden van L1 vs. gedeeld geheugen, afhankelijk van de behoeften van de toepassing. Register Bestandsgrootte is ook bijna 50% groter (17408KB vs. 11776KB) met de RTX 3080. GA102 kan ook gelijktijdig RT + graphics + DLSS doen (voorheen zou het gebruik van de RT-kernen de CUDA-kernen stoppen).
ten slotte zijn de rasteroperators (ROPS) verplaatst van de geheugencontrollers naar de GPC ‘ s. Elke GPC heeft twee ROP partities van elk acht ROP eenheden., Dit zorgt voor meer flexibiliteit in prestaties, Dus waar de GA102 tot 112 ROPS totaal heeft, schakelt de RTX 3080 twee geheugencontrollers uit, maar slechts één GPC en eindigt met 96 ROPS. Dit is echter belangrijker voor de RTX 3070 / GA104, die nog steeds 96 ROPS heeft, hoewel het slechts acht geheugencontrollers heeft. Elke GPC bevat ook zes Tpcs (Texture Processing Clusters) met acht Tmus (Texture Mapping Units) en een polymorph engine, hoewel Nvidia alleen 34 tpcs voor de 3080.,
met de kernverbeteringen uit de weg, laten we ook snel het geheugen subsysteem bespreken. GA102 ondersteunt maximaal twaalf 32-bits geheugenkanalen, waarvan er tien zijn ingeschakeld op de RTX 3080. Nvidia werkte samen met Micron om zijn GDDR6X-geheugen te gebruiken, dat PAM4-signalen gebruikt om gegevenssnelheden nog hoger te verhogen dan voorheen. Waar de RTX 20-serie kaarten eindigde op 15.,5 Gbps in de 2080 Super en 14 Gbps in de andere RTX kaarten, GDDR6X draait op 19 Gbps in de RTX 3080. Gecombineerd met de 320-bit interface levert dat 760 GBps bandbreedte op – een 70% verbetering ten opzichte van RTX 2080.
de geheugencontroller van RTX 3080 is ook verbeterd, met een nieuwe functie genaamd EDR: Error Detection en Replay. Wanneer het geheugen een mislukte overdracht detecteert, in plaats van te crashen of data te beschadigen, probeert het gewoon opnieuw. Het zal dit doen totdat het succesvol is, hoewel het nog steeds mogelijk is om een crash te veroorzaken met geheugen overklokken., Het interessante is dat met EDR hogere geheugenklokken haalbaar zijn, maar toch resulteren in lagere prestaties. Dat komt omdat de EDR uiteindelijk het verminderen van de geheugenprestaties wanneer mislukte transmissies optreden. We hebben hier meer over te zeggen in de overklokken sectie.,
GeForce RTX 3080 Oprichters Editie: Ontwerp, Koeling, Esthetiek
Nvidia ingrijpend heeft veranderd aan het design van de Oprichters Edition kaarten voor de RTX 30-serie., Het nieuwe ontwerp bevat nog steeds twee axiale fans, maar NVIDIA sterk herontworpen de PCB en verkort het zo dat de ‘achterkant’ van de kaart (weg van de video-poorten) bestaat uit slechts een ventilator, heatpipes, radiator vinnen, en de gebruikelijke grafische kaart shroud. Nvidia zegt dat het nieuwe ontwerp levert aanzienlijke verbeteringen in koeling efficiëntie, terwijl op hetzelfde moment het verlagen van het geluidsniveau. We zullen de vruchten van het ontwerp later zien.
esthetiek is zeer subjectief, en we hebben veel mensen gehoord zoals het nieuwe ontwerp, terwijl anderen denken dat het er saai uitziet., Er is geen RGB bling als dat uw ding is, en de enige verlichting bestaat uit een witte GeForce RTX logo op de bovenkant van de kaart met subtiele verlichting rond de ‘X’ aan beide zijden van de kaart (maar slechts de helft van de ‘X’ is verlicht aan de zijkant met het “RTX 3080” logo).
persoonlijk vind ik de nieuwe kaart er heel mooi uitzien, en het voelt erg stevig in de hand. Het is eigenlijk ongeveer 100g zwaarder dan de vorige RTX 2080 ontwerp, en voor zover ik weet, het is de zwaarste single-GPU kaart Nvidia ooit heeft gemaakt., Het is ook ongeveer 2 cm langer dan de vorige generatie kaarten en maakt gebruik van de typische twee-slot breedte. (De GeForce RTX 3090 is ongeveer klaar om de 3080 FE kijken nietige, hoewel, met zijn enorme drie-slot koeler.)
Nvidia gaf de bovenstaande afbeeldingen van de aftakeling van de RTX 3080 Founders Edition. We zijn nog niet klaar om te proberen onze kaart te demonteren — en eerlijk gezegd, we hebben geen tijd meer — maar we kunnen binnenkort op het onderwerp terugkomen. We hebben te horen krijgen van de kaart uit elkaar is een beetje lastiger deze ronde, vooral omdat Nvidia heeft verborgen de schroeven achter kleine covers.,
het hoofdbord lijkt veel dichter bevolkt dan de vorige GPU ‘ s, met de 10 gddr6x geheugenchips rondom de GPU in het midden. U kunt ook De hoekige 12-pins voedingsconnector en de funky uitziende uitsparing aan het einde van de print zien. Power delivery is uiteraard belangrijk met een 320W TGP, en je kunt alle vaste elektrolytische condensatoren links en rechts van de geheugenchips geplaatst zien.,
het geheugen is ook interessant, met vier chips aan de linker – en rechterkant van de GPU, tot drie chips boven de GPU (twee montageposities zijn leeg voor de RTX 3080), en een laatste enkele chip onder de GPU. Nogmaals, NVIDIA heeft duidelijk veel moeite gedaan om de grootte van de Raad van bestuur en andere componenten te verminderen om tegemoet te komen aan de nieuwe en verbeterde koeling ontwerp. Spoiler: het werkt heel goed.
een interessant ding is dat de’ front ‘ fan (in de buurt van de video poorten) draait in de gebruikelijke richting — tegen de klok in., De’ back ‘ fan, die meestal naar boven zal kijken wanneer u de kaart in een ATX-behuizing installeert, draait met de klok mee. Als je naar de vinnen kijkt, betekent dat dat de achterste ventilator in de tegenovergestelde richting draait van wat we normaal verwachten. De reden is dat Nvidia vond deze regeling trekt lucht door de radiator beter en genereert minder ruis. Merk ook op dat de achterventilator iets dikker is en de geïntegreerde ring helpt de statische druk op beide ventilatoren te verhogen terwijl de RPM ‘ s laag blijven.
als je het uiterlijk van de Founders Edition niet leuk vindt, wees er zeker van dat er tal van andere opties zijn., We hebben een paar RTX 3080-kaarten van derden voor het testen, die allemaal natuurlijk RGB-verlichting bevatten. Ook geen van de kaarten van derden gebruikt de 12-pins voedingsconnector-niet dat het er echt toe doet, aangezien de benodigde adapter bij de kaart wordt geleverd. Toch, die verticaal gemonteerde 12-pin poort ziet er gewoon een beetje minder robuust als je toevallig GPU ‘ s te wisselen op een regelmatige basis. Ik ben van plan om de adapter permanent aangesloten te laten en gewoon de normale 8-pin pin kabels aan te sluiten of los te koppelen., De 12-pins connector lijkt te worden beoordeeld voor 25 ‘ cycli,’ en ik heb al verbrand door de helft van die (niet dat ik verwacht dat het elk moment snel mislukken).