Nvidia GeForce RTX 3080 Zakladatelů Edice je tady, tvrdí první místo na našich GPU referenční hodnoty, hierarchii a pořadí jako nejlepší grafická karta v současné době k dispozici — pokud jste po výkonu první, s cena a výkon je menší obavy. Po měsících čekání máme konečně nezávislá měřítka a testovací data., Nvidia hodil rukavici, jasně náročné AMD je Velká Navi, aby se pokusila zápas nebo porazit co Ampér architektura přináší na stůl.
prozatím odložíme konečný verdikt, protože máme k dispozici další karty RTX 3080 třetích stran, které začnou již zítra. To je dobrá zpráva, protože to znamená, že zákazníci nebudou omezeny na Nvidia Zakladatelů Edition za první měsíc nebo tak, jako bychom byli s RTX 20-série spuštění., Další dobrou zprávou je, že tentokrát neexistuje žádná edice zakladatelů „daň“: RTX 3080 Fe stojí $ 699, přímo od Nvidia, a to je prozatím základní cena karet RTX 3080. Špatnou zprávou je, že plně očekáváme, že nabídka bude nedostatečná, abychom drželi krok s tím, co očekáváme, že bude mimořádně vysoká poptávka.
Sečteno a podtrženo, pokud vám nevadí spoilery, je to, že RTX 3080 FE je v průměru o 33% rychlejší než RTX 2080 Ti., Nebo, pokud dáváte přednost jiné body srovnání, to je 57% rychlejší než RTX 2080 Super, 69% rychlejší než RTX 2080 FE — sakra, to je dokonce o 26% rychlejší než Titan RTX!
ale je tu háček: měřili jsme všechny tyto „procenta rychlejší“ výsledky v naší testovací sadě běžící na 4K ultra nastavení. Vedení se zužuje pokud jste drop dolů do 1440p, a to snižuje ještě více na 1080p. Pořád je to 42% rychleji než 2080 FE na 1080p ultra, ale tohle je moc karty vyrobené pro vyšší rozlišení., Také možná budete potřebovat rychlejší CPU, abyste získali plný zážitek 3080 — podívejte se na náš společník GeForce RTX 3080 CPU Scaling článek pro úplné podrobnosti.,
Graphics Card | RTX 3080 FE | RTX 2080 Super FE | RTX 2080 FE | |||||||
---|---|---|---|---|---|---|---|---|---|---|
Architecture | GA102 | TU104 | TU104 | |||||||
Process (nm) | Samsung 8N | TSMC 12FFN | TSMC 12FFN | |||||||
Transistors (Billion) | 28.3 | 13.6 | 13.6 | |||||||
Die size (mm^2) | 628.,4 Cigár |
SMs |
FP32 CUDA Jader |
deset Jader |
B Jader |
VRAM Sp (Gbps) |
Sep-20 |
Jul-19 |
Sep-18 |
|
Startovací Cena | $699 | $699 | $799 |
Seznamte se GA102: Srdce Bestie
Máme samostatný článek hluboko do Ampere architektury, který pohání GeForce RTX 3080 a další související Gpu., Pokud chcete úplný přehled všeho, co se změnilo ve srovnání s Turingovou architekturou, doporučujeme začít tam. Ale tady je sestřih toho nejlepšího z nejdůležitějších změn:
GA102 je první GPU od Nvidia k poklesu do jednotlivých číslic na litografie, použití Samsung 8N proces. Obecná shoda spočívá v tom, že uzel N7 TSMC je celkově „lepší“, ale také stojí více a je v současné době ve velmi vysoké poptávce — včetně vlastního A100 společnosti Nvidia. Mohl by být spotřebitelský ampér GPU ještě lepší se 7nm? Možná., Mohly však stát více, byly k dispozici pouze v omezeném množství,nebo by možná byly zpožděny o několik měsíců. Bez ohledu na to, GA102 je stále velký a silný čip, který se může pochlubit 28,3 miliardy tranzistorů zabalené do 628.4 mm náměstí zemřít. Pokud vás to zajímá, je to o 52% více tranzistorů než čip TU102 používaný v RTX 2080 Ti, ale v 17% menší oblasti.
Ampér skončí jako split architektury, s GA100 přičemž na datové centrum ambice, zatímco GA102 a další spotřební čipy mají významné rozdíly., GA100 se zaměřuje mnohem více na výkon FP64 pro vědecké pracovní zatížení a zdvojnásobuje se na hardware hlubokého učení. Mezitím GA102 upustí většinu funkcí FP64 a místo toho obsahuje hardware pro sledování paprsků a některé další architektonické vylepšení. Podívejme se blíže na Ampere SM nalezený v GA102 a GA104.,
Nvidia Gpu se skládá z několika Cigár (Graphics Processing Clusters), z nichž každý má určitý počet SMs (Streaming Multiprocessors). Nvidia rozděluje každý SM na čtyři oddíly,které mohou pracovat na samostatných sadách dat. S Ampere má každý oddíl SM nyní jádra 16 FP32 CUDA, jádra 16 FP32/INT CUDA, jádro tenzoru třetí generace, jednotky zatížení/úložiště a speciální funkční jednotku., Celý SM má přístup ke sdílené mezipaměti a paměti L1 a je zde jediné jádro RT druhé generace. Celkově to znamená 64 jader FP32 a 64 jader FP32 / INT, čtyři jádra Turing a jedno jádro RT. Pojďme to rozebrat trochu víc.
Turingovy GPU přidaly podporu pro souběžné operace FP32 (32bitová plovoucí desetinná čárka) a INT (32bitové celé číslo). FP32 bývá nejdůležitější pracovní zátěž pro grafiku a hry, ale stále existuje slušné množství operací INT — pro věci, jako jsou výpočty adres, vyhledávání textur a různé další typy kódu., S Ampere, int datapath je aktualizován na podporu INT nebo FP32, ale ne ve stejnou dobu.
Pokud se podíváte na specifikace raw, zdá se, že Ampere je mnohem větší skok ve výkonu než 70%, které jsme měřili. 30 TFLOPS! Ale obecně už tak blízko nedostane tak vysoko, protože druhý datapath je buď, a nebo: nemůže To dělat oba typy pokynů na potrubí ve stejném cyklu. Nvidia říká, že kolem 35% herních výpočtů jsou operace INT, což znamená, že skončíte s něčím více jako 20 TFLOPS z FP32 a 10 vrcholů INT na RTX 3080.,
Když jsme na toto téma, pojďme také poukázat na to, že velká část zvýšeného výkonu pochází ze zvýšených výkonových limitů. RTX 2080 byl součástí 225W (pro Founders Edition) a RTX 3080 k tomu v podstatě přidává 100W. To je opět o polovinu více energie za 70% vyšší výkon. Je to technicky výhra v celkové účinnosti, ale ve snaze o výkon se Nvidia musela posunout dále doprava na křivce napětí a frekvence., Nvidia říká, že RTX 3080 může přinést 90% zlepšení výkonu na watt, pokud omezíte výkon na stejnou úroveň na 2080 i 3080 … ale No tak, kdo chce tímto způsobem omezit výkon? No, možná notebooky, ale nepůjdeme tam.
Jedna věc, která se nezměnilo, je video porty. Dobře, to je jen částečně pravda., Za prvé, je tam jeden port HDMI, ale HDMI 2.1 místo Turingova HDMI 2.0 b, ale tři DisplayPort připojení zůstávají 1.4. A poslední, ale ne nejméně, není VirtualLink port tomto kole — zdá se, VirtualLink je mrtvý. ROZTRHNOUT. Různé porty jsou schopny 8K60 pomocí DSC (komprese proudu displeje), což je „vizuálně bezeztrátová“ technika, která ve skutečnosti není vizuálně bezeztrátová. Ale možná si na 8K.
Dostat se zpátky do jádra, Nvidia třetí-gen tenzor jader v GA102 práce na 8x4x4 FP16 matice, takže až 128 maticové operace za cyklus., (Turingova tenzorová jádra používala matice 4x4x4, zatímco GA100 používá matice 8x4x8.) S FMA (fused multiple-add), to je 256 FP operací na cyklus, na tenzorové jádro. Vynásobte 272 celkovými tenzorovými jádry a rychlostí hodin, a to vám dává 119 TFLOPS z FP16. Nicméně, Ampér je tenzor jader také přidat podporu pro jemnozrnné řídkosti — v podstatě to eliminuje plýtvání času dělat násobení od 0, protože odpověď je vždy 0. Sparsity může poskytnout až dvojnásobek výkonu FP16 v aplikacích, které jej mohou používat.,
jádra RT dostávají podobná vylepšení, přičemž až dvojnásobek výpočtů průsečíku ray/triangle na hodiny. RT jádra také podporují časovou proměnnou, která je užitečná pro výpočet věcí, jako je rozostření pohybu. Vše řečeno, Nvidia říká, že nová RT jádra 3080 jsou 1, 7krát rychlejší než RTX 2080 a mohou být až pětkrát rychlejší pro rozostření pohybu.
existuje spousta dalších změn. L1 cache/sdílené kapacitu paměti a šířku pásma byla zvýšena na lepší krmit jader (8704KB vs. 4416KB), a L2 cache je také o 25% větší než předtím (5120KB vs., 4096KB). Mezipaměť L1 lze také nakonfigurovat jako různé množství L1 vs. sdílené paměti, v závislosti na potřebách aplikace. Registr Velikost souboru je také téměř 50% větší (17408kb vs. 11776kb) s RTX 3080. GA102 může také provádět souběžné RT + graphics + DLSS(dříve pomocí RT jader by se zastavila jádra CUDA).
konečně, rastrové operátory (ROPS) byly přesunuty z řadičů paměti a do GPCs. Každý GPC má dva ROP oddíly po osmi jednotkách ROP., To poskytuje větší flexibilitu ve výkonu, takže tam, kde má GA102 celkem až 112 ROPS, RTX 3080 zakáže dva řadiče paměti, ale pouze jeden GPC a končí 96 ROPS. To je kritičtější pro RTX 3070 / GA104, který však stále má 96 ROPS, i když má pouze osm paměťových řadičů. Každý GPC také zahrnuje šest TPCs (Texture Processing Clusters) s osmi TMUs (Texture Mapping Units) a polymorfní engine, i když Nvidia umožňuje pouze 34 TPCs pro 3080.,
S jádrem příslušenství z cesty, pojďme se také rychle probrat paměťový subsystém. GA102 podporuje až dvanáct 32bitových paměťových kanálů, z nichž deset je povoleno na RTX 3080. Nvidia se spojila s Micronem a použila svou paměť GDDR6X, která používá signalizaci PAM4 pro zvýšení rychlosti dat ještě vyšší než dříve. Kde karty řady RTX 20 skončily na 15.,5 Gbps v 2080 Super a 14 Gbps v ostatních kartách RTX, GDDR6X běží na 19 Gbps v RTX 3080. V kombinaci s 320bitovým rozhraním, které poskytuje 760 Gbps šířky pásma – 70% zlepšení oproti RTX 2080.
byl také vylepšen řadič paměti RTX 3080 s novou funkcí nazvanou EDR: detekce chyb a přehrávání. Když paměť detekuje neúspěšný přenos, spíše než shazovat nebo poškozovat data, jednoduše se pokusí znovu. Bude to dělat, dokud nebude úspěšný, i když je stále možné způsobit havárii s přetaktováním paměti., Zajímavostí je, že s EDR mohou být dosažitelné vyšší paměťové hodiny, ale stále mají za následek nižší výkon. To proto, že EDR nakonec sníží výkon paměti, když dojde k selhání přenosu. Budeme mít více co říci o tom v sekci přetaktování.,
GeForce RTX 3080 Zakladatelů Edice: Design, Chlazení, Estetika
Nvidia radikálně změnil design svých Zakladatelů Vydání karty pro RTX 30-series., Nový design zahrnuje dva axiální ventilátory, ale Nvidia silně přepracované PCB a zkrátit jej tak, aby „zpět“ karty (od video porty) se skládá z jen fanoušek, heatpipes, žebra chladiče, a obvyklé grafické karty rubáš. Nvidia říká, že nový design přináší značné zlepšení účinnosti chlazení a zároveň snižuje hladinu hluku. Ovoce designu uvidíme později.
estetika je vysoce subjektivní a slyšeli jsme spoustu lidí, jako je nový design, zatímco jiní si myslí, že to vypadá nudně., Není RGB bling pokud je to vaše věc, a pouze osvětlení se skládá z bílé GeForce RTX logo na horní části karty s jemné osvětlení kolem “ X „na obou stranách karty (ale jen polovina“ X “ svítí na straně s „RTX 3080“ logo).
osobně si myslím, že nová karta vypadá docela hezky a v ruce je velmi pevná. Je to vlastně o 100g těžší než předchozí design RTX 2080, a pokud vím, je to nejtěžší single-GPU karta, kterou Nvidia kdy vytvořila., Je to také o 2 cm delší než karty předchozí generace a používá typickou šířku dvou slotů. (GeForce RTX 3090 je asi připraven, aby 3080 FE vypadal nepatrně, ačkoli, s masivním chladičem tří slotů.)
Nvidia poskytla výše uvedené obrázky teardownu edice RTX 3080 Founders Edition. Ještě nejsme připraveni se pokusit o demontáž naší karty – a upřímně řečeno, nemáme čas — ale můžeme se brzy vrátit k tématu. Bylo nám řečeno, že Oddělení karty je v tomto kole trochu složitější, hlavně proto, že Nvidia skryla šrouby za malými kryty.,
hlavní deska vypadá mnohem hustěji než předchozí GPU, přičemž paměťové čipy 10 GDDR6X obklopují GPU uprostřed. Můžete také vidět úhlový 12-pin napájecí konektor a funky vypadající výřez na konci PCB. Dodávka energie je samozřejmě důležitá u 320W TGP a můžete vidět všechny pevné elektrolytické kondenzátory umístěné vlevo a vpravo od paměťových čipů.,
uspořádání paměti je také zajímavé, s čtyři žetony na levé a pravé straně GPU, a to až na tři čipy nad GPU (dvě montážní pozice jsou prázdné pro RTX 3080), a poslední jeden čip pod GPU. Nvidia opět vynaložila velké úsilí na snížení velikosti desky a dalších komponent, aby vyhovovala novému a vylepšenému designu chlazení. Spoiler: funguje to velmi dobře.
jedna zajímavá věc je, že „přední“ ventilátor (v blízkosti video portů) se točí obvyklým směrem — proti směru hodinových ručiček., Ventilátor „zpět“, který bude při instalaci karty v případě ATX obvykle směřovat nahoru, se otáčí ve směru hodinových ručiček. Pokud se podíváte na ploutve, znamená to, že zadní ventilátor se otáčí opačným směrem, než obvykle očekáváme. Důvodem je, že Nvidia zjistila, že toto uspořádání lépe táhne vzduch přes radiátor a vytváří méně hluku. Také si všimněte, že zadní ventilátor je o něco silnější a integrovaný kroužek pomáhá zvyšovat statický tlak na oba ventilátory a zároveň udržuje RPMs nízký.
Pokud se vám nelíbí vzhled edice zakladatelů, ujistěte se, že bude spousta dalších možností., Máme několik karet RTX 3080 třetích stran pro testování, z nichž všechny přirozeně zahrnují osvětlení RGB. Žádná z karet třetích stran nepoužívá 12kolíkový napájecí konektor – ne že by na tom opravdu záleželo, protože požadovaný adaptér je dodáván s kartou. Přesto tento vertikálně namontovaný 12pinový port vypadá jen o něco méně robustně, pokud pravidelně vyměňujete GPU. Mám v plánu nechat adaptér trvale připojen a jen připojit nebo odpojit normální 8-pin PEG kabely., Zdá se, že 12pinový konektor je hodnocen pro 25 „cyklů“ a už jsem spálil polovinu z nich (ne, že očekávám, že v dohledné době selže).