az Nvidia GeForce RTX 3080 Alapítók Edition itt van, azt állítva, hogy az első helyet a GPU referenciaértékek hierarchia, rangsor, valamint a legjobb grafikus kártya jelenleg rendelkezésre álló — feltéve, hogy miután teljesítmény először is, az ár, valamint a hatalmat, hogy kevésbé érinti. Több hónapos várakozás után végre független referenciaértékek és tesztelési adatok is rendelkezésre állnak., Az Nvidia ledobta a kesztyűt, egyértelműen kihívást jelent az AMD nagy Navi-jára, hogy megpróbálja egyeztetni vagy legyőzni azt, amit az Amper architektúra hoz az asztalra.
egyelőre felfüggesztjük a végső ítéletet, mivel más harmadik fél RTX 3080 kártyáit is meg kell vizsgálnunk, amelyek holnap kezdődnek. Ez jó hír, mivel ez azt jelenti, hogy az ügyfelek nem korlátozódnak az Nvidia alapítói kiadására az első hónapban, vagy úgy, mint az RTX 20 sorozatú indítással., Egy másik jó hír, hogy ezúttal nincs ” adó ” kiadás: az RTX 3080 FE 699 dollárba kerül, közvetlenül az Nvidia-tól, és egyelőre ez az RTX 3080 kártyák alapára. A rossz hír az, hogy teljes mértékben arra számítunk, hogy a kínálat nem elegendő ahhoz, hogy lépést tartsunk azzal, amit rendkívül magas keresletre várunk.
a lényeg, ha nem bánja a spoilereket, az, hogy az RTX 3080 FE átlagosan 33% – kal gyorsabb, mint az RTX 2080 Ti., Vagy ha más összehasonlítási pontokat szeretne, akkor 57% – kal gyorsabb, mint az RTX 2080 Super, 69% – kal gyorsabb, mint az RTX 2080 FE-heck, még 26% – kal gyorsabb, mint a Titan RTX!
de van egy fogás:az összes “százalékos gyorsabb” eredményt a 4K ultra beállításokon futó tesztcsomagunkon mértük. Az ólom szűkül, ha 1440p-re csökken, és még inkább csökken 1080p-nél. még mindig 42% – kal gyorsabb, mint egy 2080 FE 1080p ultra-nál, de ez nagyon sok kártya a nagyobb felbontásokhoz., Is, szükség lehet egy gyorsabb CPU, hogy a teljes 3080 tapasztalat-nézd meg a társa GeForce RTX 3080 CPU méretezés cikket a részleteket.,
Graphics Card | RTX 3080 FE | RTX 2080 Super FE | RTX 2080 FE | |||||||
---|---|---|---|---|---|---|---|---|---|---|
Architecture | GA102 | TU104 | TU104 | |||||||
Process (nm) | Samsung 8N | TSMC 12FFN | TSMC 12FFN | |||||||
Transistors (Billion) | 28.3 | 13.6 | 13.6 | |||||||
Die size (mm^2) | 628.,4 GPCs |
SMs |
FP32 CUDA Magok |
tíz a Mag |
B Mag |
VRAM Sp (gb / s) |
Sep-20 |
Jul-19 |
Sep-18 |
|
Indítás Ár | $699 | $699 | $799 |
Találkozni GA102: A Szörnyeteg szívébe
– van egy külön cikk fog mélyen az Ampere architektúra, hogy a hatáskörök a GeForce RTX 3080, valamint egyéb kapcsolódó Gpu., Ha azt szeretnénk, hogy a teljes lepusztult minden, ami megváltozott, mint a Turing architektúra, javasoljuk, hogy ott. De itt az összefoglaló a legfontosabb változások:
A GA102 az első GPU-tól Nvidia, hogy csökken az egy számjegyű a litográfia, segítségével a Samsung 8N folyamat. Az általános konszenzus az, hogy a TSMC N7 csomópontja összességében “jobb”, de többe kerül, és jelenleg nagyon nagy a kereslet — beleértve az Nvidia saját A100-at is. Lehet, hogy a fogyasztói Amper GPU-k még jobbak voltak a 7nm-rel? Talán., De lehet, hogy többet költöttek, csak korlátozott mennyiségben álltak rendelkezésre,vagy talán még néhány hónapot késtek volna. Ettől függetlenül a GA102 még mindig egy nagy és nagy teljesítményű chip, amely 28, 3 milliárd tranzisztorral büszkélkedhet, 628, 4 mm-es négyzet alakú szerszámba csomagolva. Ha kíváncsi, ez 52% – kal több tranzisztor, mint az RTX 2080 Ti-ben használt TU102 chip, de 17% – kal kisebb területen.
az Ampere osztott architektúraként végződik, a GA100 pedig adatközponti ambíciókat vesz fel, míg a GA102 és más fogyasztói chipek jelentős különbségeket mutatnak., A GA100 sokkal inkább a tudományos munkaterhelések FP64 teljesítményére összpontosít, valamint megduplázza a mély tanulási hardvert. Eközben a GA102 csökkenti az FP64 funkcionalitás nagy részét, ehelyett magában foglalja a ray tracing hardvert, valamint néhány más építészeti fejlesztést. Vessünk egy közelebbi pillantást a Ampere SM található GA102 és GA104.,
az NVIDIA GPU-k több GPC-ből (grafikus feldolgozási klaszterekből) állnak, amelyek mindegyikében van néhány SMS (streaming Multiprocesszorok). Az Nvidia minden egyes SM-et négy partícióra osztja, amelyek külön adatkészleteken működhetnek. Az Ampere segítségével minden SM partíciónak 16 FP32 CUDA magja van, 16 FP32/INT CUDA mag, egy harmadik generációs tenzor mag, terhelés/tároló egységek, valamint egy speciális funkcióegység., Az egész SM hozzáféréssel rendelkezik a megosztott L1 gyorsítótárhoz és memóriához, és van egy második generációs RT mag. Ez összesen 64 FP32 magot és 64 FP32/INT magot, négy Turing magot és egy RT magot jelent. Bontsuk le még egy kicsit.
a Turing GPU-k támogatták a párhuzamos FP32 (32 bites lebegőpontos) és INT (32 bites egész szám) műveleteket. FP32 általában a legfontosabb munkaterhelés grafika és játékok, de még mindig van egy tisztességes mennyiségű INT műveletek — a dolgok, mint a cím számítások, textúra keresések, és különböző más típusú kódot., Az Ampere segítségével az INT datapath frissítésre kerül az INT vagy az FP32 támogatására, de nem egyszerre.
Ha megnézzük a nyers specifikációkat, az Ampere sokkal nagyobb teljesítmény-ugrásnak tűnik, mint az általunk mért 70%. 30 TFLOPS! De általában nem fog olyan magasra jutni, mert a második datapath egy vagy / vagy helyzet: nem tudja mindkét típusú utasítást elvégezni a csővezetéken ugyanabban a ciklusban. Az Nvidia szerint a játékszámítások körülbelül 35% – A INT művelet, ami azt jelenti, hogy valami több, mint 20 TFLOPS FP32 és 10 TOPS INT az RTX 3080-on.,
miközben a témában vagyunk, mutassuk meg azt is, hogy a megnövekedett teljesítmény nagy része a megnövekedett teljesítménykorlátokból származik. Az RTX 2080 egy 225W-os rész volt (az alapítók kiadásához), az RTX 3080 pedig alapvetően 100W-ot ad hozzá. Ez a fele ismét nagyobb teljesítmény 70% – kal nagyobb teljesítmény. Ez technikailag egy győzelem az általános hatékonyság, de a törekvés a teljesítmény, Nvidia kellett mozgatni tovább jobbra a feszültség-frekvencia görbe., Az Nvidia szerint az RTX 3080 90%-kal javíthatja a teljesítmény-per-wattot, ha a teljesítményt mind a 2080-as, mind a 3080-as szintre korlátozza … de gyerünk, ki akarja így korlátozni a teljesítményt? Nos, talán laptopok, de ne menjünk oda.
egy dolog, ami nem sokat változott, a videó portok. Oké, ez csak részben igaz., Először is, van egy HDMI port, de a Turing HDMI 2.0 b helyett HDMI 2.1, de a három DisplayPort kapcsolat továbbra is 1.4 a. végül, de nem utolsósorban, nincs VirtualLink port ebben a körben-nyilvánvalóan a VirtualLink halott. RIP. A különböző portok mindegyike képes 8k60 segítségével DSC (Display Stream tömörítés), a “vizuálisan veszteségmentes” technika, ami valójában nem igazán vizuálisan veszteségmentes. De lehet, hogy 8K-nál nem veszi észre.
visszatérve a magokhoz, az Nvidia harmadik generációs tenzor magjai a GA102-ben 8x4x4 FP16 mátrixokon dolgoznak, így akár 128 mátrix művelet ciklusonként., (Turing tensor magjai 4x4x4 mátrixokat használtak, míg a GA100 8x4x8 mátrixokat használ.) FMA-val (fuzionált multiply-add), azaz ciklusonként 256 FP művelet, tenzor magonként. Szorozzuk meg a 272 teljes tenzormaggal és az órajel sebességével, és ez 119 TFLOPS FP16 számítási eredményt ad. Az Ampere tensor magjai azonban támogatják a finomszemcsés sparsity-t is-alapvetően kiküszöböli az időveszteséget 0 szorzással, mivel a válasz mindig 0. A Sparsity az FP16 teljesítményének akár kétszeresét is képes biztosítani az azt használó alkalmazásokban.,
az RT magok hasonló fejlesztéseket kapnak, óránkénti ray / triangle metszésszámítás duplázásával. Az RT magok egy időváltozót is támogatnak, amely hasznos olyan dolgok kiszámításához, mint a motion blur. Az Nvidia szerint a 3080-as Új RT-magok 1,7-szer gyorsabbak, mint az RTX 2080-asok, és akár ötször gyorsabbak is lehetnek a mozgás elmosódásához.
rengeteg más változás is van. Az L1 gyorsítótár/megosztott memória kapacitás és sávszélesség nőtt, hogy jobban táplálja a magokat (8704KB vs. 4416KB), valamint az L2 gyorsítótár is 25% – kal nagyobb, mint korábban (5120kb vs., 4096KB). Az L1 gyorsítótár is konfigurálható változó mennyiségű L1 vs. megosztott memória, igényeitől függően az alkalmazás. Register fájl mérete is közel 50% – kal nagyobb (17408KB vs.11776KB) az RTX 3080. GA102 is csinálni egyidejű RT + grafika + DLSS (korábban, az RT magok leállna a CUDA magok).
végül a raszteres operátorok (ROPS) kikerültek a memóriavezérlőkből és a GPC-kbe. Minden GPC-nek két ROP partíciója van, amelyek mindegyike nyolc ROP egységet tartalmaz., Ez nagyobb rugalmasságot biztosít a teljesítményben, így ahol a GA102 összesen legfeljebb 112 ROPS-ot tartalmaz, az RTX 3080 két memóriavezérlőt letiltja, de csak egy GPC-t, és 96 ROPS-ot eredményez. Ez kritikusabb az RTX 3070 / GA104 esetében, amely még mindig 96 ROPS, annak ellenére, hogy csak nyolc memóriavezérlővel rendelkezik. Mindegyik GPC hat Tpc-t (Texture Processing Clusters) tartalmaz nyolc TMU-val (Texture Mapping Units) és egy polimorf motorral, bár az Nvidia csak 34 Tpc-t tesz lehetővé a 3080-hoz.,
a Core fejlesztések az útból, nézzük is gyorsan megvitatják a memória alrendszer. A GA102 legfeljebb tizenkét 32 bites memóriacsatornát támogat, amelyek közül tíz engedélyezve van az RTX 3080-on. Az Nvidia összeállt a Micron-nal a GDDR6X memória használatához, amely a PAM4 jelátvitelt használja az adatsebesség még magasabb növelésére, mint korábban. Ahol az RTX 20 sorozatú kártyák tetején ki 15.,5 Gbps a 2080-as Super és 14 Gbps a többi RTX kártyán, A GDDR6X 19 Gbps sebességgel fut az RTX 3080-ban. A 320 bites felülettel kombinálva, amely 760 GBps sávszélességet eredményez – 70% – os javulás az RTX 2080-hoz képest.
az RTX 3080 memóriavezérlőjét is továbbfejlesztették, az EDR: Error Detection and Replay nevű új funkcióval. Amikor a memória meghibásodott átvitelt észlel, ahelyett, hogy összeomlik vagy megrontja az adatokat, egyszerűen megpróbálja újra. Ezt addig fogja megtenni, amíg sikeres lesz, bár még mindig lehetséges összeomlást okozni a memória túlhúzásával., Az érdekes rész az, hogy az EDR-rel a magasabb memória órák elérhetők lehetnek, de még mindig alacsonyabb teljesítményt eredményeznek. Ennek oka az, hogy az EDR végül csökkenti a memória teljesítményét, ha sikertelen átvitel történik. Erről többet kell mondanunk a tuningolás szakaszban.,
GeForce RTX 3080 Alapítók Kiadás: Design, Hűtés, Esztétika
az Nvidia gyökeresen megváltozott a design Alapítója Edition kártya az RTX 30-sorozat., Az új design még mindig magában foglalja a két axiális ventilátorok, de az Nvidia erősen átalakították a PCB, valamint rövidített úgy, hogy a “vissza” a kártya (távol a videó portok) áll, csak egy rajongó, heatpipes, radiátor uszony, a szokásos grafikus kártya lepel. Az Nvidia szerint az új kialakítás jelentősen javítja a hűtési hatékonyságot, ugyanakkor csökkenti a zajszintet. Később meglátjuk a design gyümölcseit.
az esztétika erősen szubjektív, és rengeteg olyan embert hallottunk, mint az új dizájn, míg mások szerint unalmasnak tűnik., Nincs RGB bling, ha ez a dolog, és az egyetlen világítás áll egy fehér GeForce RTX logó tetején a kártya finom világítás körül az ” X “mindkét oldalán a kártya (de csak a fele az” X “világít az oldalán a” RTX 3080 ” logó).
személy szerint úgy gondolom, hogy az új kártya nagyon szépnek tűnik, nagyon szilárdnak érzi magát a kezében. Ez valójában körülbelül 100g nehezebb, mint a korábbi RTX 2080 design, és amennyire tudom, ez a legnehezebb egy GPU kártya Nvidia valaha létrehozott., Ez körülbelül 2 cm-rel hosszabb, mint az előző generációs kártyák, a tipikus két slot szélességet használja. (A GeForce RTX 3090 körülbelül kész arra, hogy a 3080 FE néz apró, bár, a hatalmas három slot hűtő.)
az NVIDIA a fenti képeket az RTX 3080 alapítók kiadásának teardownjáról szolgáltatta. Még nem vagyunk készen arra, hogy megpróbáljuk szétszerelni a kártyánkat — és őszintén szólva, kifutunk az időből -, de hamarosan visszatérhetünk a témához. Azt mondják, hogy a kártya szétválasztása kissé trükkösebb ebben a körben, főleg azért, mert az Nvidia elrejtette a csavarokat apró burkolatok mögött.,
az alaplap sokkal sűrűbbnek tűnik, mint a korábbi GPU-k, a közepén a 10 GDDR6X memória chip körül a GPU. A NYÁK végén látható a szögletes 12 tűs tápcsatlakozó és a funky kinézetű kivágás is. Az energiaellátás nyilvánvalóan fontos egy 320W-os TGP-vel, és az összes szilárd elektrolit kondenzátor látható a memória chipek bal és jobb oldalán.,
a memória elrendezése is érdekes, négy chip a GPU bal és jobb oldalán, legfeljebb három chip a GPU felett (két rögzítési pozíció üres az RTX 3080 számára), valamint egy végső egyetlen chip a GPU alatt. Ismét NVIDIA egyértelműen töltött sok erőfeszítést, hogy csökkentse a méretét a fórumon, valamint egyéb alkatrészek elhelyezésére az új, továbbfejlesztett hűtési design. Spoiler: nagyon jól működik.
egy érdekes dolog az, hogy az “elülső” ventilátor (a videoportok közelében) a szokásos irányba forog — az óramutató járásával ellentétes irányban., A “hátsó” ventilátor, amely általában felfelé néz, amikor a kártyát ATX tokba telepíti, az óramutató járásával megegyező irányban forog. Ha megnézzük az uszonyokat, ez azt jelenti, hogy a hátsó ventilátor az ellenkező irányba forog, mint amit általában várunk. Ennek oka, hogy az Nvidia úgy találta, hogy ez az elrendezés jobban húzza át a levegőt a radiátoron, és kevesebb zajt generál. Vegye figyelembe azt is, hogy a hátsó ventilátor kissé vastagabb, az integrált gyűrű pedig növeli a statikus nyomást mindkét ventilátoron, miközben alacsonyan tartja az RPMs-t.
Ha nem tetszik az alapítók kiadásának megjelenése, biztos lehet benne, hogy sok más lehetőség is lesz., Van néhány harmadik féltől származó RTX 3080 kártya a teszteléshez, amelyek mindegyike természetesen tartalmazza az RGB világítást. A harmadik felek egyik kártyája sem használja a 12 tűs tápcsatlakozót — nem mintha igazán számítana, mivel a szükséges adapter a kártyához tartozik. Mégis, hogy függőlegesen szerelt 12 tűs port csak úgy néz ki, egy kicsit kevésbé robusztus, ha történetesen swap GPU rendszeresen. Azt tervezem, hogy az adaptert véglegesen csatlakoztatom, csak csatlakoztatom vagy leválasztom a normál 8 tűs PEG kábeleket., Úgy tűnik, hogy a 12 tűs csatlakozó 25 “ciklusra” van besorolva ,és már ezeknek a felét elégettem (nem mintha azt várnám, hogy hamarosan kudarcot vall).