Nvidia GeForce RTX 3080 Founders Edition ist hier, behauptet den ersten Platz auf unserer GPU-benchmarks Hierarchie, und das ranking als die beste Grafikkarte derzeit zur Verfügung — vorausgesetzt, Sie sind nach Durchführung der ersten, mit Preis und Leistung werden weniger Bedenken. Nach monatelangem Warten haben wir endlich unabhängige Benchmarks und Testdaten., Nvidia hat den Handschuh heruntergeworfen und AMDs großes Navi eindeutig herausgefordert, zu versuchen, das zu erreichen oder zu schlagen, was die Ampere-Architektur auf den Tisch bringt.
Wir werden vorerst ein endgültiges Urteil abwarten, da wir andere RTX 3080-Karten von Drittanbietern zur Überprüfung haben, die ab morgen beginnen werden. Das sind gute Nachrichten, da die Kunden nicht wie bei der Einführung der RTX 20-Serie im ersten Monat auf Nvidias Founders Edition beschränkt sind., Eine weitere gute Nachricht ist, dass es diesmal keine Founders Edition-Steuer gibt: Der RTX 3080 FE kostet 699 US-Dollar direkt von Nvidia, und das ist vorerst der Grundpreis für RTX 3080-Karten. Die schlechte Nachricht ist, dass wir voll und ganz erwarten, dass das Angebot nicht ausreicht, um mit der außergewöhnlich hohen Nachfrage Schritt zu halten.
Unterm Strich ist der RTX 3080 FE im Durchschnitt 33% schneller als der RTX 2080 Ti, wenn es Spoilern nichts ausmacht., Oder, wenn Sie andere Vergleichspunkte bevorzugen, ist es 57% schneller als der RTX 2080 Super, 69% schneller als der RTX 2080 FE-Heck, es ist sogar 26% schneller als der Titan RTX!
Aber es gibt einen Haken: Wir haben all diese „Prozent schnelleren“ Ergebnisse in unserer Testsuite gemessen, die mit 4K Ultra-Einstellungen ausgeführt wird. Der Vorsprung verengt sich, wenn Sie auf 1440p fallen, und es sinkt noch mehr bei 1080p.Es ist immer noch 42% schneller als ein 2080 FE bei 1080p ultra, aber das ist sehr viel eine Karte für höhere Auflösungen gemacht., Möglicherweise benötigen Sie auch eine schnellere CPU, um das volle 3080 — Erlebnis zu erzielen-lesen Sie unseren Artikel zur CPU-Skalierung von GeForce RTX 3080 für die vollständigen Details.,
Graphics Card | RTX 3080 FE | RTX 2080 Super FE | RTX 2080 FE | |||||||
---|---|---|---|---|---|---|---|---|---|---|
Architecture | GA102 | TU104 | TU104 | |||||||
Process (nm) | Samsung 8N | TSMC 12FFN | TSMC 12FFN | |||||||
Transistors (Billion) | 28.3 | 13.6 | 13.6 | |||||||
Die size (mm^2) | 628.,4 GPCs |
SMs |
|
FP32 CUDA Cores | zehn die Kerne | B Kerne | VRAM Sp (Gbps) | Sep-20 | Jul-19 | Sep-18 |
Start Price | $699 | $699 | $799 |
Treffen GA102: Das Herz der Bestie
Wir haben einen separaten Artikel gehen tief in die Ampere-Architektur, die Befugnisse der GeForce RTX 3080 und andere Verwandte GPUs., Wenn Sie den vollständigen Überblick über alles haben möchten, was sich im Vergleich zur Turing-Architektur geändert hat, empfehlen wir, dort zu beginnen. Aber hier ist die Highlight-Rolle der wichtigsten Änderungen:
Der GA102 ist die erste GPU von Nvidia, die in Lithographie mit Samsungs 8N-Prozess in die einzelnen Ziffern fällt. Der allgemeine Konsens ist, dass der N7-Knoten von TSMC insgesamt „besser“ ist, aber auch mehr kostet und derzeit sehr gefragt ist — auch von Nvidias eigenem A100. Könnten die Consumer Ampere GPUs mit 7nm noch besser gewesen sein? Vielleicht., Aber sie könnten mehr gekostet haben, nur in begrenzten Mengen verfügbar gewesen sein, oder vielleicht wären sie noch ein paar Monate verzögert worden. Unabhängig davon ist GA102 immer noch ein großer und leistungsstarker Chip mit 28,3 Milliarden Transistoren, die in einer quadratischen Matrize von 628,4 mm verpackt sind. Wenn Sie sich fragen, sind das 52% mehr Transistoren als der TU102-Chip, der in RTX 2080 Ti verwendet wird, aber in einem 17% kleineren Bereich.
Ampere endet als geteilte Architektur, wobei der GA100 Rechenzentrumsambitionen annimmt, während der GA102 und andere Consumer-Chips signifikante Unterschiede aufweisen., Der GA100 konzentriert sich weit mehr auf die FP64-Leistung für wissenschaftliche Workloads als auch auf die Verdoppelung der Deep-Learning-Hardware. In der Zwischenzeit lässt der GA102 den größten Teil der FP64-Funktionalität fallen und enthält stattdessen Raytracing-Hardware sowie einige andere architektonische Verbesserungen. Werfen wir einen genaueren Blick auf die Ampere SM in der GA102 und GA104 gefunden.,
Nvidia GPUs bestehen aus mehreren GPCs (Graphics Processing Cluster), von denen jeder eine gewisse Anzahl von SMs (Streaming-Multiprozessoren). Nvidia teilt jede SM in vier Partitionen auf, die mit separaten Datensätzen arbeiten können. Mit Ampere verfügt jede SM-Partition jetzt über 16 FP32-CUDA-Kerne, 16 FP32/INT-CUDA-Kerne, einen Tensor-Kern der dritten Generation, Lade – /Speichereinheiten und eine spezielle Funktionseinheit., Der gesamte SM hat Zugriff auf gemeinsam genutzten L1-Cache und Speicher, und es gibt einen einzigen RT-Kern der zweiten Generation. Insgesamt bedeutet dies 64 FP32-Kerne und 64 FP32 / INT-Kerne, vier Turing-Kerne und einen RT-Kern. Lass uns das noch ein bisschen aufschlüsseln.
Die Turing-GPUs Unterstützung für die gleichzeitige FP32 (32-bit-floating-point) und “ INT “ (32-bit-integer-Operationen. FP32 ist in der Regel die wichtigste Arbeitslast für Grafiken und Spiele, aber es gibt immer noch eine anständige Menge an INT — Operationen-für Dinge wie Adressberechnungen, Textursuche und verschiedene andere Arten von Code., Mit Ampere wird der INT-Datenpfad aktualisiert, um INT oder FP32 zu unterstützen, jedoch nicht gleichzeitig.
Wenn Sie sich die Rohdaten ansehen, scheint Ampere ein weitaus größerer Leistungssprung zu sein als die 70%, die wir gemessen haben. 30 TFLOPS! Im Allgemeinen wird es jedoch nicht annähernd so hoch sein, da der zweite Datenpfad eine Entweder-oder-situation ist: Er kann nicht beide Arten von Anweisungen in der Pipeline im selben Zyklus ausführen. Nvidia sagt, dass rund 35% der Spielberechnungen INT-Operationen sind, was bedeutet, dass Sie auf dem RTX 3080 eher 20 TFLOPS von FP32 und 10 TOPS von INT haben werden.,
Während wir uns mit dem Thema befassen, weisen wir auch darauf hin, dass ein großer Teil der gesteigerten Leistung von erhöhten Leistungsgrenzen herrührt. RTX 2080 war ein 225W-Teil (für die Founders Edition), und RTX 3080 fügt im Grunde 100W hinzu. Das ist die Hälfte wieder mehr Leistung für 70% mehr Leistung. Es ist technisch gesehen ein Gewinn für die Gesamteffizienz, aber im Streben nach Leistung musste Nvidia in der Spannungs-und Frequenzkurve weiter nach rechts gehen., Nvidia sagt RTX 3080 kann eine 90% ige Verbesserung der Leistung pro Watt liefern, wenn Sie die Leistung sowohl auf dem 2080 als auch auf dem 3080 auf das gleiche Niveau begrenzen … aber komm schon, wer möchte die Leistung auf diese Weise einschränken? Nun, vielleicht Laptops, aber gehen wir nicht dorthin.
Eine Sache, die sich nicht viel geändert hat, sind die Videoanschlüsse. Okay, das stimmt nur teilweise., Erstens gibt es einen einzigen HDMI — Anschluss, aber es ist HDMI 2.1 anstelle von Turings HDMI 2.0 b, aber die drei DisplayPort-Anschlüsse bleiben 1.4 a. Und last but not least gibt es in dieser Runde keinen VirtualLink-Anschluss-anscheinend ist VirtualLink tot. REIßEN. Die verschiedenen Ports sind alle in der Lage 8K60 mit DSC (Display Stream Compression), eine „visuell verlustfreie“ Technik, die eigentlich nicht wirklich visuell verlustfrei ist. Aber vielleicht bemerken Sie es bei 8K nicht.
Um zu den Kernen zurückzukehren, arbeiten Nvidias Tensor-Kerne der dritten Generation in GA102 mit 8x4x4 FP16-Matrizen, also bis zu 128 Matrixoperationen pro Zyklus., (Turings Tensor-Kerne verwendeten 4x4x4-Matrizen, während der GA100 8x4x8-Matrizen verwendet.) Mit FMA (fused Multiply-Add) sind das 256 FP-Operationen pro Zyklus und Tensorkern. Multiplizieren Sie mit den 272 Gesamttensorkernen und der Taktrate, und das gibt Ihnen 119 TFLOPS von FP16 Compute. Die Tensorkerne von Ampere unterstützen jedoch auch eine feinkörnige Sparsität-im Grunde verschwendet sie keine Zeit mit Multiplikationen mit 0, da die Antwort immer 0 ist. Sparsity kann bis zu zweimal die FP16-Leistung in Anwendungen, die es verwenden können.,
Die RT-Kerne erhalten ähnliche Verbesserungen, mit bis zu verdoppeln der Ray/Triangle-Schnittpunkt Berechnungen pro Takt. Die RT-Kerne unterstützen auch eine Zeitvariable, die für die Berechnung von Dingen wie Bewegungsunschärfe nützlich ist. Alles in allem sagt Nvidia, dass die neuen RT-Kerne der 3080 1,7-mal schneller sind als die RTX 2080 und für Bewegungsunschärfe bis zu fünfmal so schnell sein können.
Es gibt auch viele andere Änderungen. Der L1-Cache/die gemeinsam genutzte Speicherkapazität und-bandbreite wurden erhöht, um die Kerne besser zu versorgen (8704KB vs. 4416KB), und der L2-Cache ist ebenfalls 25% größer als zuvor (5120KB vs., 4096 KB). Der L1-Cache kann je nach den Anforderungen der Anwendung auch als unterschiedliche Mengen an L1 vs. Shared Memory konfiguriert werden. Die Dateigröße ist auch fast 50% größer (17408KB vs. 11776KB) mit dem RTX 3080. GA102 kann auch gleichzeitige RT + Graphics + DLSS ausführen (zuvor wurden bei Verwendung der RT-Kerne die CUDA-Kerne gestoppt).
Schließlich wurden die Rasteroperatoren (ROPS) aus den Speichercontrollern in die GPCs verschoben. Jeder GPC verfügt über zwei ROP-Partitionen mit jeweils acht ROP-Einheiten., Dies bietet mehr flexibilität in der leistung, so dass, wo die GA102 hat bis zu 112 ROPS insgesamt, die RTX 3080 deaktiviert zwei speicher controller aber nur eine GPC und endet mit 96 ROPS. Dies ist jedoch kritischer für den RTX 3070 / GA104, der immer noch 96 ROPS hat, obwohl er nur acht Speichercontroller hat. Jeder GPC enthält auch sechs TPCs (Texture Processing Clusters) mit acht TMUs (Texture Mapping Units) und einer Polymorph Engine, obwohl Nvidia nur 34 TPCs für den 3080 ermöglicht.,
Mit den Kernverbesserungen aus dem Weg, lassen Sie uns auch schnell das Speichersubsystem diskutieren. GA102 unterstützt bis zu zwölf 32-Bit-Speicherkanäle, von denen zehn auf dem RTX 3080 aktiviert sind. Nvidia hat sich mit Micron zusammengetan, um seinen GDDR6X-Speicher zu verwenden, der PAM4-Signalisierung verwendet, um die Datenraten noch höher als zuvor zu steigern. Wo die RTX 20-Serie Karten bei 15 gekrönt.,5 Gbit / s im 2080 Super und 14 Gbit / s in den anderen RTX-Karten läuft GDDR6X im RTX 3080 mit 19 Gbit / s. In Kombination mit der 320-Bit – Schnittstelle ergibt dies eine Bandbreite von 760 Gbit / s-eine 70% ige Verbesserung gegenüber RTX 2080.
Der Speichercontroller des RTX 3080 wurde ebenfalls verbessert, mit einer neuen Funktion namens EDR: Error Detection and Replay. Wenn der Speicher eine fehlgeschlagene Übertragung erkennt, anstatt Daten abzustürzen oder zu beschädigen, versucht er es einfach erneut. Es wird dies tun, bis es erfolgreich ist, obwohl es immer noch möglich ist, einen Absturz mit Speicherübertaktung zu verursachen., Das Interessante daran ist, dass mit EDR höhere Speicheruhren erreichbar sein können, aber dennoch zu einer geringeren Leistung führen. Das liegt daran, dass der EDR die Speicherleistung verringert, wenn fehlgeschlagene Übertragungen auftreten. Wir werden mehr dazu im Overclocking-Bereich zu sagen haben.,
GeForce RTX 3080 Founders Edition: Design, Kühlung, Ästhetik
Nvidia hat das Design seiner Founders Edition-Karten für die RTX 30-Serie radikal verändert., Das neue Design enthält immer noch zwei Axiallüfter, aber Nvidia hat die Platine stark überarbeitet und verkürzt, so dass die „Rückseite“ der Karte (weg von den Videoanschlüssen) nur aus einem Lüfter, Heatpipes, Kühlerflossen und dem üblichen Grafikkartengehäuse besteht. Laut Nvidia verbessert das neue Design die Kühleffizienz erheblich und senkt gleichzeitig den Geräuschpegel. Wir werden später die Früchte des Designs sehen.
Ästhetik ist sehr subjektiv, und wir haben viele Leute wie das neue Design gehört, während andere denken, es sieht langweilig., Es gibt kein RGB-Bling, wenn das dein Ding ist, und die einzige Beleuchtung besteht aus einem weißen GeForce RTX-Logo auf der Oberseite der Karte mit subtiler Beleuchtung um das ‚X‘ auf beiden Seiten der Karte (aber nur die Hälfte des ‚X‘ leuchtet auf der Seite mit dem „RTX 3080“ – Logo).
Persönlich denke ich, dass die neue Karte sehr gut aussieht und sich sehr solide in der Hand anfühlt. Es ist eigentlich etwa 100g schwerer als das vorherige RTX 2080-Design, und soweit mir bekannt ist, ist es die schwerste Single-GPU-Karte, die Nvidia jemals erstellt hat., Es ist auch etwa 2 cm länger als die Karten der vorherigen Generation und verwendet die typische Zwei-Slot-Breite. (Die GeForce RTX 3090 ist ungefähr bereit, den 3080 FE mit seinem massiven Drei-Slot-Kühler mickrig aussehen zu lassen.)
Nvidia lieferte die obigen Bilder des Teardown der RTX 3080 Founders Edition. Wir sind noch nicht bereit, die Demontage unserer Karte zu versuchen-und ehrlich gesagt, wir haben keine Zeit mehr—, aber wir können bald zum Thema zurückkehren. Uns wird gesagt, dass es in dieser Runde etwas schwieriger ist, die Karte auseinander zu bekommen, hauptsächlich weil Nvidia die Schrauben hinter winzigen Abdeckungen versteckt hat.,
Die Hauptplatine sieht weitaus dichter besiedelt aus als frühere GPUs, wobei die 10 GDDR6X-Speicherchips die GPU in der Mitte umgeben. Sie können auch den abgewinkelten 12-poligen Stromanschluss und den funky aussehenden Ausschnitt am Ende der Leiterplatte sehen. Die Leistungsabgabe ist bei einem 320W TGP offensichtlich wichtig, und Sie können alle Festelektrolytkondensatoren links und rechts von den Speicherchips sehen.,Interessant ist auch die Speicheranordnung mit vier Chips auf der linken und rechten Seite der GPU, bis zu drei Chips über der GPU (zwei Montagepositionen sind für den RTX 3080 leer) und einem endgültigen einzelnen Chip unter der GPU. Auch hier hat Nvidia eindeutig viel Mühe aufgewendet, um die Größe der Platine und anderer Komponenten zu reduzieren, um das neue und verbesserte Kühldesign aufzunehmen. Spoiler: Es funktioniert sehr gut.
Interessant ist, dass sich der „vordere“ Lüfter (in der Nähe der Videoanschlüsse) in die übliche Richtung dreht — gegen den Uhrzeigersinn., Der „hintere“ Lüfter, der normalerweise nach oben zeigt, wenn Sie die Karte in einem ATX-Gehäuse installieren, dreht sich im Uhrzeigersinn. Wenn Sie sich die Flossen ansehen, bedeutet dies, dass sich der hintere Lüfter in die entgegengesetzte Richtung dreht, wie wir es normalerweise erwarten. Der Grund dafür ist, dass Nvidia diese Anordnung gefunden zieht Luft durch den Kühler besser und erzeugt weniger Lärm. Beachten Sie auch, dass der hintere Lüfter etwas dicker ist und der integrierte Ring den statischen Druck auf beide Lüfter erhöht und gleichzeitig die Drehzahl niedrig hält.
Wenn Sie das Aussehen der Founders Edition nicht mögen, seien Sie versichert, dass es viele andere Optionen geben wird., Wir haben ein paar RTX 3080-Karten von Drittanbietern zum Testen, die natürlich RGB-Beleuchtung enthalten. Keine der Karten von Drittanbietern verwendet den 12-poligen Stromanschluss — nicht, dass es wirklich darauf ankommt, da der erforderliche Adapter mit der Karte geliefert wird. Dennoch sieht dieser vertikal montierte 12-Pin-Port etwas weniger robust aus, wenn Sie regelmäßig GPUs austauschen. Ich plane, den Adapter dauerhaft angeschlossen zu lassen und einfach die normalen 8-poligen PEG-Kabel anzuschließen oder zu trennen., Der 12-polige Stecker scheint für 25 „Zyklen“ ausgelegt zu sein, und ich habe bereits die Hälfte davon durchgebrannt (nicht, dass ich erwarte, dass er bald ausfällt).