La GeForce RTX 3080 Founders Edition de Nvidia est ici, revendiquant la première place de notre hiérarchie de benchmarks GPU, et se classant comme la meilleure carte graphique actuellement disponible — à condition que vous recherchiez la performance en premier, le prix et la puissance étant des préoccupations moindres. Après des mois d’attente, nous disposons enfin de benchmarks et de données de test indépendants., Nvidia a jeté le gant, défiant clairement le Grand Navi d’AMD pour essayer d’égaler ou de battre ce que l’architecture Ampere apporte à la table.
Nous allons attendre un verdict final pour l’instant, car nous avons d’autres cartes RTX 3080 tierces à examiner, qui commenceront dès demain. C’est une bonne nouvelle, car cela signifie que les clients ne seront pas limités à l’édition Founders de Nvidia pour le premier mois environ, comme nous l’étions avec le lancement de la série RTX 20., Une autre bonne nouvelle est qu’il n’y a pas de « taxe » Founders Edition cette fois: le RTX 3080 FE coûte 699 direct, directement de Nvidia, et c’est le prix de base des cartes RTX 3080 pour le moment. La mauvaise nouvelle est que nous nous attendons à ce que l’offre soit insuffisante pour faire face à une demande exceptionnellement élevée.
L’essentiel, si les spoilers ne vous dérangent pas, est que le RTX 3080 FE est 33% plus rapide que le RTX 2080 Ti, en moyenne., Ou, si vous préférez d’autres points de comparaison, c’est 57% plus rapide que le RTX 2080 Super, 69% plus rapide que le RTX 2080 FE — heck, c’est même 26% plus rapide que le Titan RTX!
Mais il y a un hic: Nous avons mesuré tous ces résultats « pour cent plus rapides » dans notre suite de tests fonctionnant avec des paramètres 4K ultra. Le plomb se rétrécit si vous descendez à 1440p, et il diminue encore plus à 1080p. Il est encore 42% plus rapide qu’un 2080 FE à 1080p ultra, mais c’est beaucoup une carte faite pour des résolutions plus élevées., En outre, vous pourriez avoir besoin d’un processeur plus rapide pour profiter pleinement de l’expérience 3080 — consultez notre article compagnon sur la mise à l’échelle du processeur GeForce RTX 3080 pour plus de détails.,
Graphics Card | RTX 3080 FE | RTX 2080 Super FE | RTX 2080 FE | |||||||
---|---|---|---|---|---|---|---|---|---|---|
Architecture | GA102 | TU104 | TU104 | |||||||
Process (nm) | Samsung 8N | TSMC 12FFN | TSMC 12FFN | |||||||
Transistors (Billion) | 28.3 | 13.6 | 13.6 | |||||||
Die size (mm^2) | 628.,4 l’adresse gpcs |
SMs |
FP32 CUDA Cores |
dix les Cœurs |
B Cœurs |
VRAM Sp (Gbit / s) |
Sep-20 |
Juil-19 |
Sep-18 |
|
Prix de Lancement | $699 | $699 | $799 |
la rencontre GA102: Le Cœur de la Bête
Nous avons un article distinct d’aller en profondeur dans l’Ampère architecture que les pouvoirs de l’GeForce RTX 3080 et d’autres Gpu., Si vous voulez un aperçu complet de tout ce qui a changé par rapport à l’architecture de Turing, nous vous recommandons de commencer par là. Mais voici la bobine de surbrillance des changements les plus importants:
Le GA102 est le premier GPU de Nvidia à tomber dans les chiffres simples sur la lithographie, en utilisant le processus 8N de Samsung. Le consensus général est que le nœud N7 de TSMC est « meilleur » dans l’ensemble, mais il coûte également plus cher et est actuellement très demandé — y compris par le propre A100 de Nvidia. Les GPU Ampères grand public auraient-ils pu être encore meilleurs avec 7 nm? Peut-être., Mais ils peuvent coûter plus cher, été disponibles qu’en quantités limitées, ou peut-être qu’ils auraient été retardée de quelques mois de plus. Quoi qu’il en soit, GA102 est toujours une puce grande et puissante, avec 28,3 milliards de transistors emballés dans une matrice carrée de 628,4 mm. Si vous vous demandez, c’est 52% plus de transistors que la puce TU102 utilisée dans RTX 2080 Ti, mais dans une zone 17% plus petite.
Ampere se retrouve comme une architecture divisée, le GA100 assumant les ambitions du centre de données, tandis que le GA102 et d’autres puces grand public présentent des différences significatives., Le GA100 se concentre beaucoup plus sur les performances du FP64 pour les charges de travail scientifiques, ainsi que sur le matériel d’apprentissage en profondeur. Pendant ce temps, le GA102 supprime la plupart des fonctionnalités FP64 et inclut à la place du matériel de ray tracing, ainsi que d’autres améliorations architecturales. Regardons de plus près l’Ampère SM trouvé dans les GA102 et GA104.,
Nvidia Gpu composé de plusieurs adresse gpcs de Traitement Graphique (Clusters), dont chacun dispose d’un certain nombre de SMs (Streaming Multiprocesseurs). Nvidia divise chaque SM en quatre partitions qui peuvent fonctionner sur des ensembles de données distincts. Avec Ampere, chaque partition SM dispose désormais de 16 cœurs CUDA FP32, 16 cœurs CUDA FP32/INT, un cœur tenseur de troisième génération, des unités de charge/stockage et une unité de fonction spéciale., L’ensemble du SM a accès au cache et à la mémoire L1 partagés, et il n’y a qu’un seul cœur RT de deuxième génération. Au total, cela signifie 64 cœurs FP32 et 64 cœurs FP32/INT, quatre cœurs Turing et un cœur RT. Nous allons briser un peu plus.
Les GPU Turing ont ajouté la prise en charge des opérations simultanées FP32 (virgule flottante 32 bits) et INT (entier 32 bits). FP32 a tendance à être la charge de travail la plus importante pour les graphiques et les jeux, mais il y a encore une quantité décente d’opérations INT — pour des choses comme les calculs d’adresse, les recherches de texture et divers autres types de code., Avec Ampere, le chemin de données INT est mis à niveau pour prendre en charge INT ou FP32, mais pas en même temps.
Si vous regardez les spécifications brutes, Ampere semble être un saut de performance beaucoup plus important que les 70% que nous avons mesurés. 30 TFLOPS! Mais il ne sera généralement pas aussi élevé car le deuxième datapath est une situation soit/ou: Il ne peut pas faire les deux types d’instructions sur le pipeline dans le même cycle. Nvidia dit qu’environ 35% des calculs de jeu sont des opérations INT, ce qui signifie que vous vous retrouverez avec quelque chose de plus comme 20 TFLOPS de FP32 et 10 TOPS de INT sur le RTX 3080.,
Pendant que nous sommes sur le sujet, soulignons également qu’une grande partie de l’augmentation des performances provient de l’augmentation des limites de puissance. RTX 2080 était une partie de 225W (pour l’édition Founders), et RTX 3080 ajoute essentiellement 100W à cela. C’est encore la moitié plus de puissance pour 70% de performances en plus. C’est techniquement une victoire en efficacité globale, mais dans la poursuite de la performance, Nvidia a dû se déplacer plus à droite sur la courbe de tension et de fréquence., Nvidia dit que RTX 3080 peut offrir une amélioration de 90% des performances par watt si vous limitez les performances au même niveau sur les 2080 et 3080?mais allez, qui veut limiter les performances de cette façon? Eh bien, peut-être des ordinateurs portables, mais n’y allons pas.
Une chose qui n’a pas beaucoup changé est les ports vidéo. Bon d’accord, c’est que partiellement vrai., Tout d’abord, il y a un seul port HDMI, mais c’est HDMI 2.1 au lieu de HDMI 2.0 b de Turing, mais les trois connexions DisplayPort restent 1.4 a. Et last but not least, il n’y a pas de port VirtualLink ce tour — apparemment, VirtualLink est mort. RIP. Les différents ports sont tous capables de 8K60 en utilisant DSC (Display Stream Compression), une technique » sans perte visuelle » qui n’est en fait pas vraiment sans perte visuelle. Mais vous ne remarquerez peut-être pas à 8K.
Pour revenir aux cœurs, les cœurs tensoriels de troisième génération de Nvidia dans GA102 fonctionnent sur des matrices FP16 8x4x4, donc jusqu’à 128 opérations matricielles par cycle., (Les cœurs tenseurs de Turing utilisaient des matrices 4x4x4, tandis que le GA100 utilisait des matrices 8x4x8.) Avec FMA (fused multiply-add), c’est 256 opérations FP par cycle, par cœur de tenseur. Multipliez par les 272 cœurs tensoriels totaux et la vitesse d’horloge, et cela vous donne 119 TFLOPS de calcul FP16. Cependant, les cœurs tensoriels d’Ampere ajoutent également la prise en charge de la parcimonie fine-fondamentalement, cela évite de perdre du temps à faire des multiplications par 0, puisque la réponse est toujours 0. Sparsity peut fournir jusqu’à deux fois les performances FP16 dans les applications qui peuvent l’utiliser.,
Les cœurs RT reçoivent des améliorations similaires, avec jusqu’à doubler les calculs d’intersection rayon/triangle par horloge. Les cœurs RT prennent également en charge une variable de temps, ce qui est utile pour calculer des choses comme le flou de mouvement. Au total, Nvidia affirme que les nouveaux cœurs RT du 3080 sont 1, 7 fois plus rapides que ceux du RTX 2080, et qu’ils peuvent être jusqu’à cinq fois plus rapides pour le flou de mouvement.
Il ya beaucoup d’autres changements. La capacité et la bande passante du cache L1/mémoire partagée ont été augmentées pour mieux alimenter les cœurs (8704KB contre 4416KB), et le cache L2 est également 25% plus grand qu’auparavant (5120KB contre, 4 096 KO). Le cache L1 peut également être configuré en quantités variables de mémoire L1 par rapport à la mémoire partagée, en fonction des besoins de l’application. La taille du fichier de registre est également près de 50% plus grande (17408 Ko par rapport à 11776 Ko) avec le RTX 3080. GA102 peut également faire RT + graphics + DLSS simultanés (auparavant, l’utilisation des cœurs RT arrêtait les cœurs CUDA).
Enfin, les opérateurs raster (ROPS) ont été déplacés hors des contrôleurs de mémoire et dans les GPC. Chaque GPC a deux partitions ROP de huit unités ROP chacune., Ainsi, lorsque le GA102 a jusqu’à 112 ROPS au total, le RTX 3080 désactive deux contrôleurs de mémoire mais un seul GPC et se retrouve avec 96 ROPS. Ceci est plus critique pour le RTX 3070 / GA104, cependant, qui a encore 96 ROPS même s’il n’a que huit contrôleurs de mémoire. Chaque GPC comprend également six TPC (Grappes de traitement de texture) avec huit TMU (Unités de mappage de texture) et un moteur polymorph, bien que Nvidia n’active que 34 TPC pour le 3080.,
Avec les améliorations fondamentales de la route, nous allons également discuter rapidement le sous-système mémoire. GA102 prend en charge jusqu’à douze canaux de mémoire 32 bits, dont dix sont activés sur le RTX 3080. Nvidia s’est associé à Micron pour utiliser sa mémoire GDDR6X, qui utilise la signalisation PAM4 pour augmenter les débits de données encore plus élevés qu’auparavant. Où les cartes de la série RTX 20 ont dépassé à 15.,5 Gbps dans le 2080 Super et 14 Gbps dans les autres cartes RTX, GDDR6X fonctionne à 19 Gbps dans le RTX 3080. Combiné avec l’interface 320 bits, cela donne 760 GBps de bande passante – une amélioration de 70% par rapport à RTX 2080.
Le contrôleur de mémoire du RTX 3080 a également été amélioré, avec une nouvelle fonctionnalité appelée EDR: Détection et relecture des erreurs. Lorsque la mémoire détecte un échec de transmission, plutôt que de planter ou de corrompre des données, elle essaie simplement à nouveau. Il le fera jusqu’à ce qu’il réussisse, bien qu’il soit toujours possible de provoquer un plantage avec l’overclocking de mémoire., Le bit intéressant est qu’avec EDR, des horloges de mémoire plus élevées peuvent être réalisables, mais entraînent toujours des performances inférieures. En effet, l’EDR finit par réduire les performances de la mémoire en cas d’échec des transmissions. Nous aurons plus à dire à ce sujet dans la section overclocking.,
GeForce RTX 3080 Fondateurs de l’Édition: de la Conception, de Refroidissement, de l’Esthétique
Nvidia a radicalement modifié la conception de ses Fondateurs cartes d’Édition pour le RTX 30 de la série., Le nouveau design comprend toujours deux ventilateurs axiaux, mais Nvidia a fortement redessiné le PCB et l’a raccourci de sorte que le » dos » de la carte (loin des ports vidéo) ne se compose que d’un ventilateur, de caloducs, d’ailettes de radiateur et du linceul de carte graphique habituel. Nvidia affirme que la nouvelle conception offre des améliorations substantielles de l’efficacité du refroidissement, tout en réduisant les niveaux de bruit. Nous verrons les fruits de la conception plus tard.
L’esthétique est très subjective, et nous avons entendu beaucoup de gens comme le nouveau design, tandis que d’autres pensent qu’il semble ennuyeux., Il n’y a pas de bling RVB si c’est votre truc, et le seul éclairage consiste en un logo GeForce RTX blanc sur le dessus de la carte avec un éclairage subtil autour du « X » des deux côtés de la carte (mais seulement la moitié du » X « est éclairée sur le côté avec le logo « RTX 3080 »).
Personnellement, je pense que la nouvelle carte est très belle et qu’elle est très solide dans la main. C’est en fait environ 100g plus lourd que le précédent design RTX 2080, et pour autant que je sache, c’est la carte à gpu unique la plus lourde que Nvidia ait jamais créée., Il est également environ 2 cm plus long que les cartes de la génération précédente et utilise la largeur typique à deux emplacements. (La GeForce RTX 3090 est sur le point de rendre le FE 3080 chétif, cependant, avec son énorme refroidisseur à trois fentes.)
Nvidia a fourni les images ci-dessus du démontage de la RTX 3080 Founders Edition. Nous ne sommes pas encore prêts à tenter le démontage de notre carte — et franchement, nous n’avons plus le temps — mais nous pourrions revenir sur le sujet bientôt. On nous dit que séparer la carte est un peu plus délicat ce tour, principalement parce que Nvidia a caché les vis derrière de minuscules couvercles.,
La carte principale semble beaucoup plus densément peuplée que les GPU précédents, avec les puces mémoire 10 GDDR6X entourant le GPU au centre. Vous pouvez également voir le connecteur d’alimentation à 12 broches incliné et la découpe géniale à l’extrémité du circuit imprimé. La livraison de puissance est évidemment importante avec un TGP 320W, et vous pouvez voir tous les condensateurs électrolytiques solides placés à gauche et à droite des puces de mémoire.,
La disposition de la mémoire est également intéressante, avec quatre puces sur les côtés gauche et droit du GPU, jusqu’à trois puces au-dessus du GPU (deux positions de montage sont vides pour le RTX 3080), et une seule puce finale sous le GPU. Encore une fois, Nvidia a clairement dépensé beaucoup d’efforts pour réduire la taille de la carte et d’autres composants pour s’adapter à la nouvelle conception de refroidissement améliorée. Spoiler: Cela fonctionne très bien.
Une chose intéressante est que le ventilateur « avant » (près des ports vidéo) tourne dans le sens habituel — dans le sens antihoraire., Le ventilateur « arrière », qui sera généralement orienté vers le haut lorsque vous installez la carte dans un boîtier ATX, tourne dans le sens des aiguilles d’une montre. Si vous regardez les ailettes, cela signifie que le ventilateur arrière tourne dans la direction opposée à ce que nous attendons normalement. La raison en est que Nvidia a trouvé que cet arrangement tire mieux l’air à travers le radiateur et génère moins de bruit. Notez également que le ventilateur arrière est légèrement plus épais et que l’anneau intégré aide à augmenter la pression statique sur les deux ventilateurs tout en maintenant les régimes bas.
Si vous n’aimez pas le look de l’édition Founders, soyez assuré qu’il y aura beaucoup d’autres options., Nous avons quelques cartes RTX 3080 tierces pour les tests, qui incluent toutes naturellement un éclairage RVB. Aucune des cartes tierces n’utilise le connecteur d’alimentation à 12 broches, non plus — ce n’est pas vraiment important, car l’adaptateur requis est livré avec la carte. Pourtant, ce port 12 broches monté verticalement semble un peu moins robuste si vous échangez régulièrement des GPU. Je prévois de laisser l’adaptateur connecté en permanence et de simplement connecter ou déconnecter les câbles de cheville 8 broches normaux., Le connecteur 12 broches semble être évalué pour 25 « cycles », et j’ai déjà brûlé la moitié de ceux-ci (pas que je m’attends à ce qu’il échoue de sitôt).