Nvidia GeForce RTX 3080 Founders Edition está aquí, reclamando el primer lugar en nuestra jerarquía de puntos de referencia de GPU y clasificándose como la mejor tarjeta gráfica disponible actualmente, siempre que primero busque el rendimiento, con el precio y la potencia como preocupaciones menores. Después de meses de espera, finalmente tenemos puntos de referencia independientes y datos de pruebas., Nvidia ha lanzado el guante, desafiando claramente a big Navi de AMD Para intentar igualar o vencer lo que la arquitectura Ampere trae a la mesa.
vamos a esperar un veredicto final por ahora, ya que tenemos otras tarjetas RTX 3080 de terceros para revisar, que comenzarán tan pronto como mañana. Eso es una buena noticia, ya que significa que los clientes no se limitarán a la edición Founders de Nvidia durante el primer mes más o menos como lo hicimos con el lanzamiento de la serie RTX 20., Otra buena noticia es que esta vez no hay ‘impuesto’ Founders Edition: la RTX 3080 FE cuesta 6 699, directamente de Nvidia, y ese es el precio base de las tarjetas RTX 3080 por el momento. La mala noticia es que esperamos que la oferta sea insuficiente para mantenerse al día con lo que esperamos que sea una demanda excepcionalmente alta.
la conclusión, si no le importan los spoilers, es que el RTX 3080 FE es un 33% más rápido que el RTX 2080 Ti, en promedio., O, si prefieres otros puntos de comparación, es un 57% más rápido que el RTX 2080 Super, un 69% más rápido que el RTX 2080 FE – ¡diablos, es incluso un 26% más rápido que el Titan RTX!
pero hay un problema: medimos todos esos resultados «por ciento más rápidos» en nuestro conjunto de pruebas que se ejecutan en configuraciones 4K ultra. La ventaja se estrecha si se baja a 1440p, y disminuye aún más a 1080p. todavía es un 42% más rápido que una 2080 FE a 1080p ultra, pero esta es en gran medida una tarjeta hecha para resoluciones más altas., Además, es posible que necesite una CPU más rápida para obtener la experiencia completa de 3080: consulte nuestro Artículo complementario GeForce RTX 3080 CPU Scaling para obtener todos los detalles.,
Graphics Card | RTX 3080 FE | RTX 2080 Super FE | RTX 2080 FE | |||||||
---|---|---|---|---|---|---|---|---|---|---|
Architecture | GA102 | TU104 | TU104 | |||||||
Process (nm) | Samsung 8N | TSMC 12FFN | TSMC 12FFN | |||||||
Transistors (Billion) | 28.3 | 13.6 | 13.6 | |||||||
Die size (mm^2) | 628.,4 Cpm |
SMs |
FP32 Núcleos CUDA |
diez de los Núcleos |
B Núcleos |
VRAM Sp (Gbps) |
Sep-20 |
Jul-19 |
Sep-18 |
|
Precio de Lanzamiento | $699 | $699 | $799 |
Cumplir GA102: El Corazón de la Bestia
Tenemos un artículo separado adentrarse en los Amperios de la arquitectura que los poderes de la GeForce RTX 3080 y otros relacionados con la Gpu., Si desea el resumen completo de todo lo que ha cambiado en comparación con la arquitectura de Turing, le recomendamos comenzar allí. Pero aquí está el carrete más destacado de los cambios más importantes:
la GA102 es la primera GPU de Nvidia en caer en un solo dígito en litografía, utilizando el proceso 8n de Samsung. El consenso general es que el nodo N7 de TSMC es «mejor» en general, pero también cuesta más y actualmente tiene una demanda muy alta, incluida la del propio A100 de Nvidia. ¿Podrían las GPU de amperio de consumo haber sido aún mejores con 7nm? Posiblemente., Pero podrían haber costado más, solo estaban disponibles en cantidades limitadas, o tal vez se habrían retrasado unos meses más. En cualquier caso, GA102 sigue siendo un chip grande y potente, con 28,3 mil millones de transistores empaquetados en una matriz cuadrada de 628,4 mm. Si se está preguntando, eso es 52% más transistores que el chip TU102 utilizado en RTX 2080 Ti, pero en un área 17% más pequeña.
Ampere termina como una arquitectura dividida, con el GA100 asumiendo las ambiciones del centro de datos, mientras que el GA102 y otros chips de consumo tienen diferencias significativas., El GA100 se centra mucho más en el rendimiento FP64 para cargas de trabajo científicas, así como en duplicar el hardware de aprendizaje profundo. Mientras tanto, el GA102 elimina la mayor parte de la funcionalidad FP64 e incluye hardware de trazado de rayos, además de algunas otras mejoras arquitectónicas. Echemos un vistazo más de cerca al amperio SM que se encuentra en el GA102 y GA104.,
Las GPU NVIDIA consisten en varios gpcs (clústeres de procesamiento de gráficos), cada uno de los cuales tiene algún número de SMS (multiprocesadores de transmisión). Nvidia divide cada SM en cuatro particiones que pueden funcionar en conjuntos de datos separados. Con Ampere, cada partición SM ahora tiene 16 núcleos CUDA FP32, 16 núcleos CUDA FP32 / INT, un núcleo Tensor de tercera generación, unidades de carga/almacenamiento y una unidad de función especial., Todo el SM tiene acceso a caché y memoria L1 compartida, y hay un único núcleo RT de segunda generación. En total, eso significa 64 núcleos FP32 y 64 núcleos FP32 / INT, cuatro núcleos Turing y un núcleo RT. Vamos a explicarlo un poco más.
Las GPU de Turing agregaron soporte para operaciones simultáneas FP32 (coma flotante de 32 bits) e INT (entero de 32 bits). FP32 tiende a ser la carga de trabajo más importante para gráficos y juegos, pero todavía hay una cantidad decente de operaciones INT — para cosas como cálculos de direcciones, búsquedas de texturas, y varios otros tipos de código., Con Ampere, la ruta de datos INT se actualiza para admitir INT o FP32, pero no al mismo tiempo.
si nos fijamos en las especificaciones raw, Ampere parece ser un salto mucho mayor en el rendimiento que el 70% que medimos. ¡30 TFLOPS! Pero generalmente no se acercará a esa altura porque la segunda ruta de datos es una situación cualquiera/o: no puede hacer ambos tipos de instrucciones en la tubería en el mismo ciclo. Nvidia dice que alrededor del 35% de los cálculos de juegos son operaciones INT, lo que significa que terminarás con algo más como 20 TFLOPS de FP32 y 10 TOPS de INT en el RTX 3080.,
ya que estamos en el tema, también señalemos que una gran parte del aumento del rendimiento proviene del aumento de los límites de potencia. RTX 2080 era una parte de 225W (para la edición Founders), y RTX 3080 básicamente agrega 100W a eso. Eso es la mitad de potencia para un 70% más de rendimiento. Técnicamente es una victoria en eficiencia general, pero en la búsqueda del rendimiento, Nvidia tuvo que moverse más a la derecha en la curva de voltaje y frecuencia., Nvidia dice que RTX 3080 puede ofrecer una mejora del 90% en el rendimiento por vatio si limita el rendimiento al mismo nivel tanto en el 2080 como en el 3080?pero vamos, ¿quién quiere limitar el rendimiento de esa manera? Bueno, tal vez laptops, pero no vayamos allí.
Una cosa que no ha cambiado mucho es el video de los puertos. Vale, eso es solo parcialmente cierto., En primer lugar, hay un solo puerto HDMI, pero es HDMI 2.1 en lugar de HDMI 2.0 b de Turing, pero las tres conexiones DisplayPort siguen siendo 1.4 a. y por último, pero no menos importante, no hay Puerto VirtualLink esta ronda — aparentemente, VirtualLink está muerto. RASGAR. Los diversos puertos son todos capaces de 8K60 usando DSC (compresión de flujo de pantalla), una técnica «sin pérdida visual» que en realidad no es realmente sin pérdida visual. Pero es posible que no te des cuenta en 8K.
volviendo a los núcleos, Los núcleos de tensor de tercera generación de Nvidia en GA102 funcionan en matrices FP16 de 8x4x4, por lo que hasta 128 operaciones de matriz por ciclo., (Los núcleos de Tensor de Turing utilizan matrices 4x4x4, mientras que el GA100 utiliza matrices 8x4x8.) Con FMA (multiplicación-suma fusionada), eso es 256 operaciones FP por ciclo, por núcleo tensor. Multiplique por los 272 núcleos tensores totales y la velocidad del reloj, y eso le da 119 TFLOPS de cálculo FP16. Sin embargo, los núcleos tensores de Ampere también agregan soporte para sparsity de grano fino, básicamente, elimina la pérdida de tiempo haciendo multiplicaciones por 0, ya que la respuesta siempre es 0. Sparsity puede proporcionar hasta el doble de rendimiento del FP16 en aplicaciones que pueden usarlo.,
los núcleos RT reciben mejoras similares, con hasta el doble de los cálculos de intersección de rayos/triángulos por reloj. Los núcleos RT también admiten una variable de tiempo, que es útil para calcular cosas como el desenfoque de movimiento. En total, Nvidia dice que los nuevos núcleos RT del 3080 son 1.7 veces más rápidos que los RTX 2080, y pueden ser hasta cinco veces más rápidos para el desenfoque de movimiento.
también hay muchos otros cambios. La caché L1/capacidad de memoria compartida y el ancho de banda se han aumentado para alimentar mejor los núcleos (8704KB vs. 4416KB), y la caché L2 también es un 25% más grande que antes (5120KB vs., 4096KB). La caché L1 también se puede configurar como cantidades variables de memoria L1 vs.compartida, dependiendo de las necesidades de la aplicación. El tamaño del archivo de registro también es casi un 50% más grande (17408 KB vs.11776 KB) con el RTX 3080. GA102 también puede hacer RT + gráficos simultáneos + DLSS (anteriormente, el uso de los núcleos RT detendría los núcleos CUDA).
finalmente, los operadores ráster (ROPS) se han movido fuera de los controladores de memoria y en los GPCs. Cada GPC tiene dos particiones ROP de ocho unidades ROP cada una., Esto proporciona más flexibilidad en el rendimiento, por lo que donde el GA102 tiene hasta 112 ROPS en total, el RTX 3080 desactiva dos controladores de memoria, pero solo un GPC y termina con 96 ROPS. Esto es más crítico para el RTX 3070 / GA104, sin embargo, que todavía tiene 96 ROPS a pesar de que solo tiene ocho controladores de memoria. Cada GPC también incluye seis TPCs (Clusters de procesamiento de texturas) con ocho TMUs (unidades de mapeo de texturas) y un motor polimorfo, aunque Nvidia solo habilita 34 TPCs para el 3080.,
Con las principales mejoras de la forma, también vamos a examinar el subsistema de memoria. GA102 admite hasta doce canales de memoria de 32 bits, de los cuales diez están habilitados en el RTX 3080. Nvidia se asoció con Micron para usar su memoria GDDR6X, que utiliza la señalización PAM4 para aumentar las tasas de datos aún más altas que antes. Donde las tarjetas RTX de la serie 20 remataron en 15.,5 Gbps en la 2080 Super y 14 Gbps en las otras tarjetas RTX, GDDR6X funciona a 19 Gbps en la RTX 3080. Combinado con la interfaz de 320 bits, que produce 760 GBps de ancho de banda-una mejora del 70% sobre RTX 2080.
el controlador de memoria del RTX 3080 también se ha mejorado, con una nueva función llamada EDR: detección de errores y repetición. Cuando la memoria detecta una transmisión fallida, en lugar de bloquearse o corromper datos, simplemente lo intenta de nuevo. Hará esto hasta que tenga éxito, aunque todavía es posible causar un bloqueo con overclocking de memoria., Lo interesante es que con EDR, los relojes de memoria más altos podrían ser alcanzables, pero aún así resultan en un menor rendimiento. Esto se debe a que el EDR termina reduciendo el rendimiento de la memoria cuando se producen transmisiones fallidas. Tendremos más que decir sobre esto en la sección overclocking.,
GeForce RTX 3080 Founders Edition: diseño, refrigeración, estética
Nvidia ha alterado radicalmente el diseño de sus tarjetas Founders Edition para la serie RTX 30., El nuevo diseño aún incluye dos ventiladores axiales, pero Nvidia rediseñó en gran medida la PCB y la acortó de modo que la parte posterior de la tarjeta (lejos de los puertos de video) consiste en solo un ventilador, tubos de calor, aletas del radiador y la cubierta habitual de la tarjeta gráfica. Nvidia dice que el nuevo diseño ofrece mejoras sustanciales en la eficiencia de enfriamiento, mientras que al mismo tiempo reduce los niveles de ruido. Veremos los frutos del diseño más tarde.
La estética es altamente subjetiva, y hemos escuchado que a muchas personas les gusta el nuevo diseño, mientras que otros piensan que se ve aburrido., No hay bling RGB si eso es lo tuyo, y la única iluminación consiste en un logotipo blanco GeForce RTX en la parte superior de la tarjeta con iluminación sutil alrededor de la ‘X’ en ambos lados de la tarjeta (pero solo la mitad de la ‘X’ se ilumina en el lado con el logotipo «RTX 3080»).
personalmente, creo que la nueva carta se ve bastante bien, y se siente muy sólida en la mano. En realidad, es aproximadamente 100g más pesado que el anterior diseño RTX 2080, y por lo que sé, es la tarjeta de una sola GPU más pesada que Nvidia haya creado., También es unos 2 cm más largo que las tarjetas de la generación anterior y utiliza el ancho típico de dos ranuras. (Sin embargo, la GeForce RTX 3090 está a punto de hacer que la 3080 FE parezca insignificante, con su enorme refrigerador de tres ranuras.)
Nvidia proporcionó las imágenes anteriores del desmontaje del RTX 3080 Founders Edition. Aún no estamos listos para intentar desmontar nuestra tarjeta, y francamente, se nos acaba el tiempo, pero es posible que volvamos al tema pronto. Nos dicen que separar la tarjeta es un poco más complicado esta ronda, sobre todo porque Nvidia ha escondido los tornillos detrás de pequeñas cubiertas.,
la placa principal se ve mucho más densamente poblada que las GPU anteriores, con los 10 chips de memoria GDDR6X rodeando la GPU en el centro. También puede ver el conector de alimentación de 12 pines en ángulo y el recorte de aspecto funky al final de la PCB. La entrega de potencia es obviamente importante con un TGP de 320W, y puede ver todos los condensadores electrolíticos sólidos colocados a la izquierda y a la derecha de los chips de memoria.,
la disposición de la memoria también es interesante, con cuatro chips en los lados izquierdo y derecho de la GPU, hasta tres chips por encima de la GPU (dos posiciones de montaje están vacías para el RTX 3080), y un único chip final por debajo de la GPU. Una vez más, Nvidia claramente gastó mucho esfuerzo para reducir el tamaño de la placa y otros componentes para adaptarse al nuevo y mejorado diseño de refrigeración. Spoiler: funciona muy bien.
una cosa interesante es que el ventilador ‘frontal’ (cerca de los puertos de video) gira en la dirección habitual, en sentido antihorario., El ventilador’ back’, que normalmente estará hacia arriba cuando instales la tarjeta en una caja ATX, gira en el sentido de las agujas del reloj. Si nos fijamos en las aletas, eso significa que el ventilador trasero gira en dirección opuesta a lo que normalmente esperamos. La razón es que Nvidia encontró esta disposición tira de aire a través del radiador mejor y genera menos ruido. También tenga en cuenta que el ventilador trasero es ligeramente más grueso, y el anillo integrado ayuda a aumentar la presión estática en ambos ventiladores mientras mantiene las RPM bajas.
si no te gusta el aspecto de Founders Edition, puedes estar seguro de que habrá muchas otras opciones., Tenemos algunas tarjetas RTX 3080 de terceros para probar, todas las cuales naturalmente incluyen iluminación RGB. Ninguna de las tarjetas de terceros utiliza el conector de alimentación de 12 pines — tampoco-no es que realmente importe, ya que el adaptador requerido viene con la tarjeta. Aún así, ese puerto de 12 pines montado verticalmente parece un poco menos robusto si cambia las GPU de forma regular. Planeo dejar el adaptador permanentemente conectado y simplemente conectar o desconectar los cables de clavija normales de 8 pines., El conector de 12 pines parece estar clasificado para 25 ‘ciclos’, y ya he quemado la mitad de ellos (no es que espere que falle pronto).