Nvidia GeForce RTX 3080 Fundadores Edition é aqui, reivindicar o primeiro lugar em nossa GPU, hierarquia, e ranking como o melhor placa gráfica atualmente disponíveis, desde que você está depois do desempenho do primeiro, com preço e poder ser preocupações menores. Depois de meses de espera, finalmente temos benchmarks independentes e dados de teste., A Nvidia lançou o desafio, desafiando claramente o grande Navi da AMD para tentar igualar ou bater o que a arquitetura Ampere traz para a mesa.
vamos adiar um veredicto final por agora, como temos outros terceiros RTX 3080 cartas para rever, que começará logo amanhã. Isso é uma boa notícia, uma vez que significa que os clientes não se limitarão à edição dos fundadores da Nvidia para o primeiro mês ou algo parecido com o lançamento da RTX 20 series., Outra boa notícia é que não há nenhuma edição de fundadores ‘ tax ‘ desta vez: o RTX 3080 FE custa $699, diretamente da Nvidia, e esse é o preço base de RTX 3080 cartões por enquanto. A má notícia é que esperamos que a oferta seja insuficiente para acompanhar aquilo que esperamos que seja uma procura excepcionalmente elevada.
a linha de fundo, se você não se importa spoilers, é que o RTX 3080 FE é 33% mais rápido do que o RTX 2080 Ti, em média., Ou, se você preferir outros pontos de comparação, é 57% mais rápido do que o RTX 2080 Super, 69% mais rápido do que o RTX 2080 FE — heck, é ainda 26% mais rápido do que o Titan RTX!
mas há uma pegada: nós medimos todos esses resultados ‘por cento mais rápidos’ em todo o nosso conjunto de testes rodando em 4K Ultra configurações. A liderança diminui se você cair para 1440p, e diminui ainda mais a 1080p. ainda é 42% mais rápido do que um 2080 FE a 1080p ultra, mas este é um cartão feito para resoluções mais altas., Além disso, você pode precisar de uma CPU mais rápida para obter a experiência completa de 3080 — confira nosso companheiro GeForce RTX 3080 CPU Scaling artigo para os detalhes completos.,
Graphics Card | RTX 3080 FE | RTX 2080 Super FE | RTX 2080 FE | |||||||
---|---|---|---|---|---|---|---|---|---|---|
Architecture | GA102 | TU104 | TU104 | |||||||
Process (nm) | Samsung 8N | TSMC 12FFN | TSMC 12FFN | |||||||
Transistors (Billion) | 28.3 | 13.6 | 13.6 | |||||||
Die size (mm^2) | 628.,4 GPCs |
SMs |
FP32 Núcleos CUDA |
dez Núcleos |
B Núcleos |
VRAM Sp (Gbps) |
Set-20 |
Jul-19 |
Set-18 |
|
Preço de Lançamento | $699 | $699 | $799 |
o encontro GA102: O Coração da Besta
Nós temos um artigo separado de ir fundo na Ampère arquitetura que alimenta a GeForce RTX 3080 e outras relacionadas com as GPUs., Se você quer o resumo completo de tudo o que mudou em comparação com a arquitetura de Turing, recomendamos começar por lá. Mas aqui está o rolo de destaque das mudanças mais importantes:
o GA102 é a primeira GPU da Nvidia a cair nos únicos dígitos da litografia, usando o processo 8N da Samsung. O consenso geral é que o nó N7 do TSMC é “melhor” em geral, mas também custa mais e está atualmente em demanda muito alta — Incluindo do próprio A100 da Nvidia. Poderia o consumidor Ampere GPUs ter sido ainda melhor com 7nm? Talvez., Mas eles poderiam ter custado mais, só estavam disponíveis em quantidades limitadas, ou talvez eles teriam sido adiados mais alguns meses. De qualquer forma, GA102 ainda é um chip grande e poderoso, com 28,3 bilhões de transístores embalados em uma matriz quadrada de 628,4 mm. Se você está se perguntando, isso é 52% mais transístores do que o chip TU102 usado em RTX 2080 Ti, mas em uma área 17% menor.Ampere termina como uma arquitetura dividida, com o GA100 assumindo as ambições do data center, enquanto o GA102 e outros chips de consumo têm diferenças significativas., O GA100 centra-se muito mais no desempenho do FP64 para cargas de trabalho científico, bem como na duplicação em hardware de aprendizagem profunda. Enquanto isso, o GA102 deixa cair a maior parte da funcionalidade FP64 e em vez disso inclui hardware ray tracing, além de algumas outras melhorias arquitetônicas. Vamos dar uma olhada mais de perto no Ampere SM encontrado nos GA102 e GA104.,
GPUs Nvidia consistem de vários GPCs (Graphics Processing Clusters), cada um dos quais tem um determinado número de SMs (Streaming Multiprocessadores). A Nvidia divide cada SM em quatro partições que podem operar em conjuntos separados de dados. Com Ampere, cada partição SM agora tem 16 núcleos de CUDA FP32, 16 núcleos de CUDA FP32/INT CUDA, um núcleo Tensor de terceira geração, unidades de carga/loja, e uma unidade de função especial., Todo o SM tem acesso a cache e memória L1 compartilhados, e há um único núcleo de RT de segunda geração. No total, isso significa 64 núcleos FP32 e 64 núcleos FP32 / INT, quatro núcleos de Turing e um núcleo de RT. Vamos começar um pouco mais.
A GPUs de Turing adicionou suporte para as operações simultâneas FP32 (ponto flutuante de 32 bits) e INT (inteiro de 32 bits). FP32 tende a ser a carga de trabalho mais importante para gráficos e jogos, mas ainda há uma quantidade decente de operações INT — para coisas como cálculos de endereços, pesquisas de textura, e vários outros tipos de código., Com Ampere, o Datapath INT é atualizado para suportar INT ou FP32, mas não ao mesmo tempo.se você olhar para as especificações em bruto, Ampere parece ser um salto de desempenho muito maior do que os 70% que medimos. 30 TFLOPS! Mas geralmente não vai chegar nem perto dessa altura, porque o segundo datapath é uma situação ou uma: Ele não pode fazer ambos os tipos de instruções sobre o pipeline no mesmo ciclo. Nvidia diz que cerca de 35% dos cálculos de jogos são INT operações, o que significa que você vai acabar com algo mais como 20 TFLOPS de FP32 e 10 TOPS de INT no RTX 3080.,enquanto estamos a falar sobre o assunto, vamos também salientar que uma grande parte do aumento do desempenho vem de limites de potência aumentados. RTX 2080 foi uma parte 225W (para a edição dos fundadores), e RTX 3080 basicamente adiciona 100W a isso. Isso é metade de novo mais energia para 70% mais desempenho. É tecnicamente uma vitória na eficiência geral, mas na busca do desempenho, a Nvidia teve que se mover mais para a direita na curva de tensão e frequência., A Nvidia diz que a RTX 3080 pode proporcionar uma melhoria de 90% no desempenho por watt se limitarmos o desempenho ao mesmo nível em 2080 e 3080 … mas vá lá, quem quer limitar o desempenho dessa forma? Talvez portáteis, mas não vamos por aí.
Uma coisa que não mudou muito é as portas de vídeo. Isso só parcialmente é verdade., Primeiro, há uma única porta HDMI, mas é HDMI 2.1 em vez do HDMI 2.0 b de Turing, mas as três conexões DisplayPort permanecem 1.4 a. E por último, mas não menos importante, não há nenhuma porta VirtualLink nesta rodada — aparentemente, VirtualLink está morto. COPIAR. As várias portas são todas capazes de 8K60 usando DSC (Compressão De Fluxo De Exibição), uma técnica” visualmente sem perdas ” que não é realmente visualmente sem perdas. Mas você pode não notar em 8K.
voltando para os núcleos, os núcleos de terceira geração de tensores da Nvidia em GA102 trabalham em matrizes 8x4x4 FP16, de modo que até 128 operações de matriz por ciclo., (Turing’s tensor cores used 4x4x4 matrices, while the GA100 uses 8x4x8 matrices.) Com FMA (fused multiply-add), são 256 operações FP por ciclo, por núcleo tensor. Multiplica pelos 272 núcleos tensores totais e a velocidade do relógio, e isso dá-te 119 TFLOPS de cálculo FP16. No entanto, os núcleos tensores de Ampere também adicionam suporte para a escassez de grãos finos-basicamente, elimina perder tempo fazendo multiplicações por 0, uma vez que a resposta é sempre 0. A Sparsity pode fornecer até o dobro do desempenho do FP16 em aplicações que podem usá-lo.,
os núcleos de RT recebem melhorias semelhantes, com até o dobro dos cálculos de intersecção de raio/triângulo por Relógio. Os núcleos de RT também suportam uma variável de tempo, que é útil para calcular coisas como borrão de movimento. Tudo dito, Nvidia diz que os 3080 novos núcleos de TR são 1,7 vezes mais rápido do que os RTX 2080, e eles podem ser até cinco vezes mais rápido para o borrão de movimento.
Existem muitas outras alterações também. A capacidade de cache L1 / memória compartilhada e largura de banda foi aumentada para alimentar melhor os núcleos (8704KB vs. 4416KB), e o cache L2 também é 25% maior do que antes (5120KB vs., 4096KB). O cache L1 também pode ser configurado como quantidades variáveis de memória L1 vs. compartilhada, dependendo das necessidades da aplicação. Register file size is also nearly 50% larger (17408KB vs. 11776KB) with the RTX 3080. GA102 também pode fazer RT + gráficos + DLSS simultâneos (anteriormente, usando os núcleos de RT iria parar os núcleos de CUDA).
finalmente, os operadores de raster (ROPS) foram movidos para fora dos controladores de memória e para o GPC. Cada GPC tem duas partições de PUP de oito unidades de PUP cada., Isso proporciona mais flexibilidade no desempenho, portanto, onde o GA102 tem até 112 ROPS total, o RTX 3080 desativa dois controladores de memória, mas apenas uma GPC e acaba com 96 ROPS. Isto é mais crítico para o RTX 3070 / GA104, no entanto, que ainda tem 96 ROPS, apesar de ter apenas oito controladores de memória. Cada GPC também inclui seis TPC (clusters de processamento de textura) com oito TMUs (unidades de mapeamento de textura) e um motor polimorfo, embora a Nvidia só permita 34 TPC para o 3080.,
Com o núcleo acessórios fora do caminho, vamos também discutir rapidamente o subsistema de memória. GA102 suporta até doze canais de memória de 32 bits, dos quais dez são ativados no RTX 3080. Nvidia se uniu com Micron para usar sua memória GDDR6X, que usa sinalização PAM4 para aumentar as taxas de dados ainda mais do que antes. Onde as cartas de 20 séries da RTX chegaram aos 15.,5 Gbps no super 2080 e 14 Gbps nas outras placas RTX, o GDDR6X corre a 19 Gbps no RTX 3080. Combinado com a interface de 320 bits, que produz 760 GBps de largura de banda-uma melhoria de 70% sobre RTX 2080.
O controlador de memória RTX 3080 também foi melhorado, com uma nova funcionalidade chamada EDR: detecção de erros e Replay. Quando a Memória detecta uma transmissão falhada, ao invés de bater ou corromper dados, ela simplesmente tenta novamente. Ele vai fazer isso até que seja bem sucedido, embora ainda seja possível causar um acidente com a sobrecarga de memória., A parte interessante é que com EDR, Relógios de memória mais altos podem ser alcançáveis, mas ainda resultam em menor desempenho. Isso é porque o EDR acaba por reduzir o desempenho da memória quando as transmissões falhadas ocorrem. Teremos mais a dizer sobre isso na seção de overclocking.,
GeForce RTX 3080 Fundadores Edição: Design, Refrigeração, Estética
a Nvidia tem mudado radicalmente a concepção de seus Fundadores Edição cartões para o RTX 30-série., O novo design ainda inclui dois ventiladores axiais, mas a Nvidia redesenhou fortemente o PCB e encurtou-o de modo que a “parte de trás” da placa (longe das portas de vídeo) consiste de apenas um ventilador, hélices, barbatanas radiadoras, e a placa gráfica usual shrod. A Nvidia diz que o novo design proporciona melhorias substanciais na eficiência de refrigeração, ao mesmo tempo em que diminui os níveis de ruído. Veremos os frutos do design mais tarde.
estética são altamente subjetivas, e já ouvimos muitas pessoas como o novo design, enquanto outros acham que parece chato., Não há RGB bling se essa é a sua coisa, e a única iluminação consiste em um logotipo branco GeForce RTX no topo do cartão com iluminação sutil em torno do ‘X’ em ambos os lados do cartão (mas apenas metade do ‘X’ é iluminado no lado com o logotipo “RTX 3080”).
pessoalmente, eu acho que o novo cartão parece muito bom, e ele se sente muito sólido na mão. Na verdade, é cerca de 100g mais pesado do que o anterior design RTX 2080, e tanto quanto sei, é o cartão single-GPU mais pesado que a Nvidia já criou., É também cerca de 2cm mais longo do que os cartões de geração anterior e usa a largura típica de dois slots. (The GeForce RTX 3090 is about ready to make the 3080 FE look puny, though, with its massive three-slot cooler.)
Nvidia provided the above images of the teardown of the RTX 3080 Founders Edition. Ainda não estamos prontos para tentar desmontar o nosso cartão — e francamente, estamos sem tempo — mas podemos voltar ao assunto em breve. Dizem-nos que separar a carta é um pouco mais complicado nesta ronda, principalmente porque a Nvidia escondeu os parafusos atrás de coberturas minúsculas.,
a placa principal parece muito mais densamente povoada do que as GPUs anteriores, com os 10 chips de memória GDDR6X rodeando a GPU no centro. Você também pode ver o conector de energia de 12 pinos angulados e o corte funky-looking no final do PCB. A entrega de energia é obviamente importante com um 320W TGP, e você pode ver todos os capacitores eletrolíticos sólidos colocados à esquerda e à direita dos chips de memória.,
a disposição da memória também é interessante, com quatro chips nos lados esquerdo e direito da GPU, até três chips acima da GPU (duas posições de montagem estão vazias para o RTX 3080), e um único chip final abaixo da GPU. Mais uma vez, a Nvidia claramente gastou muito esforço para reduzir o tamanho do tabuleiro e outros componentes para acomodar o novo e melhorado design de resfriamento. Spoiler: funciona muito bem.
uma coisa interessante é que o ventilador ‘ frontal ‘(perto das portas de vídeo) gira na direção habitual — no sentido anti-horário., A ventoinha ‘de trás’, que normalmente se vira para cima quando você instalar o cartão em uma caixa ATX, gira no Sentido DOS ponteiros do relógio. Se você olhar para as barbatanas, isso significa que a ventoinha traseira gira na direção oposta do que normalmente esperamos. A razão é que Nvidia encontrou este arranjo puxa o ar através do radiador melhor e gera menos ruído. Note também que a ventoinha traseira é um pouco mais espessa, e o anel integrado ajuda a aumentar a pressão estática em ambos os ventiladores, mantendo RPMs Baixos.
Se você não gosta do olhar da edição dos fundadores, tenha certeza de que haverá muitas outras opções., Nós temos alguns terceiros RTX 3080 cartões para testes, todos os quais, naturalmente, incluem iluminação RGB. Nenhum dos cartões de terceiros usar o conector de energia de 12 pinos, também-não que isso realmente importa, uma vez que o adaptador necessário vem com o cartão. Ainda assim, essa porta de 12 pinos montada verticalmente parece um pouco menos robusta se você por acaso trocar GPUs em uma base regular. Planeio deixar o adaptador permanentemente ligado e ligar ou desligar os cabos de ligação normais., O conector de 12 pinos parece ser classificado para 25′ ciclos, ‘ e eu já queimei através de metade desses (não que eu espero que falhe a qualquer momento em breve).