Este E3 foi um pouco anômalo. Estamos agora no caminho para a transformação deste evento, cada vez menos central em um mundo que prospera com informações e vazamentos constantes. No entanto, ainda existe aquela aura de um evento exclusivo, com os olhos do mundo sobre eles, o que permite à E3 continuar a ser um bom momento para apresentar informações a uma massa de jornalistas e até mesmo ao público mais geral, não apenas no setor. É nesse quadro que a AMD decidiu apresentar seus novos produtos.

A AMD é a fornecedora de CPUs e GPUs para os consoles domésticos da Microsoft e da Sony e também para a próxima geração, deixando a Intel e a Nvidia sozinhas no mundo dos PCs, mesmo que a última tenha conseguido levar a fatia dos jogadores da Nintendo. Com este artigo, tentaremos entender quais são as melhorias e como elas terão impacto nos futuros consoles de jogos e PCs.

Muitos núcleos para todos

A nova oferta da AMD se ramifica em ambas as linhas de produtos: CPU e GPU, com a série 3000 de CPUs e GPUs 5700. Os Ryzen que são baseados na arquitetura Zen 2 já foram apresentados no final de maio para o Computex 2019. Eles levaram o E3 para apresentar seu principal CPU: o Ryzen 3950X. Núcleo 16. 32 Threads. 4.7Ghz de boost, base 3.5Ghz. 105 Watts de consumo. 749 $ preço.

Minha dúvida neste momento é: por que apresentá-lo como um processador de jogos? Os videogames modernos, se vierem a usar o núcleo 6, são um milagre. Aqui também haveria 10, parando para virar os polegares. A solução foi anunciada rapidamente e foi revelada no início da conferência: streaming. Hoje todo mundo quer tentar passar seu jogo no Twitch. Codificar um fluxo de vídeo enquanto joga pesado, garantindo alta qualidade aos espectadores, requer muito poder de computação. A tarefa recai sobre a CPU.

RDNA Ryzen 3000
Testes preliminares com uma configuração não especificada, mas a AMD mostra um desempenho equivalente, por isso depende de outros fatores para vender seu 3900X.

O streamer que faz isso por profissão, geralmente tem uma configuração com dois computadores: um para o jogo e outro para gerenciar o streaming. Com os processadores core 12 e 16, disponíveis em uma plataforma de consumidor, a AMD ataca essa necessidade: fazer tudo em um computador. Na demo mostrada por eles, um 3900X (12 core) foi capaz de gerenciar um stream em full HD em 10Mbps com Slow preset do The Division 2, um jogo capaz de explorar adequadamente uma exacerbação. O processador Intel estava particularmente ocupado com o jogo para garantir um fluxo dessa qualidade, enquanto o 3900X tinha muito poder livre.

Para streamers profissionais, a proposta é muito interessante, principalmente porque reduziu drasticamente o custo para obter uma solução multicore. Para o usuário comum, aspirar a comprar um processador desse tipo apenas para streaming é em grande parte inútil. O codificador de hardware das placas Nvidia Turing garante uma excelente qualidade visual (igual ao software médio x264) com uma demanda muito baixa por recursos. Este núcleo é para todas as cores que precisam de tantos núcleos, por isso trabalho profissional, mas não muita largura de banda na memória.

DNA de Radeon

A parte central da conferência foi a mais interessante, porque apresentou luma nova família de processadores gráficos da AMD: Ships. O 7 de julho chegará nas variantes 2: o 5700 e o 5700 XT. Com a Navi, a AMD finalmente mudou a arquitetura. Nós nos movemos do GCN agora antiquado e inadequado (material nascido em 2012) para o RDNA. Em termos de números, a AMD declara um aumento de 25% no desempenho por clock e um 50% melhor desempenho por watt. A mudança na arquitetura pode ser vista pelo número de transistores. Apenas no 251 mm2 eles conseguiram colocar 10,3 bilhões de transistores, um aumento de 80% comparado ao anterior Radeon 580.

O calcanhar de Aquiles da arquitetura GCN sempre foi a eficiência de usar seu poder de computação. No papel, seus cartões literalmente tiveram que destruir a Nvidia em todos os segmentos do mercado. Premissas que, na realidade, não foram mantidas.
A AMD, portanto, simplificou muito as rodovias que canalizam dados para as unidades de computação na arquitetura.

AMD RDNA
Graficamente a mudança de lógica no caminho de dados entre as arquiteturas é muito mais evidente

A GCN tinha largas frentes de onda 64 e suas unidades SMID tinham slots 16. No RDNA, ambos são ótimos encadeamentos 32. Ok, palavras grandes. Vamos tentar examinar o conceito que queremos destacar com essas mudanças técnicas sem irmos muito fundo. A frente de onda é o conjunto de instruções agrupadas e prontas para serem enviadas para as unidades de cálculo. A arquitetura antiga precisava de ciclos 4 para passar instruções para todos os SMIDs (64 / 16). Além disso, se você não puder agrupar as instruções em blocos de threads 64, perderá muito tempo com partes da GPU em espera.

Para fazer tudo funcionar melhor, foi necessário muito trabalho dos desenvolvedores, para encontrar algo para fazer com os pipelines estagnados. É por isso que o tão falado Compute Async nas GPUs da AMD tem um efeito extremamente benéfico. Ele permite que você aproveite os intervalos. Tendo reduzido o tamanho da frente de onda em RDNA, permite agrupar cargas de trabalho mais facilmente, enquanto tendo ampliado o tamanho do SMID permite ocupar o ciclo 1 somente para passar os dados. Esta é a pedra angular que permite que a arquitetura seja um verdadeiro passo em frente em direção à eficiência. Observe que a AMD manteve compatibilidade com a largura de onda da largura 64. Silício e mais lógica, mas é essencial não quebrar o ecossistema do console em um único disparo e permitir compatibilidade retroativa com todo o código otimizado para o GCN.

O triângulo não

A outra grande fraqueza da arquitetura do GCN foi a capacidade de processamento de polígonos, que permaneceu praticamente estática desde a segunda geração de CGN. Esta é também a razão pela qual os jogos no PS4 e no Xbox One não viram um aumento excessivo na massa poligonal, favorecendo melhorias em outros campos. No PC, em vez disso, alguns jogos próximos da Nvidia podem oferecer o uso de mosaicos e, portanto, de muitos polígonos pequenos, para enriquecer a cena com detalhes, com um peso de desempenho mais limitado nas cartas da equipe verde. Bem, o RDNA também melhora neste campo de duas maneiras diferentes.

Primeiro de tudo, agora a arquitetura é capaz de lidar com o dobro de polígonos em seu ciclo de trabalho comparado ao GCN. Valores, no entanto, inferiores aos da Nvidia com Turing, mas um enorme passo em frente. Então, os shaders primitivos foram reintroduzidos. Eles foram apresentados com Vega, mas foram desativados porque basicamente não funcionavam. Esses são códigos capazes de processar a geometria com muito mais eficiência. Esses shaders são capazes de eliminar todos os elementos que não são necessários para a cena, a uma taxa alta. Se esse recurso fosse finalmente usado, falaríamos sobre melhorias de desempenho 30%.

Para isso é adicionado também um novo nível de memória cache, o que deve ajudar muito o desempenho geral. Turing é um grande passo à frente para a Nvidia, principalmente por ter preenchido a GPU com caches de memória perto das unidades de computação e rápido. A abordagem da AMD é menos invasiva, mas, no entanto, é uma melhoria. Os outros recursos apresentados são vários e possíveis soluções de software, difíceis de julgar sem a menor informação, por isso sobrevôo, também porque eles morrem quase todos com o tempo.

ESCARLATA VERMELHA

Eu não sei sobre você, mas todo esse embotamento para um projeto chamado Scarlett ...

Vamos falar sobre o elefante na sala. Scarlett. E essa afirmação 4 vezes o poder do Xbox One X. Deixe todos imediatamente fazer cálculos rápidos em mente. 6 × 4 = 24TF. SCARLETT 24 TERAFLOP. Então, acalme-se. O novo Navi 5700XT tem um pico 9,75TF. Consuma apenas 225 Watt e custa 449 $. O que Scarlett vai ter dentro? Considerando a eficiência por clock de antes, o 25%, um RDNA para 10TF, deve renderizar como um 12,5 TF CGN. Aqui, então, que o 5700XT ou em qualquer caso sua variante parece um bom candidato. Mas o verdadeiro passo em frente é outro. A transição do núcleo do Jaguar para um Ryzen. Usando o poder da conspiração, podemos dizer que os IPCs de um Zen 2 são os maiores núcleos 95 da Jaguar. Isso significa que um Ryzen em 1,17Ghz terá o mesmo desempenho que o núcleo do Xbox One X que viaja para 2,3Ghz. Agora, vamos pegar o 4,7Ghz do 3950X. Seria o equivalente 9,1Ghz de um Jaguar. Ou seja, quase 4 vezes.

Então é um pouco apertado, eu espero frequências realisticamente em torno do 3Ghz, e uma contagem do núcleo do 8. Se eles tivessem o SMT habilitado, ele falaria do dobro dos núcleos dos consoles atuais, mesmo trazendo com o 3Ghz uma quadruplicação do poder.

No fundo, falava-se em 120fps. E 120fps é 30 x 4.

Eu diria que chegou a hora de tirar conclusões. Os produtos da AMD podem ser o começo de um ótimo retorno mesmo no lado da GPU. A mentalidade por trás de sua GPU mudou, alinhando-se com a da Nvidia. A nova arquitetura é projetada para velocidade, menos unidades, mas extremamente mais eficiente. O aumento no desempenho no lado da geometria trará realmente um grande salto poligonal nos jogos exclusivamente próximos da geração. Nós olhamos para os tempos futuros com um olhar aguçado, porque a tecnologia que irá conduzir os próximos consoles é finalmente algo decente e não um desperdício de armazém.