Certa vez Johannes Kepler escreveu que “a natureza usa o mínimo possível de qualquer coisa.” A última GPU da Nvidia, codinome Kepler por causa do matemático alemão, parece ter se inspirado na citação, tanto quanto a proeza matemática original de Kepler. A nova GPU, GTX 680, oferece potência para gráficos soberbos, mas pede em troca apenas dois conectores de energia PCI-Express de 6 pinos. É um grande salto em relação à GTX 580 da geração anterior, que era rápida, mas sedenta por energia.
Menor Igual Maior
A GPU do Kepler é feita usando um processo de 28nm, permitindo à Nvidia construir mais circuitos em menos área do die.
Como o Fermi, o Kepler é uma arquitetura modular, o que possibilita à Nvidia escalar o design para mais ou para menos adicionando ou removendo blocos funcionais. No Fermi, Streaming Multiprocessors, ou simplesmente SMs, são o bloco de construção básico a partir do qual a linha de GPUs GTX 500 era construída. O número de núcleos CUDA dentro dos SMs podia variar. Por exemplo, cada bloco SM na GTX 560 Ti continha 48 núcleos CUDA, enquanto a GTX 580 SM era constituída com 32 núcleos. A GTX 580, por outro lado, tinha um total de 16 SMs com 32 núcleos cada, chegando ao total de 512 núcleos CUDA.
O bloco fundamental no Kepler é o SMX. As GPUs Kepler são construídas em 28nm, o que permite aos arquitetos da Nvidia escalar as coisas de modo um pouco diferente. Então a Nvidia aumentou a quantidade de núcleos dentro do SMX do Kepler para impressionantes 192 núcleos CUDA em cada um.
A GTX 680 é feita ade oito blocos SMX, arranjados em grupos emparelhados chamados GPCs (Graphics Performance Clusters). Isso dá à GTX 680 incríveis 1536 núcleos CUDA.
O SMX não serve apenas para armazenar núcleos CUDA, porém. Embutido em cada SMX está o novo motor Polymorph, que contém o motor, configuração e recursos relacionados de tesselação via hardware. Também incluídos estão 16 unidades de textura. Isso dá à GTX 680 um total de 128 unidades de textura (comparados às 64 unidades de textura embutidas na GTX 580). É interessante notar que o cache mudou um pouquinho — cada SMX ainda tem 64 KB de cache L1 cada, parte do qual pode ser usado como memória compartilhada pela GPU. Entretanto, isso significa que o total de cache L1 encolheu um pouco, já que agora só existem oito unidades SMX na GTX 680, não as 16 da GTX 580. O cache L2 também ficou menor, com 512 KB em vez dos 768 KB do Fermi.
Outra mudança interessante é a pré-decodificação e dependência da verificação foi repassada para o software, enquanto que no Fermi elas eram feitas no hardware. O que a Nvidia ganhou em troca foi uma melhor eficiência em instruções e mais espaço no die. Curiosamente, a contagem de transistores na GPU da GTX 680 é de 3,5 bilhões, pouca coisa a mais que os 3 bilhões da GTX 580. O tamanho do die diminuiu, porém, para um número muito mais maleável, 294mm² — a título de comparação, o die da CPU quad-core Sandy Bridge de 32nm da Intel tem 216mm².
Texturas, antialiasing e mais
Um dos novos recursos mais legais de uma perspectiva de aplicação prática é as texturas sem ligações. Antes do Kepler, as GPUs da Nvidia eram limitadas a 128 texturas simultâneas; o Kepler impulsiona isso ao permitir que textutas sejam alocadas conforme o necessário dentro do programa de shader, com até 1 milhão de texturas simultâneas disponíveis. É discutível se os jogos usarão tantas texturas, mas certos tipos de renderização de arquiteturas poderão ser beneficiados.
A Nvidia continua a incorporar o modo antialiasing proprietário FXAA, mas adicionou um novo modo chamado TXAA. O “T” vem de “temporário”. O TXAA em seu modo padrão é, na realidade, uma variante do 2x multisampling AA, mas que diversifica o padrão de amostragem com o tempo (por exemplo, em vários quadros). O resultado é bordas com qualidade superior até ao 8x MSAA, mas o impacto no desempenho é mais próximo de um 2x multisampling.
Outro recurso bacana que eventualmente também será suportado por GPUs antigas da Nvidia é o Vsync Adaptativo. Atualmente, se você travar o vertical sync para a taxa de atualização do seu monitor (geralmente 60 Hz, mas pode ultrapassar os 120 Hz em algumas telas), você terá um gameplay mais suave. Porém, você poderá ver um efeito de obturador quando a taxa de frames ficar em 30 fps ou menos, devido à saída de frames estar travada ao vsync. Por outro lado, se você rodar com o vsync desligado, você talvez veja os frames bem agressivos, já que novos frames são enviados ao monitor antes que os anteriores estejam completos.
O Vsync Adaptativo trava a taxa de frames à taxa de atualização vertical, até que o driver detecte que a taxa de frames caiu abaixo da de atualização. O Vsync é, então, desabilitado temporariamente até que a taxa de frames se recupere e volte a estar acima da do monitor. O resultado é um desempenho muito mais suave do ponto de vista do jogador.
Por fim, a Nvidia reforçou o motor de vídeo, construindo um motor de codificação capaz de codificar vídeo H.264 high-profile a 4x-8x em tempo real. O consumo de energia é baixo nesse modo, consumindo um dígito de watts, em vez das dezenas que as antigas GPUs consumiam via shaders.
Veja mais Informações: http://www.gizmodo.com.br/conteudo/nvidia-gtx-680-testada-a-fera-faz-jus-ao-hype/