Tecnología

NVIDIA RTX 4090 [REVIEW]

RTX 4090: Violenta evolución.

El 20 de septiembre de 2022 en el marco de la GTC, nVidia dio un keynote maravilloso en donde demostró porque es el líder absoluto en la arena de las GPU al presentar su más ambiciosa evolución desde el lanzamiento del primer GPU RTX en 2018. Su nombre código: Ada Lovelace y su nombre comercial: nVidia Geforce RTX 4000 Series.Después de casi dos años sin novedades en el territorio de las GPU de nVidia en donde sufrimos horrores para conseguir GPUs de la gama 3000 por su potencia para el uso de minería, la compañía se despachó con un brutal salto generacional en que vuelve a romper todas las métricas de rendimiento conocidas.

Como ya es costumbre la primera camada en ver la luz es la de alta gama, compuesta por las Geforce RTX 4090, la RTX 4080 y la RTX4070Ti. ¿Los precios? Saladitos: La 4090 tiene un precio lanzamiento de 1600 dólares mientras la 4080 cuesta 1200. La 4070ti tiene un precio sugerido de 799 dólares. Si lo vemos en retrospectiva, son más caras que las generaciones anteriores cuando fueron lanzadas, pero creo que el nivel de tecnología que traen las tarjetas lo ameritan.

RTX 4090 Ada: 4nm para las masas

¿Qué es lo novedoso de Ada? Lo monstruosa que es en todo aspecto. En un proceso de TSMC de 4nm optimizado por nVidia, la RTX 4090 es capaz de empaquetar 76.300 millones de transistores en un núcleo monolítico enorme de 608mm2. Si comparan la RTX 3090 con 28.300 millones vamos a ver que la densidad de transistores se incrementó en un salvaje ¡170%!

Claro que tantos transistores tienen su consumo, por lo que esta RTX 4090 tiene un TDP máximo de 450W y para ello hace gala de un nuevo conector llamado ATX 3.0 que consta de 16 pines específicos para poder lidiar con semejante carga energética. Es por ello por lo que el mínimo indispensable para poder usar una 4090 es una fuente de 850W reales. Si tienen una fuente de esa carga, se proveen adaptadores del conector clásico de 8 pines a este nuevo de 16.

Semejante cantidad de transistores demuestra que la RTX 4090 sobrepasa en gran parte todos los valores de la otora reina, la 3090. Veamos.

RTX 4090 RTX 3090
Proceso TSMC 4N Samsung 8N
Transistores (miles de millón) 76.3 28.3
Tamaño del núcleo 608.4 628.4
SMs 128 82
GPU Shaders 16384 10496
Tensor Cores 512 328
Ray Tracing “Cores” 128 82
Boost Clock (MHz) 2520 1695
Velocidad VRAM (Gbps) 21 19.5
VRAM (GB) 24 24
Ancho BusVRAM 384 384
L2 72 6
ROPs 176 112
TMUs 512 328
TFLOPS FP32 82.6 35.6
TFLOPS FP16 (FP8/INT8) 661 (1321) 142 (285)
Bandwidth (GBps) 1008 936
TDP (watts) 450 350

Como ven, no hay valor que no se haya incrementado notablemente en términos teóricos…veremos si todo este dechado de tecnología acompaña al rendimiento en los juegos.

Los detalles de la RTX 4090

El GPU sigue teniendo como unidad de procesamiento integrada los Streaming Multiprocessors, los cuales a su vez se dividen en 1 núcleo de RT (Ray Tracing), 4 núcleos Tensor y 128 núcleos CUDA (Compute Unified Device Architecture). En conjunto ofrecen una frecuencia de reloj boost de 2520 MHz en la versión 4090 de referencia frente a los 1695 MHz que alcanza la 3090. Además, la tarjeta posee un total de 512 TMUs y 176 ROPs frente a las 328 y 112 respectivamente de la RTX 3090.

Los Tensor Core pasan a ser de 4ª generación y en un recuento de 512 unidades, cuya función es la de trabajo matricial, multiplicar y acumular operaciones matemáticas para IA y HPC. Son el motor de las redes neuronales utilizadas en DLSS, admitiendo un nuevo formato FP8 que se introdujo en la arquitectura Nvidia Hopper.

Los núcleos RT que se dedican a procesar el ray tracing para generar los rayos de luz que inciden sobre los objetos. Existen un total de 128 RT Core de 3ª generación en el chipset de la Nvidia RTX 4090, los cuales duplican el rendimiento respecto a la 2ª generación de Ampere alcanzando los 191 RT-TFLOPS.

La configuración de memoria comienza con un aumento del caché L2 interno del chipset hasta alcanzar los 73,7 MB, así como una caché L1 de 16384 KB. En cuanto a la VRAM dedicada, se mantiene en las mismas especificaciones que la RTX 3090 con un total de 24 GB de tipo GDDR6X.

Otras mejoras en la RTX 4090

Otra de las novedades de Ada Lovelace es que las GPU cuentan con dos encoders AV1 NVENC de 8ª generación para ofrecer mejor calidad de imagen a las mismas tasas de bits que H.265/H.264, siendo un gran añadido para streamings mientras jugamos. Esta versión es hasta un 40% más eficiente que Ampere y genera archivos más pequeños para un mejor rendimiento en la red. Los dos encoders pueden funcionar en paralelo, dividiendo el trabajo y ofreciendo gran calidad en resoluciones 4K. Este puede ser un gran complemento para Nvidia Broadcast el software para retransmisiones con IA, seguimiento automático de cámara y eliminación automática de ruido.

DLSS3

DLSS 3 es una de las grandes novedades estrenadas junto a la arquitectura Lovelace de la que está hablando todo el mundo. Nvidia da otro giro de 180º a su tecnología de reescalado de imagen por IA y red neuronal. Sabiendo cómo funciona la versión previa DLSS 2 la nueva versión 3.0 utiliza IA para generar cuadros completamente nuevos en lugar de solo píxeles gracias a 4 nuevos componentes. Un nuevo Optical Flow Accelerator (OFA), vectores de movimiento del motor de juego, un marco IA autoencoder convolucional y el sistema Reflex super-low-latency.

Este nuevo DLSS procesa el nuevo cuadro junto al cuadro anterior para ver cómo están cambiando la escena. El OFA proporciona a la red neuronal la velocidad y dirección de los píxeles fotograma a fotograma para que esta genere marcos intermedios completamente nuevos sin necesidad de procesar los gráficos e involucrar el juego. El rendimiento llega a ser hasta 4 veces superior respecto a DLSS. DLSS 3.0 funcionará simultáneamente con DLSS Super Resolution (DLSS 2), siendo una técnica indispensable para juegos de mundo abierto. La mala noticia claro está es que DLSS 3.0 será exclusivo para la RTX4000, sin posibilidades de ejecutarlo en RTX3000 o 2000.

¡Veamos la RTX 4090!

La RTX 4090 es Gigante…al punto que requiere 3 slots PCI en el gabinete, mide 304x137x61mm y pesa 2,2 KG.

Las salidas de video son 4 (al menos en la Founder Edition): 3 Display Ports 1.4a, una HDMI 2.1. De las 4 salidas, 4 se pueden usar en simultáneo.

Para refrigerarla, viene con dos ventiladores, uno adelante y uno atrás…opuestos en la placa para generar la mayor corriente de aire posible sin necesidad de recurrir a un blower que generaría mucho más ruido.

Otra cosa que notamos es que la RTX 4090 no tiene más el conector NVLink…oficialmente nVidia con esa medida declara al SLI de RTX 4090 como extinto. Además, que para mover dos o tres RTX4090 íbamos a necesitar un pequeño reactor nuclear.

¿Y que tal anda la RTX 4090?

nVidia nos prestó todo enero una RTX 4090 para hacer las pruebas. Como el poder de procesamiento de la RTX4090 es tan desmesurado que probar en 1080p no tenía sentido asique salimos corriendo a conseguir un monitor 4K y un colega me prestó amablemente una 3090 para hacer la comparación del salto generacional.

La máquina es un Core i7 11700k, con 32GB de RAM DDR4, dos discos NVMe de 1TB y chipset Z590.

Probamos todos los juegos en 2K y 4K porque en 1080p ya una 3090 está limitada por el CPU asique una 4090 iba a tener valores similares.

Corrimos las pruebas en varios juegos:

¿Y los resultados de la RTX 4090?
Control

Si bien Control corre por arriba de 60fps cómodo en una 3090, miren lo que sucede cuando habilitan Ray Tracing y DLSS2, la 4090 practicamente es un 80% más veloz.

Shadow of Tomb Raider

Sucede lo mismo en SOTR, la 3090 sostiene 4k sin sobresaltos…pero la 4090, madre santa…podria correr 8K con DLSS2 activo y aun asi sostener framerates de vértigo.

Metro Exodus Enhanced

Metro Exodus muestra lo mismo…lo mas interesante que habilitar RT y DLSS2 tanto en la 3090 como la 4090 no impactan tanto en el framerate, pero si en la calidad.

Cyberpunk 2077

Con Cyberpunk las cosas se pusieron MUY divertidas. La 4090 le vuelve a sacar una considerable ventaja a la 3090 de 60/80% en todos los charts dependiendo del uso de RT y DLSS2…ahora, cuando activamos DLSS3, literalmente la diferencia es aplastante…los gráficos hablan por si solos.

Flight Simulator

Flight Simulator fue el benchmark donde la 3090 y la 4090 estuvieron lejos, pero no tanto…hasta que nuevamente activamos DLSS3 y la 4090 duplicó su rendimiento versus su mismo benchmark en DLSS2 (61fs vs 125).

Conclusión

No hay forma de encontrar algo malo en la RTX 4090 ya los benchmarks hablan por si solos. En 4K es la GPU más rápida del mercado por escándalo aún sin usar DLSS2 o 3. Destruyó a la RTX3090 (la anterior campeona de rendimiento) y los de AMD no pueden hacerle sombra ni aunque se lo propongan con la arquitectura RDNA3.

La única contra quizás podría ser el consumo: 450W requieren de una fuente potente y un flujo de aire dentro del gabinete importante…pero también el que compra una RTX4090 ya tiene eso cubierto.

En argentina en este momento se puede comprar por 1.100.000 pesos en promedio (unos 2900 dolares al cambio paralelo) con lo cual claramente es una placa muy pero muy de nicho. Eso si, el nicho que la puede comprar tiene garantizado el rendimiento en juegos más rápido del planeta y claramente es una GPU diseñada para jugar con total comodidad en resoluciones de 4K. Asique merecidísima medalla de oro [IRROMPIBLES] para la RTX 4090.

Nota: Agradecemos a Jazmin Gonzalez de NVIDIA Argentina por prestarnos la placa para esta review

Escribe un comentario