Arquitectura RDNA 3, el corazón de las GPU AMD Radeon RX 7000

Ángel Aller - Última actualización: 4 de junio de 2024

Tras la gran actuación de RDNA 2 con las RX 6000, AMD decidió dar un giro de tuerca a sus Radeon con el diseño de RDNA 3. Estamos en una etapa muy bonita entre AMD y NVIDIA, tras el resurgir de la primera con RDNA, ¿vencerán al equipo verde?

Ángel Aller

— Geek inconformista.

Experto en ordenadores y gaming

AMD RDNA 3: las grandes novedades de RX 7000

Vamos a analizar la arquitectura de RDNA 3, la cual sucede a RDNA 2 y sus míticas Radeon RX 6000. Para ello, vamos a ir desmenuzando todas las nuevas características o mejoras que se han producido en las AMD Radeon RX 7000.

Las primeras GPU chiplet de la historia

Lo primero a destacar es el diseño tan arriesgado por el que ha apostado AMD: el chiplet. Ya tiene experiencia con este enfoque de diseño con su plataforma EPYC y su plataforma Ryzen de procesadores.

En este caso, la GPU tiene 1 procesador grande (GCD) y luego otros 6 más pequeños (MCD). Luego, explicamos qué contiene cada cosa. El tema complejo es que los shaders requieren una conectividad enorme, así que tuvieron que crear un “puente” de alto rendimiento que permitiese la comunicación de 5.3 TB/segundo entre el GCD y los MCD.

AMD asegura que grabar silicio en los nodos más avanzados (6 y 5 nm) se ha vuelto muy caro. Así que, al separar la GPU por partes, no necesitan el proceso más avanzado y pueden vender el producto con un margen mayor.

¿Cuál es la desventaja? La latencia, pero la solución pasa por subir de frecuencia la GPU. Concretamente, aumentaron el 18% de la frecuencia y el 43% del reloj de Infinity Fabric.

Graphics Compute Die (GCD) y Memory Cache Die (MCD)

AMD ha decidido introducir una nueva arquitectura de diseño en los chips Navi 3X, caracterizado por un gran GCD (5nm) y pequeños MCD (6 nm): todo dentro del mismo die. Para que os hagáis una idea, el die de la GPU AMD es de 300 mm², mientras el de la NVIDIA RTX 4090 es de 608 mm².

De entrada, el coste de los chips AMD serían más baratos de fabricar que los de NVIDIA. Efectivamente, tal y como veis en la imagen, estamos ante un diseño chiplet, famoso por verlo en las CPU AMD Ryzen.

Empezando por los bloques GCD, en estos complejos encontramos los CU (Compute Unit), motores para procesamiento multimedia y los bloques de salida de video. Navi 31 (RX 7900 XT) viene con 96 CU, que equivale a 6144 shaders. Sin embargo, veremos que en ciertos medios se dice que la RX 7900 XT viene con 12.288 shaders, esto es porque se obtiene 12.288 shaders ALU en total. Más abajo lo explicamos.

Cada CU se componen de lo siguiente:

4 Texture units -> 384 en total.
1 Ray Accelerator -> 96 en total.
2 unidades IA -> 192 en total.

No obstante, los 96 CU están dividido en 6 shader engines, que dan un total de 192 ROPs.

Por otro lado, tenemos los MCD, que son fabricados en un proceso de 6nm y que, en el caso de Navi 31, vienen 6. Dentro de cada uno encontramos el controlador de memoria GDDR6 con un ancho de 64 bits/chiplet, junto con la Infinity Cache de 16 MB. Sumando todo, en Navi 31 tenemos 384 bits de bus de memoria y 96 MB de Infinity Cache.

Para terminar, la interconexión de los complejos GCD y MCD se realiza a través de Elevated Fanout Bridge, que es algo similar a Intel EMIB.

Compute Units mejorados y más AI units

Empezando por los CUs, ahora tienen 128 Stream Processors cada uno y obtiene 12.288 shaders ALU. Comparándolo con RDNA 2, tenemos el doble de rendimiento en FP32, pero nos genera la duda de si tenemos 6144 shaders o 12288 shaders.

El “lío” viene por la forma de contabilizar las unidades por parte de AMD, ya que separan los Stream Processors (shaders) de los CU, diciendo que la GPU tiene 6144 SP y 96 CUs en la RX 7900 XT.

También hay que decir que las unidades IA o AI units, de las que hemos hablado antes, han duplicado su rendimiento porque los AI Matrix Accelerators comparten algunos recursos. Es decir, las unidades IA son compatibles con instrucciones BF16, y INT4 WMMA Dot4, habiendo un aumento general de 2.7 veces en la velocidad de operación.

¿De dónde proviene? De todo un poco: aumento general del rendimiento por reloj de un 17.4%, más un 20% de CU y el doble de unidades SIM32 por CU.

WGP llega como nuevo protagonista

Denominado “WorkGroup Processor” o procesador de grupo de trabajo, es una parte hardware nueva que está dentro de un CU. Dentro de la arquitectura AMD RDNA 3, un WGP equivale de 2 CUs, y es que cada CU contiene 2 ALU y vectors units o unidades vectoriales.

Resumiendo lo explicado anteriormente, un CU actual tiene el doble de recursos que un CU de RDNA 2. Por tanto, desde AMD no es que se haya aumentado piezas hardware conscientemente, sino que se ha dotado a cada shader del doble de unidades funcionales.

Interconexión en la caché más rápida y más grande

Una de las grandes novedades de RDNA 3 es cómo AMD sigue incidiendo en la memoria caché como solución para aumentar los FPS de sus Radeon RX 7000. En este sentido, solo hemos visto actualizaciones:

El doble de caché L0.
El doble de caché L1.
Caché L2 1.5 veces más grande.

Respecto al enlace entre las Processing units y la caché L1 es 1.5 veces más ancho; asimismo, el enlace entre L1 y L2 también es 1.5 veces más ancho.

Infinity Cache, que viene a ser la caché de nivel 3 (L3), tenemos menos que en RDNA 2. La Radeon RX 7900 XT trae 80 MB, mientras que la RX 6900 XT viene con 128 MB. Por el contrario, el bus de la primera es de 320-bit, mientras que el bus de la segunda es de 256-bit.

AMD no podía instalar GDDR6X porque es una tecnología exclusiva de Micron y NVIDIA, por lo que ha tenido que “arreglárselas” con una GDDR6 más optimizada. Ahora, tiene hasta 6 interfaces de 64 bits, que dan como resultado 384 bits. Además, la velocidad ahora viene con 20 Gbps, por lo que logra reducir la brecha con NVIDIA.

Al final, esta Infinity Cache de “3ª generación” tiene una capacidad más baja que Navi 21, pero se ha optimizado tanto que se almacenan datos a los que la GPU accede más eficiente, eliminando el tráfico a la memoria principal y consumiendo menos energía.

Ray Accelerators de 3ª generación en RDNA 3

Esta es una carrera a la que AMD llega tarde, pero no se pueden, ni se deben rendir. Desde AMD se ha dicho que, con las nuevas funciones, mayor frecuencia y más Ray Accelerators, consiguen ofrecer un aumento de rendimiento de hasta 1.8 veces para Ray Tracing si lo comparamos con RDNA 2.

El problema para el “equipo rojo” es que NVIDIA ha conseguido duplicar el rendimiento Ray Tracing con sus RTX 4000, por lo que parece que seguirá siendo un territorio con dominio del “equipo verde”.

Según AMD, se ha mejorado la eficiencia en cargas de trabajo Ray Tracing muy pesadas. Dicho literalmente por ellos, es como “aprovechar al máximo cada rayo”. La pregunta es, ¿cómo? Pues, eliminando de forma pronta los subárboles, dotar de soporte de hardware para DXR Ray Flags y un nuevo algoritmo de programación de 2 etapas para descartar rayos vacíos.

FidelityFX Super Resolution 3

Aunque no saldría hasta 2024, se anunció conjuntamente con las AMD Radeon RX 7900, una GPU que podéis encontrar en nuestra tienda. Lo mejor que podemos hacer es redirigiros a nuestro post sobre FSR 2 para conocerlo en más detalle.

Nosotros ya tenemos las AMD Radeon RX 7900 XT y 7900 XTX, ¿a qué esperas a jugar cómo te mereces?

post

Arquitectura RDNA 3, el corazón de las GPU AMD Radeon RX 7000

AMD RDNA 3: las grandes novedades de RX 7000

Las primeras GPU chiplet de la historia

Graphics Compute Die (GCD) y Memory Cache Die (MCD)

Compute Units mejorados y más AI units

WGP llega como nuevo protagonista

Interconexión en la caché más rápida y más grande

Ray Accelerators de 3ª generación en RDNA 3

FidelityFX Super Resolution 3

XFX AMD Radeon RX 7900XT Gaming 20GB GDDR6

ASUS Dual AMD Radeon RX 7900 XTX OC Edition 24GB GDDR6

Gigabyte Radeon RX 7900 XTX GAMING OC 24GB GDDR6

Tarjeta Gráfica AsRock Radeon RX 7900 XTX 24GB GDDR6 Triple Ventilador RGB