PcComponentes
Mi Cuenta

Intel Xe-HPG, la arquitectura que da vida a las tarjetas gráficas Arc

Componentes
Ángel Aller - Última actualización: 4 de junio de 2024

Intel comienza por la puerta grande con Xe-HPG, una arquitectura caracterizada por incluir Render Slices, Xe Cores, motores XMX, motores Vector y las famosas Ray Tracing Units. Las primeras tarjetas gráficas basadas en esta estructura son las Arc Alchemist, ¿marcarán época?

Intel Xe-HPG

Arquitectura Intel Xe-HPG

Como siempre hacemos, vamos a desmenuzarla paso a paso para entender cómo saca Intel todo el jugo a las GPUs fabricadas en 6 nm y a los chips de memoria GDDR6 que utiliza. 

Render Slice, el pilar central

intel xe-hpg arquitectura

Los Render Slices son los bloques hardware principales donde encontramos todo el meollo de potencia. Vienen a ser una especie de complejos hardware similares a los que vemos en las Compute Units (CUs) o en los Stream Multiprocessors (SM) de NVIDIA. 

Vemos que Intel lo detalla en las especificaciones de las Arc A770 y A750, por lo que vamos a ver de qué se componen. 

  • Un Render Slice contiene lo siguiente:
    • 4 núcleos Xe. 
    • 4 Ray Tracing Units. 
    • Todos los bits necesarios.

Efectivamente, nos salen las cuentas y siempre veremos en estas GPUs los mismos Xe-Cores y Ray Tracing Units. Por ejemplo, la A770 tiene 8 Render Slices, lo que da 32 Xe Cores y 32 Ray Tracing Units. 

Xe-Cores, la potencia principal

intel xe-cores

Conforme vamos ampliando la diapositiva principal de la arquitectura Xe-HPG, veréis que hay unidades hardware dentro de otras unidades hardware, así consecutivamente. Hemos pasado de los Render Slice a los Xe-Cores, que se encuentran dentro de los primeros. 

  • Dentro de un Xe-Core se encuentra lo siguiente:
    • 16 motores vectoriales XVE de 256 bits: realizan tareas de rasterización. 
    • 16 motores XMX de 1024 bits: efectúan tareas de Machine Learning.
    • 192 KB de caché L1 compartida. 

Al igual que ocurre con los Render Slices, siempre tendremos los mismos XVE y XMX engines por cada Xe-Core. Viendo que la memoria caché ha tomado un gran papel en GPU, deciros que Intel comparte 192 KB entre los motores internos de cada Xe-Cores. 

Por último, deciros que los Xe Cores tienen una unidad que se encarga de clasificar los procesos (Thread Sorting Unit) para su procesamiento más eficiente. Su objetivo es ayudar a los shaders en las tareas de Ray Tracing. 

XMX Engines y XVE, los nuevos protagonistas

Primero, tenemos a los XVE que hacen una tarea parecida a los Tensor Cores de NVIDIA: tareas de Machine Learning. Estas tareas permiten que disfrutemos de Intel XeSS en su máximo esplendor, así como funciones de cámara virtual o Hyper Compute. Debemos entender que los motores XVE están conectados con los motores XMX.

En segundo lugar tenemos a los núcleos XMX, que pueden calcular hasta 256 operaciones MAC por reloj para INT8. Luego, explicaremos ómo funciona Intel XeSS porque puede ser ejecutado en tarjetas gráficas NVIDIA o AMD que no tienen XMX Engines. 

Antes hemos dicho que cada Xe-Core tiene 16 XMX y XVE, los cuales se ejecutan a la vez y se ocupan de tareas FP o INT. 

Intel XeSS, el reescalado más parecido a DLSS

intel xess

Aunque ya hicimos el post de Intel XeSS, procederé a explicarlo brevemente porque debe tener su espacio aquí también. Es otra tecnología de reescalado cuyo fin principal es aumentar los FPS y minimizar la pérdida de calidad de imagen original respecto a la final.

Lo que importa aquí es cómo funciona XeSS:

  • La iluminación y el ráster se renderizan a una resolución baja. 
  • Cada frame contiene unos datos, y estos datos junto con los XVE alimentan al algoritmo de escalado. 
    • El escalador también toma los datos temporales de los frames procesados y una IA ya entrenada reconstruye los detalles con mayor calidad.
  • Se procesa mediante el renderizador. 
  • Se aplica la resolución nativa. 

Xe Media Engine, no falta el códec AV1

arquitectura xe-hpg

Esto motor no se encuentra dentro de los Xe-Cores, sino que está en otra zona del die, caracterizándose por dotar de los soportes de codificación y decodificación 8K HDR, HEVC, VP9 o el gran códec AV1

También hablamos de dicho códec, el cual daba grandes ventajas frente a sus rivales en términos de rapidez. Intel aseguró que la aceración por hardware de AV1 que han trabajado con Arc es 50 veces más rápida que otras, o puede dar imágenes de transmisión más claras sin alterar la tasa de bits. 

Los portátiles potenciados con Intel Core tienen la función Hyper Encode a través de la suite Deep Link. Esto nos pareció interesante porque recuerda un poco a Smart Access Memory de AMD: aprovecha la potencia de CPU y GPU para lograr mejores resultados en vídeo.

Xe Display Engine, con DisplayPort 2.0

xe display engine

El broche final de la arquitectura Xe-HPG es el motor que da las salidas de vídeo y el soporte de resoluciones realmente altas a grandes hercios. Concretamente, tendremos HDMI 2.0b y DisplayPort 2.0, llamándonos la atención que no tengamos HDMI 2.1. 

Entendemos que la apuesta es HDMI 2.0 vista la gran cantidad de monitores y televisores con esta especificación, pero DisplayPort 2.0 es más complicado de asimilar. Todavía hay pocos monitores con este puerto y, en mi opinión, es más interesante HDMI 2.1, salida por la que apuestan AMD y NVIDIA.

Por nuestra parte, solo queda que echéis un vistazo a las Intel Arc A770 y A750 para poner en práctica todo lo explicado, ¡dales una oportunidad!

post