Qué es un NPU (Neural Processing Unit)
El NPU es un chip especializado en algoritmos de Machine Learning, sobretodo enfocado al Deep Learning por ser uno de los modelos IA más boyantes en esta década. Popularmente es el llamado “procesador neuronal” y su nombre va cambiando según la empresa o marca.
Dentro de este NPU encontraremos núcleos (cores) que se encargan de las tareas especializadas en IA, no de aquellas que se encarga la CPU. Es importante diferenciarla porque no es lo mismo, ni la NPU se suele localizar dentro de la CPU, sino que los propósitos de estas unidades son diferentes.
Eso sí, toda esta potencia requiere de memoria caché, así que poco a poco vamos a ver cómo las marcas van a consumir más este tipo de memoria.
Ahora diréis, ¿qué es una NPU para cada marca? Las marcas hablan:
- Qualcomm dice que la NPU se dedica al procesamiento de IA para mejorar el rendimiento/vatio.
- Huawei también se refiere como un chip que permite resolver tareas a más velocidad disminuyendo el consumo y mejorando la autonomía.
- Apple apunta a la NPU como una especie de GPU que acelera operaciones de red neuronal (convoluciones y multiplicación de matrices).
- AMD tiene su NPU en CPU (con arquitectura XDNA) y en GPU tienen aceleradores IA (AI Accelerators). Su NPU ofrece una mayor densidad de cálculo en comparación con las arquitecturas tradicionales . Los procesadores AMD Ryzen de las series 7040 y 8040 se basan en las NPU AMD XDNA y los núcleos AMD "Zen" para ofrecer una aceleración de la IA líder en los PC.
- Intel considera la NPU como una unidad que otorga a la CPU de capacidades IA de bajo consumo que son compatibles con interfaces OpenVINO.
- Samsung dice que está considerada para operaciones matriciales simultáneas, además de aprender basándose en los datos acumulados.
Concretamente, vemos las menciones de NPU en SoC, no en procesadores x86, aunque ya os aviso que no falta mucho para verlas integradas.
Podría decirse que ha cogido relevancia desde que Apple apostó por implementar la IA en sus chips “M” por allá en 2020. Aun así, decir que el primer ANE (Apple Neural Engine) llegó con el A11 del iPhone X, siendo esencial para tareas como el Face ID o el Animoji.
¿Apple es pionera con ello? No, pero es especialista en coger invenciones interesantes y exprimirlas al máximo. El acelerador “IA” fue creado hace muchos años, siendo Intel una de las empresas que más insistió en los 90. Se puede decir que las NPU han subido como la espuma debido al impacto de la inteligencia artificial en el procesamiento de datos.
De ahí que Qualcomm y Huawei sean de las primeras empresas en implementar la NPU en sus chips, ya que diseñan sus propios SoC para smartphones. Apple lanzó su M1 con el famoso Apple Neural Engine, que era un grupo de núcleos especializados para tareas de Machine Learning.
Por el momento, Intel y AMD van a implementar esta tecnología seriamente en CPU x86.
Las tareas que realiza una NPU
Entonces, sabemos que el NPU se dedica a tareas relacionadas con la IA, el Machine Learning y operaciones súper complejas. Pero, ¿de qué tareas hablamos? Apple las enfoca a estas, y estoy seguro de que las demás marcas también:
- Clasificación de imágenes. Quienes tengáis iPhone veréis que en la galería nos clasifican fotos en forma de vídeos o nos hacen recomendaciones. Además, el buscador de fotografías es muy interesante.
- Traducción automática. Cuando tenemos el teclado en español, pero ponemos una palabra en inglés y nos sale una sugerencia corregida ortográficamente en el mismo idioma.
- Sugerencias de usos de apps. En el caso de iOS, registra nuestro uso diario, se entrena y Siri nos ofrece sugerencias de uso según los hábitos que hemos tenido a unas horas determinadas. Por ejemplo, si son las 22:00 y siempre vemos Twitch en el móvil mientras cenamos, el día que no lo hagamos nos lo puede sugerir.
- Procesamiento de lenguaje natural. Esto es el reconocimiento de voz más rápido, dictado para Siri, Google Lens, etc.
- Realidad aumentada.
- Detección de rostros, algo muy usado en la galería de iPhone.
- Efectos de cámara.
- Smart HDR y muchas funcionalidades en fotografía con las cámaras.
La pregunta es, ¿qué tareas nos va a aportar a nivel CPU en el futuro? Sabemos que Intel está implementando el NPU en sus CPU, así como AMD ya está integrando Ryzen AI (antiguas unidades XIE de Xilinx) en los procesadores.
Pues bien, aplicado en el ámbito del CPU x86, podrían aprovechar funciones de Windows Copilot, un asistente para tareas reiteradas y cotidianas. Microsoft se ha inspirado un poco en los smartphones porque las tareas IA tienen que ver con emails y fotografías:
- Quitarle o difuminarle el fondo a una foto.
- Clasificar fotografías.
- Usar el Paint con capas a lo “Photoshop”.
- Reconocimiento de voz o una especie de chatbot al que le podemos solicitar prompts y con ellas hacer o programar tareas:
- Ponernos música.
- Organizar las ventanas.
- Poner modo oscuro.
- Resumir un texto.
- Escribir contenido.
- Recortar imágenes o quitarle el fondo.
- Crear Reels.
Al final, veis que Microsoft se centra en lo mismo que Apple: funciones multimedia.
¿La NPU puede ayudar a mejorar los FPS del juego?
Intel ha visto la NPU como una opción interesante para optimizar aplicaciones intensivas y evitar que los portátiles se queden sin batería. Van a conectar la NPU a un chip Meteor Lake (15th Gen), funcionando con 2 motores de computación neuronal: cada uno puede trabajar con su carga o ambos abordar a la vez una misma carga.
Esta NPU estará separada y aparecerá en el administrador de tareas con la CPU y GPU. En COMPUTEX demostraron el impacto de la NPU cuando una GPU debe realizar una tarea. Sin la NPU, la GPU tardaba 14.5 segundos en completar las iteraciones de Stable Diffusion consumiendo 37 W. La NPU completaba la tarea en 20.7 segundos, pero solo se consumían 10 W. ¿Y si juntamos ambas? 11.3 segundos y 30 W menos.
Podría decirse que, si solo vamos a usar la GPU del procesador Intel, podría ayudarla a mejorar ligeramente los FPS. Cuestión distinta es cuando usamos una GPU dedicada de AMD o NVIDIA, y ahí sí que considero que no va a haber mejora en los FPS.
En ese aspecto, ya tenemos los Tensor Cores en NVIDIA, que vendría a asemejarse a una NPU, pero sin llegar a serlo. Recordad que ésta unidad actúa independientemente, mientras que los Tensor Cores están dentro de una GPU.
Sea como fuere, que sepas que si tienes un smartphone de 2021 en adelante, tienes una NPU especializada que se va a encargar de una serie de tareas que tú mismo/a no te das cuenta. Trabaja en segundo plano y busca optimizar tareas.
Finalmente, puedes ver la potencia de este chip en cualquiera de los smartphones que se venden hoy día, ¡la cosa está difícil!