AMD Ryzen AI Halo quiere convertir tu PC en una estación local de IA
AMD Ryzen AI Halo llega en un momento en el que hemos empezado a asumir algo casi como una ley no escrita de la inteligencia artificial moderna: si quieres potencia de verdad, necesitas la nube. Chatbots generación de imágenes, agentes autónomos o grandes modelos de lenguaje suelen depender de enormes centros de datos remotos, conexiones permanentes y recursos computacionales que, sencillamente, parecían quedar fuera del alcance de un ordenador personal. La IA avanzada, en cierto modo, se ha acostumbrado a vivir lejos de nosotros, en servidores invisibles repartidos por medio planeta.
Pero quizá estemos empezando a ver un pequeño cambio de dirección. En lugar de asumir que todo debe ejecutarse remotamente, algunas compañías empiezan a explorar hasta dónde puede llegar la inteligencia artificial cuando vuelve al dispositivo local. No como una simple función integrada en el sistema operativo o una herramienta puntual, sino como una plataforma capaz de ejecutar cargas de trabajo mucho más ambiciosas directamente desde el propio equipo.
Y ahí es precisamente donde entra en juego AMD Ryzen AI Halo. La nueva propuesta de AMD no parece limitarse a añadir más potencia para funciones de IA convencionales, sino que apunta hacia algo bastante más ambicioso: convertir el PC en un entorno preparado para trabajar con modelos generativos avanzados, agentes locales y flujos de trabajo que, hasta hace relativamente poco, parecían depender inevitablemente de la nube.
AMD Ryzen AI Halo: mucho más que un nuevo procesador
Aunque AMD Ryzen AI Halo se presenta como una plataforma para desarrolladores de inteligencia artificial, reducirla a esa etiqueta sería quedarse bastante corto. Lo que AMD ha puesto sobre la mesa parece más cercano a una nueva categoría de hardware orientada a inferencia local avanzada, donde CPU, GPU y NPU dejan de actuar como piezas independientes para convertirse en un sistema pensado específicamente para mover cargas de trabajo de IA generativa de gran tamaño sin depender constantemente de infraestructura remota.
La punta de lanza inicial será el Ryzen AI Max+ 395, cuya preventa arrancará en junio de 2026 con un precio de partida de 3.999 dólares. Sobre el papel, hablamos de un procesador basado en arquitectura Zen 5 con 16 núcleos y 32 hilos, una frecuencia base de 3,0 GHz y capacidad para alcanzar hasta 5,1 GHz en modo Boost. Pero lo realmente interesante no está solo en el músculo bruto de CPU, sino en cómo AMD ha articulado el resto del silicio alrededor de las necesidades concretas de la IA moderna.
El chip integra una GPU Radeon 8060S basada en RDNA 3.5 con 40 unidades de cómputo, acompañada por una NPU XDNA 2 capaz de alcanzar 50 TOPS. Y aquí conviene hacer una pausa, porque la lectura simplista de los TOPS suele resultar engañosa. La ejecución de modelos generativos avanzados no depende únicamente de aceleradores dedicados; también exige capacidad de cómputo paralelo, ancho de banda de memoria y suficiente flexibilidad para repartir distintos tipos de carga entre CPU, GPU y NPU. En otras palabras, AMD no parece haber diseñado Halo para ejecutar únicamente funciones de IA integradas en Windows, sino para sostener flujos de inferencia considerablemente más complejos.
Ese planteamiento ayuda a entender otra de las decisiones más llamativas de la plataforma: el soporte para hasta 128 GB de memoria unificada LPDDR5x. En un escenario tradicional de PC esto podría parecer desproporcionado, pero cuando se trabaja con modelos de lenguaje grandes o sistemas multiagente, la memoria deja de ser un extra y pasa a convertirse en uno de los principales factores limitantes. A ello se suma un cTDP configurable entre 45 y 120 vatios, una amplitud poco habitual que sugiere desde configuraciones relativamente contenidas hasta implementaciones mucho más cercanas a estaciones de trabajo compactas.
Junto al Max+ 395 llega también la nueva familia Ryzen AI Max PRO 400, orientada a PCs comerciales con IA, estaciones de trabajo móviles y sobremesas de pequeño formato. La serie queda formada por tres variantes: el Ryzen AI Max+ PRO 495, con 16 núcleos, 32 hilos, hasta 5,2 GHz, 80 MB de caché total, gráficos Radeon 8065S de 40 CUs y una NPU de 55 TOPS; el Ryzen AI Max PRO 490, que reduce la configuración a 12 núcleos y 24 hilos, manteniendo gráficos Radeon 8050S de 32 CUs; y el Ryzen AI Max PRO 485, con 8 núcleos y 16 hilos, pensado para equipos más contenidos, aunque sin renunciar a aceleración dedicada para IA.

El dato que cambia la conversación: más de 300.000 millones de parámetros en local
Hasta aquí, AMD Ryzen AI Halo podría interpretarse como otra iteración especialmente musculada dentro de la creciente fiebre por los “AI PCs”. Pero hay un dato concreto que cambia bastante la conversación y ayuda a entender por qué AMD insiste tanto en esta plataforma: la compañía asegura que su nueva serie Ryzen AI Max PRO 400 es el primer procesador cliente x86 capaz de ejecutar localmente modelos de más de 300.000 millones de parámetros. Dicho de otro modo, hablamos de un salto de escala que se sitúa bastante por encima de lo que solemos asociar a cargas de trabajo domésticas o incluso profesionales ejecutadas en un PC convencional.
Y aquí conviene detenerse un momento, porque la cifra puede resultar espectacular, pero también algo abstracta. En términos simples, el número de parámetros suele actuar como un indicador aproximado de complejidad y capacidad de un modelo de lenguaje. Cuantos más parámetros, mayores suelen ser también sus exigencias de memoria, ancho de banda y capacidad de procesamiento. Por eso, mover modelos masivos en un entorno cliente no ha sido tradicionalmente una cuestión de potencia bruta, sino sobre todo de limitaciones físicas: memoria insuficiente, cuellos de botella entre CPU y GPU o dependencia inevitable de sistemas externos.
AMD sostiene que Halo rompe parcialmente ese techo gracias a una combinación de factores. El primero es la cuantización de 4 bits, una técnica que reduce drásticamente los requisitos de memoria de los modelos sin hacerlos inviables para inferencia práctica. El segundo —y probablemente el más importante— está en la arquitectura de memoria de las configuraciones más avanzadas de la serie Ryzen AI Max PRO 400, capaces de alcanzar hasta 192 GB de memoria unificada —frente a los 128 GB del Ryzen AI Max+ 395—, de los cuales hasta 160 GB pueden asignarse como VRAM para cargas gráficas y de inteligencia artificial. En un escenario de inferencia local, eso cambia bastante las reglas del juego: el problema deja de ser únicamente cuántos TOPS ofrece una NPU y pasa a depender de cuántos datos puede mantener el sistema disponibles simultáneamente sin penalizaciones severas.
El alcance práctico de esa capacidad va más allá de ejecutar un único modelo grande. AMD plantea un escenario donde estos sistemas puedan alojar múltiples agentes autónomos trabajando de forma concurrente, algo especialmente relevante para flujos de trabajo complejos basados en automatización, generación de contenido o cadenas de razonamiento multiagente. No se trata únicamente de preguntar algo a un chatbot local, sino de ejecutar varios sistemas especializados colaborando entre sí sin salir del propio equipo.

Mucha potencia en muy poco espacio
Uno de los aspectos más interesantes de la propuesta AMD Ryzen AI Halo es que no parece limitarse a grandes estaciones de trabajo o configuraciones aparatosas. De hecho, parte de la ambición de la plataforma consiste precisamente en empaquetar este nivel de potencia en formatos considerablemente más compactos de lo que uno esperaría al hablar de inferencia local avanzada. Y ahí entra en escena lo que AMD denomina Halo Box, un sistema de factor de forma ultracompacto diseñado para ejecutar estas cargas de trabajo sin necesidad de recurrir a hardware voluminoso o servidores dedicados.
Las dimensiones ayudan bastante a entender el planteamiento: 15 x 15 x 4,3 centímetros. Dicho de otra manera, hablamos de un equipo sorprendentemente pequeño para un hardware capaz de mover modelos generativos avanzados y agentes locales. No es un detalle menor, porque durante años el músculo computacional asociado a IA de cierto nivel ha tendido a traducirse en sistemas grandes, ruidosos y energéticamente exigentes. Halo Box parece querer romper esa asociación, apostando por un formato compacto que, al menos sobre el papel, no obliga a renunciar a demasiada ambición técnica.
La conectividad tampoco parece haber quedado en segundo plano. AMD plantea esta plataforma con Wi-Fi 7, Bluetooth 5.4, múltiples conexiones USB-C, salida HDMI 2.1b y algo especialmente interesante para entornos profesionales o flujos de trabajo intensivos: Ethernet de 10 Gbps. A ello se suma soporte para hasta 2 TB de almacenamiento SSD PCIe Gen 4×4, además de compatibilidad tanto con Windows como Linux, algo especialmente relevante si tenemos en cuenta que buena parte del ecosistema profesional de desarrollo de IA sigue dependiendo enormemente de entornos Linux.
Todo esto ayuda a entender mejor el rango de consumo del propio Halo, configurable entre 45 y 120 vatios según implementación. No parece un detalle casual. Ese margen permite imaginar desde sistemas relativamente contenidos hasta configuraciones considerablemente más agresivas, manteniendo una misma base arquitectónica. Y probablemente ahí resida una de las apuestas más interesantes de AMD: intentar que ejecutar modelos generativos locales deje de parecer un privilegio reservado exclusivamente a laboratorios, centros de datos o workstations masivas.
La pregunta, claro, es si toda esta ambición técnica resulta suficiente para competir con las soluciones que hoy dominan buena parte de la conversación alrededor de la IA generativa. Porque Halo no llega a un mercado vacío. Y AMD parece tener muy claro contra quién quiere medirse.

AMD quiere plantar cara a NVIDIA y Apple
Todo este despliegue técnico tendría poco recorrido si AMD Ryzen AI Halo no pudiera sostenerse frente a alternativas ya existentes. Y AMD parece bastante consciente de ello, porque buena parte de su presentación gira alrededor de comparativas directas con dos rivales muy concretos: NVIDIA en el terreno de la IA profesional compacta y Apple en el segmento de equipos de alto rendimiento con memoria unificada.
Frente al NVIDIA DGX Spark, AMD asegura ofrecer una mejor relación de tokens por segundo por dólar (TPS/$), un indicador especialmente relevante cuando hablamos de inferencia local y ejecución continuada de modelos generativos. La compañía también pone sobre la mesa dos ventajas competitivas bastante claras: compatibilidad con Windows, frente al enfoque exclusivamente Linux de la propuesta de NVIDIA, y la presencia de una NPU dedicada de 50 TOPS, pensada para descargar determinadas cargas de inteligencia artificial sin depender exclusivamente de CPU o GPU.
Las comparativas concretas también apuntan en esa dirección. Según datos de AMD, Halo consigue mejoras de rendimiento de hasta un 4% en Qwen 3.6 (35B), un 14% en GLM 4.7 Flash (30B) y un 12% en Qwen 3.5 (122B) frente a la solución de NVIDIA. Son cifras relativamente contenidas en algunos casos, pero suficientes para respaldar el mensaje que la compañía parece querer construir: la inferencia local avanzada no tiene por qué quedar ligada exclusivamente al ecosistema CUDA o a configuraciones basadas en GPU dedicadas.
La comparación con Apple resulta quizá todavía más ambiciosa. AMD sostiene que Ryzen AI Halo ofrece un rendimiento medio hasta cuatro veces superior en cargas de trabajo de IA generativa frente al Mac Mini con chip M4 Pro, además de una ventaja clara en capacidad de memoria, con configuraciones de hasta 128 GB LPDDR5x frente a los 64 GB de la propuesta de Apple. Pero el argumento más importante probablemente esté en otra parte: AMD asegura que Halo puede ejecutar modelos superiores a 100.000 y 200.000 millones de parámetros que simplemente quedan fuera del alcance práctico del M4 Pro debido a limitaciones de memoria.

El hardware no basta: AMD también quiere un ecosistema IA
Durante años, uno de los grandes problemas del hardware orientado a inteligencia artificial ha sido una realidad bastante incómoda: la potencia por sí sola rara vez basta. Un procesador puede ser extraordinariamente capaz sobre el papel, pero si el software, las herramientas y la compatibilidad no acompañan, el resultado suele quedarse muy lejos de las expectativas. Y AMD parece especialmente consciente de esa lección, porque buena parte de la propuesta de Ryzen AI Halo intenta evitar precisamente ese cuello de botella.
La base del ecosistema pasa por AMD ROCm, la plataforma de software de la compañía orientada a cargas de trabajo de computación acelerada e inteligencia artificial. El objetivo aquí resulta bastante evidente: facilitar que desarrolladores y empresas puedan trabajar con modelos generativos locales sin tener que reconstruir por completo sus flujos de trabajo o depender de configuraciones excesivamente complejas. En otras palabras, AMD quiere que Halo no sea simplemente un hardware potente, sino un entorno utilizable desde el primer momento.
De hecho, la compañía promete compatibilidad desde el día cero con modelos ampliamente utilizados, incluyendo GPT-OSS, FLUX 2 y SDXL, una decisión importante si tenemos en cuenta que uno de los grandes obstáculos de muchas plataformas emergentes suele estar precisamente en el retraso del soporte de software. La intención parece clara: reducir al máximo la fricción de entrada y permitir que el usuario pueda empezar a experimentar con modelos locales avanzados desde el primer día.
AMD también ha intentado abordar otro problema habitual del desarrollo de IA: la complejidad inicial. Para ello introduce los llamados AMD AI Playbooks, una serie de guías prácticas orientadas a facilitar la puesta en marcha de distintas cargas de trabajo. El sistema incluye cinco guías preinstaladas y otras diez disponibles online, cubriendo escenarios como generación de imágenes mediante ComfyUI, automatización con n8n o ejecución de modelos de lenguaje locales utilizando herramientas como LM Studio o Visual Studio Code.
La sensación general es que AMD parece haber entendido algo que durante mucho tiempo jugó en contra de parte de su hardware profesional: no basta con tener un chip potente si el usuario necesita invertir mucho tiempo en averiguar cómo aprovecharlo realmente. Y quizá ahí resida una de las partes más interesantes de la estrategia Halo: no solo intenta acercar la IA generativa local al PC, sino hacer que ese salto resulte algo menos intimidante para quienes quieren empezar a construir sobre ella.
Más información
Puedes consultar la fuente de este artículo aquí