Benchmarks de rendimiento AI-RAN 2026

La inteligencia artificial aplicada a las redes de acceso radioeléctrico —AI-RAN— ha pasado de las diapositivas de conferencias a la infraestructura de producción. En el primer trimestre de 2026, tres operadores de primer nivel publicaron resultados independientes de pruebas de campo que comparaban RAN optimizada con IA frente a configuraciones convencionales en hardware idéntico. Por primera vez, la industria cuenta con datos de rendimiento en condiciones equivalentes. Los resultados son dispares: ganancias significativas en algunas áreas, mejoras marginales en otras y algunos casos donde la IA degradó el rendimiento. Este informe compila y analiza todos los benchmarks disponibles públicamente.

Metodología: qué medimos y cómo

Este informe agrega datos de siete fuentes: T-Mobile US (prueba de campo de marzo de 2026, área metropolitana de Denver), Rakuten Mobile (datos de producción del Q4 2025, Tokio), Deutsche Telekom (prueba de febrero de 2026, Berlín), SK Telecom (prueba de enero de 2026, Seúl), Vodafone UK (prueba de marzo de 2026, Londres), benchmarks de la plataforma NVIDIA Aerial (condiciones de laboratorio) y benchmarks de Nokia AirFrame AI (laboratorio + campo). Todos los resultados comparan configuraciones con IA habilitada versus IA deshabilitada en el mismo hardware, eliminando la variabilidad del equipo.

Métricas clave rastreadas: rendimiento de enlace descendente (Mbps por celda), rendimiento de enlace ascendente, latencia media (ms), latencia del percentil 99, eficiencia espectral (bps/Hz), consumo energético (kWh por TB transportado), tasa de éxito de handover y tasa de caída de llamadas. Donde los operadores reportaron métricas distintas, normalizamos a unidades comunes y anotamos las diferencias metodológicas.

Rendimiento: ganancias del +8-22%, muy dependientes del escenario

El número principal que la mayoría de los operadores destacó fue la mejora del rendimiento. En las siete fuentes, AI-RAN ofreció:

Urbano denso (>1.000 usuarios/km²): mejora media del rendimiento de enlace descendente del 15-22%. T-Mobile reportó +18% en el centro de Denver (de 285 Mbps a 336 Mbps de media por celda). SK Telecom midió +22% en el distrito Gangnam durante las horas pico (de 310 Mbps a 378 Mbps).
Suburbano (<500 usuarios/km²): mejora del 8-12%. Deutsche Telekom obtuvo +11% en los distritos periféricos de Berlín. Vodafone reportó +8% en los emplazamientos suburbanos de Londres.
Rural (<50 usuarios/km²): 3-5% —estadísticamente significativo pero operacionalmente menor. El planificador IA tiene menos usuarios sobre los que optimizar, lo que limita las ganancias por diversidad multiusuario.
Interior (empresa/estadio): +25-30% en recintos de alta densidad. El despliegue de Rakuten en el Tokyo Dome mostró +28% durante un partido de béisbol con aforo completo (45.000 dispositivos conectados simultáneamente).

El patrón es claro: la ventaja de AI-RAN en rendimiento escala con la densidad de usuarios. Esto se alinea con el mecanismo subyacente: los planificadores IA explotan la diversidad multiusuario más eficazmente que los algoritmos de reparto proporcional cuando hay muchos usuarios con condiciones de canal diversas entre los que elegir.

Latencia: el resultado más sorprendente

Los resultados de latencia fueron los más contraintuitivos. La latencia media mejoró modestamente (5-15%), pero la latencia del percentil 99 (de cola) —la métrica más relevante para las aplicaciones en tiempo real— mostró una mejora dramática en algunas pruebas y una degradación en otras.

Operador	Cambio en latencia media	Cambio en latencia P99	Notas
T-Mobile US	-12%	-35%	Área metropolitana de Denver, 5G NR n41
Rakuten Mobile	-8%	-42%	Tokio, O-RAN 4G+5G
Deutsche Telekom	-15%	+8%	Berlín, Nokia AirScale
SK Telecom	-10%	-28%	Seúl, Samsung vRAN
Vodafone UK	-6%	+12%	Londres, Ericsson RAN

La divergencia en los resultados de P99 es significativa. Los operadores que utilizan arquitecturas basadas en O-RAN (Rakuten, T-Mobile) observaron grandes reducciones en la latencia de cola, mientras que los que usan stacks de proveedores tradicionales (Deutsche Telekom con Nokia, Vodafone con Ericsson) vieron aumentar su P99. La explicación probable: el Near-RT RIC de O-RAN permite la inferencia de IA dentro del bucle de control de 10 ms, mientras que las arquitecturas propietarias añaden un salto de inferencia adicional que ocasionalmente supera el presupuesto de latencia bajo carga. Se trata de un problema de arquitectura, no de IA, y sugiere que los beneficios de AI-RAN se maximizan en infraestructura desagregada y compatible con O-RAN.

Eficiencia energética: el argumento de negocio definitivo

Si las mejoras en rendimiento y latencia son incrementales, el ahorro energético es transformador —y aquí es donde AI-RAN presenta su argumento de negocio más sólido.

Todos los operadores reportaron reducciones energéticas, con resultados notablemente coherentes:

Optimización del modo de reposo: los ciclos de reposo/activación de celdas controlados por IA redujeron el consumo energético un 18-25% durante los períodos de bajo tráfico (de medianoche a las 6 de la mañana). T-Mobile reportó un ahorro nocturno del 22% en 1.200 emplazamientos en Denver. Deutsche Telekom alcanzó el 25% —la cifra más alta— permitiendo que la IA desactivase capas MIMO individuales en lugar de celdas completas.
Optimización de beamforming: la gestión de haces impulsada por IA redujo el consumo de los amplificadores de potencia un 8-12% durante las horas pico. El despliegue de Samsung vRAN de SK Telecom mostró un ahorro del 11% en horas pico mediante la predicción del movimiento de usuarios y la preorientación de haces en lugar de ajustes reactivos.
Reducción de refrigeración: la menor potencia de salida de RF se tradujo en un ahorro del 5-8% en costes de refrigeración en los emplazamientos de torre. Vodafone reportó una reducción del 7% en refrigeración en 200 macroestaciones en Londres.
Ahorro energético total: en todos los operadores, AI-RAN redujo el consumo energético por emplazamiento un 15-22% de media, lo que equivale a un ahorro anual de $8.000-15.000 por macroestación dependiendo de los costes locales de electricidad.

A escala, estas cifras reconfiguran el caso de inversión. T-Mobile estima $120 millones en ahorro energético anual en toda su red estadounidense si AI-RAN se despliega a nivel nacional. Para la huella europea de Deutsche Telekom, el ahorro proyectado es de 200 millones de euros anuales. El ahorro energético por sí solo justifica el despliegue de AI-RAN en 18-24 meses para la mayoría de los operadores de primer nivel, incluso sin contar las mejoras en rendimiento y latencia.

Eficiencia espectral: +10-18% en condiciones reales

La eficiencia espectral —bits por segundo por Hertz— es la medida fundamental de con qué eficacia utiliza el espectro asignado un sistema de radio. Las mejoras de AI-RAN aquí tienen valor financiero directo, ya que equivalen a disponer de más espectro sin comprarlo.

Resultados por operador:

SK Telecom: mejora de eficiencia espectral del +18% (de 7,2 a 8,5 bps/Hz de media) en la banda 3,5 GHz n78. Es la cifra más alta reportada y refleja el agresivo planificador IA de Samsung, que utiliza un modelo basado en transformers entrenado con 18 meses de datos de red.
T-Mobile: +14% (de 6,8 a 7,8 bps/Hz) en n41 (2,5 GHz). El modelo de IA coordina la planificación simultáneamente en 3 componentes de portadora.
Rakuten: +12% en su espectro compartido 4G/5G. Cabe destacar que el planificador IA reasignó dinámicamente el espectro entre 4G y 5G en tiempo real según la demanda —algo que su planificador tradicional no podía hacer.
Vodafone: +10% (de 5,9 a 6,5 bps/Hz) en 3,5 GHz. La menor mejora, atribuida a que la ya optimizada configuración Ericsson de Vodafone deja poco margen para las ganancias de IA.

Handover y movilidad: resultados mixtos

El rendimiento del handover —la fluidez con la que los usuarios transitan entre celdas— mostró los resultados más inconsistentes entre todas las pruebas. Esta es una métrica crítica para los vehículos conectados y las aplicaciones móviles de VR/AR.

T-Mobile reportó una mejora en la tasa de éxito de handover del 98,2% al 99,1% con predicción de handover asistida por IA. El modelo de IA predice hacia qué celda se moverá un usuario 2-3 segundos antes del evento de handover, permitiendo la preparación anticipada de los recursos de la celda objetivo. Sin embargo, las predicciones erróneas (aproximadamente el 8% de los casos) causaron reserva innecesaria de recursos, aumentando ligeramente la interferencia en las celdas vecinas.

Los resultados de Rakuten fueron más dramáticos: la tasa de fallos de handover cayó del 1,5% al 0,4% en su despliegue en Tokio. Su ventaja: la arquitectura completamente nativa en la nube y compatible con O-RAN de Rakuten permite que el modelo de IA acceda simultáneamente a datos de todas las celdas vecinas, en lugar de depender únicamente de los informes de medición del dispositivo del usuario.

Deutsche Telekom y Vodafone no reportaron cambios estadísticamente significativos en el rendimiento de handover. Ambos operadores señalaron que sus algoritmos de handover existentes ya estaban muy ajustados para los entornos urbanos europeos, y que los modelos de IA no contaban con suficientes datos de entrenamiento para superar décadas de optimización manual.

NVIDIA Aerial: laboratorio frente a la realidad del campo

La plataforma Aerial de NVIDIA —una RAN software con aceleración GPU que funciona sobre los aceleradores convergentes de NVIDIA— publicó benchmarks de laboratorio que afirmaban una mejora del 40% en rendimiento y una reducción del 50% en consumo energético comparado con la RAN tradicional basada en DSP. Estas cifras han sido ampliamente citadas en presentaciones del sector.

Los datos de las pruebas de campo cuentan una historia más matizada. El despliegue de T-Mobile en Denver, que utilizó NVIDIA Aerial en un subconjunto de emplazamientos, mostró una mejora del 18% en rendimiento —menos de la mitad de la afirmación de laboratorio. La brecha se explica por factores del mundo real ausentes en las pruebas de laboratorio: interferencia inter-celda, propagación no ideal, diversidad de dispositivos (las pruebas de laboratorio usan dispositivos de referencia) y la sobrecarga computacional de ejecutar inferencia IA junto con el procesamiento de señal en tiempo real en recursos GPU compartidos.

NVIDIA reconoció la brecha en una publicación de blog de marzo de 2026, señalando que "los benchmarks de laboratorio representan el rendimiento máximo teórico" y que "los despliegues de campo típicamente logran el 40-60% de las ganancias de laboratorio dependiendo de la complejidad del entorno". Esta es una evaluación honesta, y el resultado del 18% en campo cae dentro del rango declarado por NVIDIA.

Lo que NVIDIA Aerial sí entrega consistentemente es flexibilidad operacional. La plataforma admite actualizaciones de modelos por aire, permitiendo a los operadores reentrenar modelos de IA mensualmente a medida que cambian las condiciones de la red. Los proveedores tradicionales de RAN requieren actualizaciones de software con tiempo de inactividad; Aerial actualiza los modelos en segundo plano sin interrupción del servicio.

Nokia AirFrame AI: el enfoque del proveedor establecido

El enfoque de Nokia difiere fundamentalmente del de NVIDIA. En lugar de reemplazar el procesador RAN con GPUs, Nokia añade un acelerador de inferencia IA junto al hardware de banda base existente. El módulo AirFrame AI se conecta a la plataforma AirScale de Nokia y ejecuta modelos entrenados que optimizan la planificación, el control de potencia y el beamforming.

Los benchmarks publicados por Nokia muestran una mejora del 12-15% en rendimiento y un ahorro energético del 18-20% —más conservadores que las afirmaciones de NVIDIA pero más cercanos a lo que los operadores midieron realmente en las pruebas de campo. La prueba de Deutsche Telekom en Berlín, ejecutando Nokia AirFrame AI, logró un 11% de mejora en rendimiento y un 25% de ahorro energético —alineándose bien con el rango declarado por Nokia.

La contrapartida: el enfoque de Nokia requiere vinculación al ecosistema AirScale. Los modelos de IA se entrenan en la plataforma cloud de Nokia y se despliegan a través del sistema de gestión de Nokia. Los operadores no pueden aportar sus propios modelos ni usar frameworks de IA de terceros. Para los operadores comprometidos con la plataforma de Nokia, esto es aceptable. Para quienes persiguen estrategias O-RAN multi-proveedor, es un impedimento insalvable.

Samsung vRAN AI: entrenamiento con datos del operador

La estrategia AI-RAN de Samsung enfatiza el entrenamiento de modelos con datos específicos del operador en lugar de simulaciones de red genéricas. La prueba de SK Telecom utilizó un modelo Samsung vRAN entrenado con 18 meses de telemetría de red propia de SKT —4,2 TB de decisiones de planificación, mediciones de canal y patrones de movilidad de usuarios.

El resultado: SK Telecom logró la mayor mejora de eficiencia espectral (+18%) de cualquier operador en nuestro conjunto de datos. Samsung atribuye esto a la profunda familiaridad del modelo con el entorno de propagación específico de SKT, los patrones de comportamiento de los usuarios y los perfiles de tráfico. Un modelo genérico entrenado con datos sintéticos logró solo +7% en el mismo entorno durante una comparación controlada —confirmando que los datos de entrenamiento específicos del operador son el factor más importante en el rendimiento de AI-RAN.

El enfoque de Samsung tiene una limitación de escalabilidad significativa: cada despliegue en un operador requiere meses de recopilación de datos y entrenamiento de modelos personalizados. Samsung está abordando esto con un marco de aprendizaje federado que permite a múltiples operadores entrenar modelos conjuntamente sin compartir datos brutos, pero este sistema sigue en fase piloto con solo SKT y KDDI participando a partir del Q1 2026.

El marco ML de O-RAN: estandarizando AI-RAN

El marco ML de la Alianza O-RAN, especificado en las especificaciones técnicas de O-RAN WG2, tiene como objetivo estandarizar cómo se entrenan, despliegan y gestionan los modelos de IA en entornos RAN multi-proveedor. A partir de la Versión 3 (finalizada en el Q4 2025), el marco define:

Alojamiento de modelos en Near-RT RIC (inferencia dentro del bucle de 10 ms) y Non-RT RIC (inferencia dentro del bucle de 1 segundo)
Interfaces estándar (A1, E2) para la comunicación modelo-RAN
Gestión del ciclo de vida del modelo: entrenamiento, validación, despliegue, monitorización, reversión
Monitorización del rendimiento y detección de desviación —marcado automático cuando el rendimiento de un modelo desplegado se degrada

El despliegue de Rakuten es la única implementación de producción a gran escala del marco ML de O-RAN. Sus resultados validan la arquitectura: el Near-RT RIC logró una latencia de inferencia inferior a 5 ms en el 99,7% de los intervalos de planificación, confirmando que la optimización IA en tiempo real es factible dentro de las restricciones del bucle de control de O-RAN.

Sin embargo, la interoperabilidad sigue siendo un desafío. En un plugfest de la Alianza O-RAN de febrero de 2026, solo 3 de 8 combinaciones de proveedores ejecutaron con éxito un modelo de IA común en diferentes implementaciones de RIC. La especificación deja suficiente ambigüedad en los formatos de datos e interfaces de modelos como para que las adaptaciones específicas de cada proveedor sigan siendo necesarias.

Análisis de costes: cuánto cuesta realmente AI-RAN

Desplegar AI-RAN no es gratuito. Los operadores enfrentan tres categorías de costes:

Hardware: los aceleradores GPU (NVIDIA A100/H100 para Aerial) o coprocesadores IA (módulo Nokia AirFrame AI) añaden $5.000-15.000 por emplazamiento. Para un operador de primer nivel con 30.000 emplazamientos, el coste de hardware oscila entre $150 y $450 millones.
Infraestructura de entrenamiento: el cómputo en nube para entrenar modelos cuesta $2-5 millones por operador al año. El enfoque específico de operador de Samsung requiere más cómputo de entrenamiento que los modelos genéricos.
Personal: AI-RAN requiere científicos de datos e ingenieros de ML que la mayoría de los operadores no emplea actualmente. El tamaño típico del equipo es de 15-30 especialistas, con un coste salarial anual de $3-8 millones.

Frente a estos costes, el ahorro energético por sí solo ($120-200 millones anuales para un operador de primer nivel) produce un ROI positivo en 2-3 años. Añadiendo el incremento de ingresos por la mejora del rendimiento y la capacidad (estimado en un aumento del ARPU del 3-5% por mejor experiencia de usuario), el período de recuperación se reduce a 18 meses.

Perspectivas: qué cambiará en 2027

Tres desarrollos transformarán los benchmarks de AI-RAN en los próximos 12 meses:

1. Modelos fundacionales para RAN: tanto NVIDIA como Ericsson han anunciado enfoques de "modelo fundacional" —grandes modelos de IA preentrenados con datos de red diversos que pueden ajustarse a operadores específicos con datos adicionales mínimos. De tener éxito, esto eliminaría el cuello de botella de recopilación de datos de Samsung y democratizaría AI-RAN de alto rendimiento.

2. Diseño AI-nativo para 6G: el Estudio de Ítem de 3GPP sobre IA/ML para NR (Versión 19, prevista para el Q3 2026) estandarizará los formatos de intercambio de modelos IA y los requisitos de rendimiento. Esto crea una línea base común para comparar implementaciones AI-RAN entre proveedores —algo que hoy no existe.

3. Hardware de inferencia en el borde: los chips de inferencia de próxima generación (NVIDIA Blackwell, Qualcomm Cloud AI 200, Intel Gaudi 3) reducirán el coste de hardware por emplazamiento entre un 40-60% mientras duplican el rendimiento de inferencia. Esto aborda la principal barrera para el despliegue universal de AI-RAN: la economía a nivel de emplazamiento.

Los benchmarks de 2026 establecen una línea de base. AI-RAN ofrece beneficios medibles y reproducibles —pero la magnitud varía significativamente según la arquitectura, el proveedor y el entorno. Los ganadores serán los operadores que inviertan en infraestructura de recopilación de datos y arquitecturas compatibles con O-RAN que maximicen la capacidad de la IA para optimizar en tiempo real. La tecnología funciona. La pregunta ya no es si la IA mejora la RAN —sino cuánto, dónde y a qué coste.