La realidad extendida es la primera carga inalámbrica de mercado masivo que 5G no puede servir a escala. El presupuesto motion-to-photon para una inmersión confortable deja sólo unos pocos milisegundos al enlace radio, la demanda de uplink del tracking inside-out crece de forma lineal con el número de usuarios y el cómputo de edge tiene que vivir dentro de la red de acceso radio en vez de en un centro de datos distante. Cada una de esas restricciones se traduce en una decisión de diseño de 6G que 5G nunca tomó.

Datos clave

  • Objetivo motion-to-photon: por debajo de 10 ms para uso confortable, techo duro a 20 ms antes del cibermareo
  • Presupuesto de latencia RAN para XR: 1-3 ms por sentido, frente a 5-10 ms típicos en 5G NR hoy
  • Stream de downlink: 1-2 Gbps por usuario para VR de calidad cableada, 5-10 Gbps para 8K estereoscópico foveated
  • Demanda de uplink: 100-200 Mbps por usuario para tracking inside-out, eye-gaze, postura de manos y cuerpo
  • Usuarios concurrentes por celda: los objetivos de clase XR son 50-100 en 5G Advanced, 1000+ en supuestos de diseño 6G
  • Cómputo en edge: el offload de render y física requiere GPUs a 1 hop del radio — típicamente en el propio gNB
  • Track 3GPP: los study items de XR-awareness comenzaron en Release 17 (2022), los primeros requisitos XR de 6G se esperan en Release 21 (2028)

La aritmética de latencia que rompe a 5G

La realidad virtual confortable tiene una restricción fisiológica no negociable: los fotones que llegan a los ojos del usuario deben actualizarse en torno a 20 milisegundos tras cualquier movimiento de cabeza, mejorando el confort de forma pronunciada por debajo de 10 ms. Ese presupuesto total cubre la cadena entera — los sensores muestrean la pose de la cabeza, la escena se renderiza, el frame se codifica, el enlace inalámbrico lo entrega, el casco lo decodifica y lo muestra. Cada eslabón de la cadena come milisegundos.

En un casco cableado, el enlace inalámbrico es cero y el presupuesto es holgado. En un casco standalone que renderiza localmente, el presupuesto también es holgado, pero el dispositivo tiene que cargar con el peso de GPU y batería. La clase interesante — de la que depende el metaverso — es el casco inalámbrico que descarga el render a un servidor edge. Eso coloca a la red de acceso radio en el camino crítico, y una celda 5G NR añade 5-10 milisegundos de latencia en despliegues típicos. Réstalo de un objetivo de 10 ms y a toda la cadena de cómputo y display le quedan menos de 5 ms. Incluso con los mejores pipelines de render edge, esto es demasiado ajustado.

6G apunta a 1-3 ms de latencia RAN por sentido. Ese margen es lo que, por primera vez, hace viable el offload XR inalámbrico sin recurrir a hardware dedicado co-ubicado.

El problema del uplink del que nadie habla

La mayoría de la discusión sobre requisitos de red XR se centra en el downlink — la escena renderizada que se transmite al casco. Pero los cascos XR modernos generan un tráfico de uplink enorme que 5G no fue arquitectado para soportar. Cámaras de tracking inside-out a 60-90 fps, streams de eye-gaze a 120 Hz, pose de manos, pose de cuerpo, datos IMU y, cada vez más, datos biométricos como expresiones faciales y estado fisiológico, todos fluyen de vuelta al servidor edge. Un solo usuario puede generar fácilmente 100-200 Mbps de uplink sostenido.

Las configuraciones TDD de 5G están sesgadas al downlink, típicamente 4:1 o 7:3 a favor del downlink. Añadir capacidad de uplink significa o bien reconfigurar el patrón TDD (con coste en throughput de downlink) o pasarse a bandas FDD donde el espectro está fragmentado y a frecuencia más baja. Ninguna de las dos escala a despliegues densos de XR.

6G aborda esto mediante duplexación flexible — incluyendo full duplex en la misma frecuencia con celdas pequeñas — y mediante portadoras dedicadas con sesgo uplink en las bandas sub-terahercio, donde el ancho de banda amplio hace que la asimetría sea menos dolorosa.

Por qué el cómputo edge tiene que vivir en la RAN

El reflejo natural cuando una aplicación necesita baja latencia es «ponla en el edge». Para XR, el edge tiene que estar mucho más cerca de lo que permiten los despliegues MEC actuales. Un round-trip desde el dispositivo del usuario, pasando por un punto de agregación urbano, hasta un servidor MEC en un centro de datos regional, y de vuelta, consume 10-20 milisegundos antes de que ocurra render alguno. Eso destruye el presupuesto de latencia por sí solo.

La arquitectura 6G empuja el cómputo a la propia estación base — a veces llamado «compute-RAN» o «cómputo dentro de la red». Un gNB 6G se diseña para alojar un pequeño pool de GPUs y renderizar frames para los usuarios a los que está sirviendo en ese momento, y luego traspasar el estado de render cuando esos usuarios se mueven a una nueva celda. Esto es una desviación sustancial del modelo 5G, donde el gNB es un puro punto de terminación radio y toda la lógica de aplicación vive en otra parte.

La implicación práctica es que las estaciones base 6G serán mucho más grandes y caras que las de 5G, y la economía de su despliegue depende de la existencia de tráfico XR que genere ingresos. Éste es uno de los problemas del huevo y la gallina que frena los compromisos con los plazos de 6G.

Comunicación y sensado conjuntos para anclajes espaciales

El XR persistente — la promesa fundacional del metaverso de un espacio virtual compartido anclado al mundo real — exige que la propia red entienda la geometría espacial. Hoy esto se hace con visión: SLAM corriendo en el casco, más anclajes en la nube subidos a servicios como ARCore. La precisión es buena para un solo usuario pero se degrada cuando muchos comparten un espacio y la iluminación cambia.

La capacidad de comunicación y sensado conjuntos (JCAS) de 6G usa las mismas formas de onda de radio para transmisión de datos y sensado del entorno. El resultado es un mapa espacial en el lado de la red, actualizado en tiempo real, preciso a centímetros y disponible para todos los usuarios autenticados en esa celda. Para XR multiusuario — colaboración, gaming, formación — esa es la diferencia entre que cada usuario mantenga su propio mapa aproximado y que todos los usuarios compartan una sola verdad autoritativa.

JCAS no es gratis. Requiere formas de onda que sacrifican ligeramente la eficiencia pura de datos para mantener propiedades de sensado, y añade requisitos de cómputo y almacenamiento en RAN. Los operadores la tratarán como un slice antes que como modo por defecto, pero para recintos con uso intensivo de XR como estadios, parques temáticos y centros de formación corporativa, ese slice será la razón completa por la que existe la celda.

Los casos de uso que realmente lo necesitan

No toda aplicación XR requiere 6G. Gaming de un solo usuario con casco standalone funciona bien hoy. La colaboración de oficina con avatares y screen sharing funciona en Wi-Fi 6E. La clase «6G o nada» es más estrecha pero de alto valor.

Recintos inmersivos multiusuario: atracciones de parques temáticos, arenas de esports, VR location-based. Cientos de usuarios en un edificio, cada uno requiriendo motion-to-photon por debajo de 10 ms, compartiendo una escena sincronizada. 5G no puede entregar esa densidad hoy.

Operación remota: robótica quirúrgica, teleoperación de maquinaria pesada, pilotaje de drones a escala. La latencia está acotada de forma dura por la física y la regulación de seguridad. El ancho de banda es moderado, pero el requisito de determinismo es extremo.

Gemelos digitales industriales: trabajadores de fábrica con superposiciones AR que muestran datos de sensores en tiempo real anclados a maquinaria física. Requiere anclajes espaciales de calidad JCAS más actualizaciones por debajo de 5 ms desde la capa IoT de la fábrica.

Comunicación holográfica: el caso de uso de «telepresencia» largamente prometido en el que un participante remoto aparece como un holograma volumétrico. La demanda de downlink es 10-50 Gbps por sesión, el uplink para captura es similar, la tolerancia a latencia es 50-100 ms. 6G es el primer estándar explícitamente diseñado para este perfil.

La conclusión

5G puede hacer XR para un único usuario con enlace cableado a un servidor co-ubicado. 6G es la primera generación celular diseñada para hacer XR a escala, con movilidad y sobre una red compartida. Las decisiones de diseño que las distinguen — espectro sub-terahercio, cómputo dentro de la RAN, comunicación y sensado conjuntos, scheduling determinista — no son mejoras incrementales sino compromisos arquitectónicos que sólo tienen sentido económico si XR se convierte en una categoría de consumo real.

El metaverso sigue siendo un término en disputa, y el mercado de consumo para él no está demostrado. Pero la pregunta de ingeniería está zanjada: si el XR inalámbrico de mercado masivo ocurre, ocurrirá sobre 6G. Los operadores apostando por 6G comercial en 2030 están, en efecto, apostando a que el metaverso llega en un calendario que justifica sus planes de capital. Cualquiera de las apuestas puede salir mal, pero son la misma apuesta.

Frequently Asked Questions

¿Qué es la latencia motion-to-photon y por qué importa para XR?

La latencia motion-to-photon es el tiempo entre el movimiento de la cabeza del usuario y la actualización del píxel correspondiente que llega a sus ojos. Por encima de 20 milisegundos la mayoría de los usuarios sufren cibermareo; el objetivo de confort está por debajo de 10 ms. El XR en red añade a ese presupuesto el tránsito inalámbrico, el render en edge y la entrega del frame, dejando a la red de acceso radio (RAN) sólo unos pocos milisegundos.

¿Puede 5G ejecutar hoy un caso de uso de metaverso?

Para un único usuario con casco cableado y un servidor edge co-ubicado, 5G Advanced puede alcanzar objetivos de clase XR en despliegues controlados. A escala — muchos usuarios simultáneos en un recinto, movilidad de área amplia, uplink sostenido para sensores y biometría — la latencia de RAN de 5G, la densidad de uplink y el determinismo de scheduling se convierten en el cuello de botella. 6G se está diseñando precisamente alrededor de esas brechas, no como una mejora incremental.

¿Cuándo transportará 6G tráfico XR realmente?

3GPP apunta a las primeras especificaciones 6G en Release 21 (2028) con pilotos comerciales en 2029-2030. Los slices 6G optimizados para XR — que combinan espectro sub-terahercio, comunicación y sensado conjuntos (JCAS) y red determinista — no se espera que escalen antes de 2031-2032. Mientras tanto, 5G Advanced (Release 18-20) está añadiendo funciones específicas para XR como XR-awareness en el scheduler y Capability Set 7 para uplink de baja latencia.