扩展现实是第一个 5G 无法在规模上承载的大众级无线工作负载。舒适沉浸的 motion-to-photon 预算只给无线链路留下几毫秒,inside-out 追踪带来的上行需求随用户数线性增长,而边缘算力必须驻留在无线接入网(RAN)内部,而不是远端的数据中心。每一条约束都对应一个 6G 的设计选择 —— 而这些 5G 都没有做。

关键事实

  • Motion-to-photon 目标:舒适使用低于 10 毫秒,在晕动症出现前的硬上限是 20 毫秒
  • XR 的 RAN 时延预算:单向 1—3 毫秒,而今天 5G NR 典型为 5—10 毫秒
  • 下行流:有线品质 VR 每用户 1—2 Gbps,foveated 8K 立体渲染每用户 5—10 Gbps
  • 上行需求:每用户 100—200 Mbps,用于 inside-out 追踪、eye-gaze、手部和身体姿态
  • 每小区并发用户:5G Advanced 中 XR 级目标为 50—100,6G 设计假设为 1000+
  • 边缘算力:渲染和物理卸载需要离无线 1 跳以内的 GPU —— 通常就在 gNB 本体
  • 3GPP 进程:XR-awareness 立项始于 Release 17(2022 年),早期 6G XR 需求预计在 Release 21(2028 年)

击垮 5G 的时延算术

舒适的虚拟现实有一个不可妥协的生理约束:抵达用户眼睛的光子,必须在头部任意一次移动后大约 20 毫秒内完成更新,在 10 毫秒以下舒适度急剧改善。这个总预算覆盖了整条链路 —— 传感器采样头部姿态、场景渲染、帧编码、无线链路交付、头显解码并显示。链路上的每一环都在吞食毫秒。

在有线头显上,无线链路为零,预算很宽裕。在本地渲染的一体机头显上,预算同样宽裕,但设备必须背负 GPU 和电池的重量。真正有意思的那一类 —— 元宇宙赖以为生的那一类 —— 是把渲染卸载到边缘服务器的无线头显。这就把无线接入网放到了关键路径上,而典型部署中 5G NR 的小区会贡献 5—10 毫秒时延。从 10 毫秒目标中扣掉这一部分,整条计算与显示链路就只剩不到 5 毫秒。即便采用最优秀的边缘渲染流水线,这也太紧了。

6G 的设计目标是单向 1—3 毫秒的 RAN 时延。正是这份余量,让无线 XR 卸载首次可以在不依赖同址专用硬件的情况下落地。

没有人谈起的上行问题

关于 XR 网络需求的大多数讨论都聚焦在下行 —— 渲染场景流向头显。但现代 XR 头显会产生 5G 在架构上根本没考虑过的巨大上行流量。60—90 fps 的 inside-out 追踪摄像头、120 Hz 的 eye-gaze 流、手部姿态、身体姿态、IMU 数据,以及越来越多的生物特征数据(如面部表情和生理状态),都要回流到边缘服务器。一个用户就能轻松产生持续 100—200 Mbps 的上行。

5G 的 TDD 配置以下行为主,典型 4:1 或 7:3 偏向下行。要扩大上行容量,要么重新配置 TDD 模式(以下行吞吐为代价),要么转到频谱碎片化、频率较低的 FDD 频段。两者都无法支撑高密度的 XR 部署。

6G 通过灵活双工解决这一问题 —— 包括在小区尺寸较小的情况下采用同频全双工 —— 同时在 sub-THz 频段提供专用的上行偏重载波,在那里宽带宽让这种不对称变得不那么痛。

为什么边缘算力必须驻留在 RAN

当应用需要低时延时,本能的反应是「放到边缘上」。对 XR 来说,这个边缘必须比现有 MEC 部署允许的还要近。从用户设备出发,经过城市汇聚点,到达区域数据中心里的 MEC 服务器,再返回 —— 还没开始渲染就已经消耗 10—20 毫秒。光这一项就摧毁了整个时延预算。

6G 架构把算力推进到基站本身 —— 有时被称为「compute-RAN」或「网络内计算」。6G 的 gNB 被设计为容纳一小池 GPU,为它当前服务的用户渲染帧,并在这些用户切换到新小区时移交渲染状态。这与 5G 模型有实质性的偏离 —— 在 5G 模型里,gNB 是纯粹的无线终结点,所有应用逻辑都在别处。

实际后果是,6G 基站会比 5G 基站显著更大、更贵,其部署经济性取决于是否存在能带来收入的 XR 流量。这正是阻碍各方对 6G 时间表做出承诺的「鸡和蛋」问题之一。

空间锚点背后的联合通信与感知(JCAS)

持久化的 XR —— 也就是元宇宙关于「锚定在真实世界之上的共享虚拟空间」的根本承诺 —— 要求网络本身理解空间几何。今天这件事靠视觉完成:头显上跑 SLAM,加上上传到 ARCore 这类服务的云锚点。单用户场景下精度尚可,但当多用户共享空间且光照变化时就会退化。

6G 的联合通信与感知(JCAS)能力,用同一套无线波形完成数据传输和环境感知。结果是一份实时更新、厘米级精确、对所有认证到该小区的用户开放的网络侧空间地图。对于多用户 XR —— 协作、游戏、培训 —— 这就是「每位用户各自维护一份近似地图」和「所有用户共享一份权威基准」之间的差别。

JCAS 不是免费的。它要求波形在纯数据效率上稍作让步,以保留感知特性,同时也增加了 RAN 的算力和存储需求。运营商会把它当作切片而非默认模式来交付,但对于 XR 密集的场馆 —— 体育场、主题公园、企业培训中心 —— 这一切片恰恰就是小区存在的全部理由。

真正需要这一切的用例

并不是每个 XR 应用都需要 6G。一体机头显上的单用户游戏今天就跑得很好。带头像和屏幕共享的办公协作在 Wi-Fi 6E 上就够了。属于「非 6G 不可」的那一类用例较窄,但价值很高。

多用户沉浸式场馆:主题公园项目、电竞馆、location-based VR。建筑内数百用户,每人都要求 motion-to-photon 低于 10 毫秒,共享一个同步场景。5G 今天无法提供这种密度。

远程操作:外科机器人、重型设备遥操作、无人机规模化驾驶。时延受物理和安全监管硬性约束。带宽适中,但确定性要求极高。

工业数字孪生:工厂工人佩戴 AR 叠层,实时传感器数据锚定在物理机械上。需要 JCAS 级别的空间锚点,加上来自工厂 IoT 层的 5 毫秒以下更新。

全息通信:承诺已久的「远程临场」用例 —— 远端参与者作为体三维全息出现。每会话下行需求 10—50 Gbps,采集端上行类似,时延容忍度 50—100 毫秒。6G 是第一个明确为这一档需求设计的标准。

结论

5G 可以为单用户、有线接入到同址服务器的场景跑通 XR。6G 是第一个被设计为在规模上、带移动性、跨共享网络支撑 XR 的蜂窝代际。把它们区分开的设计选择 —— sub-THz 频谱、RAN 内算力、联合通信与感知、确定性调度 —— 不是渐进式改进,而是只有当 XR 真正成长为大众消费品类时才在经济上说得通的架构性承诺。

元宇宙仍是一个有争议的词,其消费市场尚未被证明。但工程问题已经定论:如果大众级无线 XR 真的发生,它就会发生在 6G 上。押注 2030 年商用 6G 的运营商,实际上是在押注元宇宙按时到来,从而支撑其资本计划。两个赌注都可能错,但本质上是同一个赌注。

Frequently Asked Questions

什么是 motion-to-photon 时延,它为什么对 XR 重要?

Motion-to-photon 时延是指用户头部移动到对应像素更新抵达眼睛之间的时间。超过 20 毫秒,大多数用户会出现晕动症;舒适目标在 10 毫秒以下。联网 XR 还要在这一预算中加入无线传输、边缘渲染和帧交付,留给无线接入网(RAN)的只有几毫秒。

5G 今天能支撑元宇宙用例吗?

在单用户、有线头显加同址边缘服务器的可控部署中,5G Advanced 可以达到 XR 级目标。但在规模化场景下 —— 一个场馆内多名用户同时在线、广域移动性、传感器与生物信号的持续上行 —— 5G 的 RAN 时延、上行密度和调度确定性都会成为瓶颈。6G 正是围绕这些短板设计的,而不是渐进式升级。

6G 何时真正承载 XR 流量?

3GPP 把首批 6G 规范瞄准在 Release 21(2028 年),商用试点在 2029—2030 年。面向 XR 优化的 6G 切片 —— 结合 sub-THz 频谱、联合通信与感知(JCAS)以及确定性网络 —— 预计在 2031—2032 年之前难以规模化。在此之前,5G Advanced(Release 18—20)正在加入 XR 专用特性,例如调度器中的 XR-awareness 和面向低时延上行的 Capability Set 7。