AI-RAN性能基准测试2026

应用于无线接入网的人工智能——AI-RAN——已从会议幻灯片步入生产基础设施。2026年第一季度，三家一级运营商发布了独立现场试验结果，在相同硬件上将AI优化RAN与传统配置进行对比。这是业界首次获得同等条件下的性能数据。结果参差不齐：部分领域取得显著提升，其他方面仅有边际改善，还有少数情况下AI实际上导致性能下降。本报告汇编并分析了所有公开可用的基准测试数据。

方法论：我们测量了什么以及如何测量

本报告汇总了来自七个来源的数据：T-Mobile US（2026年3月现场试验，丹佛都市区）、Rakuten Mobile（2025年Q4生产数据，东京）、Deutsche Telekom（2026年2月试验，柏林）、SK Telecom（2026年1月试验，首尔）、Vodafone UK（2026年3月试验，伦敦）、NVIDIA Aerial平台基准测试（实验室条件）和Nokia AirFrame AI基准测试（实验室+现场）。所有结果均在相同硬件上对比启用AI与禁用AI的配置，消除了设备差异的影响。

关键跟踪指标：下行吞吐量（每小区Mbps）、上行吞吐量、平均时延（ms）、第99百分位时延、频谱效率（bps/Hz）、能耗（每TB传输数据kWh）、切换成功率和掉话率。对于运营商报告不同指标的情况，我们统一换算为公共单位并注明方法论差异。

吞吐量：+8-22%的提升，高度依赖场景

大多数运营商首先强调的核心数字是吞吐量提升。综合所有七个来源，AI-RAN实现了：

密集城区（>1,000用户/km²）：平均下行吞吐量提升15-22%。T-Mobile报告丹佛市中心核心区提升18%（每小区平均从285 Mbps提升至336 Mbps）。SK Telecom在高峰时段测量江南区提升22%（从310 Mbps提升至378 Mbps）。
郊区（<500用户/km²）：提升8-12%。Deutsche Telekom在柏林外围区域获得+11%。Vodafone报告伦敦郊区站点提升+8%。
农村（<50用户/km²）：3-5%——统计上显著，但运营层面影响甚微。AI调度器需要优化的用户较少，限制了多用户分集增益。
室内（企业/体育场）：高密度场馆提升25-30%。Rakuten在东京巨蛋的部署在一场满座棒球比赛期间（45,000台同时连接设备）显示+28%。

规律十分清晰：AI-RAN的吞吐量优势随用户密度增长而提升。这与底层机制相符——当有大量信道条件各异的用户可供选择时，AI调度器比比例公平算法更有效地利用多用户分集。

时延：最出乎意料的结果

时延结果最为反直觉。平均时延适度改善（5-15%），但第99百分位（尾部）时延——对实时应用最关键的指标——在部分试验中显示出显著改善，在其他试验中则出现劣化。

运营商	平均时延变化	P99时延变化	备注
T-Mobile US	-12%	-35%	丹佛都市区，5G NR n41
Rakuten Mobile	-8%	-42%	东京，O-RAN 4G+5G
Deutsche Telekom	-15%	+8%	柏林，Nokia AirScale
SK Telecom	-10%	-28%	首尔，Samsung vRAN
Vodafone UK	-6%	+12%	伦敦，Ericsson RAN

P99结果的分歧十分显著。使用基于O-RAN架构的运营商（Rakuten、T-Mobile）获得了大幅度的尾部时延降低，而基于传统厂商协议栈的运营商（Deutsche Telekom用Nokia，Vodafone用Ericsson）的P99反而上升。可能的解释：O-RAN的Near-RT RIC允许在10 ms控制环路内执行AI推理，而专有架构会在负载下增加额外的推理跳转，偶尔超出时延预算。这是架构问题，而非AI问题——这表明AI-RAN的优势在解聚合的、符合O-RAN规范的基础设施上发挥最大。

能源效率：商业案例的核心驱动力

如果吞吐量和时延的改善是渐进式的，那么节能效果则具有变革性——这也是AI-RAN最有力的商业案例所在。

每家运营商都报告了能耗降低，结果出奇地一致：

休眠模式优化：AI控制的小区休眠/唤醒周期在低流量时段（午夜至早6点）将能耗降低18-25%。T-Mobile报告在丹佛1,200个站点实现夜间22%节能。Deutsche Telekom通过允许AI关闭单个MIMO层而非整个小区，实现了25%的最高节能数值。
波束赋形优化：AI驱动的波束管理在高峰时段将功放能耗降低8-12%。SK Telecom的Samsung vRAN部署通过预测用户移动并提前引导波束而非被动调整，实现了11%的高峰时段节能。
冷却成本降低：较低的射频输出功率使塔站冷却成本降低5-8%。Vodafone报告伦敦200个宏站的冷却费用降低7%。
总体节能：所有运营商平均而言，AI-RAN将每站点能耗降低15-22%，折合每个宏站年节约$8,000-15,000（取决于当地电费）。

在规模化条件下，这些数字重塑了投资逻辑。T-Mobile估计，若在美国全网部署AI-RAN，每年可节省电费$1.2亿。Deutsche Telekom欧洲网络的预计节省为每年2亿欧元。仅节能一项就能使大多数一级运营商在18-24个月内实现AI-RAN部署的正回报——甚至不计吞吐量和时延的提升。

频谱效率：实际条件下提升+10-18%

频谱效率——每赫兹每秒比特数——是衡量无线系统利用已分配频谱效果的基本指标。AI-RAN在这方面的改善具有直接财务价值，相当于在不购买频谱的情况下拥有更多频谱。

各运营商结果：

SK Telecom：3.5 GHz n78频段频谱效率提升+18%（平均从7.2 bps/Hz提升至8.5 bps/Hz）。这是报告中的最高数值，反映了Samsung激进的AI调度器——使用基于18个月网络数据训练的Transformer模型。
T-Mobile：n41频段（2.5 GHz）提升+14%（从6.8提升至7.8 bps/Hz）。AI模型同时协调3个载波分量的调度。
Rakuten：4G/5G共享频谱提升+12%。值得注意的是，AI调度器根据需求实时动态重新分配4G和5G之间的频谱——这是其传统调度器无法做到的。
Vodafone：3.5 GHz频段提升+10%（从5.9提升至6.5 bps/Hz）。提升幅度最低，归因于Vodafone已优化的Ericsson配置留给AI改进的空间较小。

切换与移动性：结果参差不齐

切换性能——用户在小区间切换的流畅程度——在所有试验中结果最不一致。对于网联车辆和移动VR/AR应用，这是至关重要的指标。

T-Mobile报告，借助AI辅助切换预测，切换成功率从98.2%提升至99.1%。AI模型在切换事件发生前2-3秒预测用户将移动至哪个小区，从而提前准备目标小区资源。但错误预测（约8%的情况）导致不必要的资源预留，略微增加了邻近小区的干扰。

Rakuten的结果更为显著：东京部署的切换失败率从1.5%降至0.4%。其优势在于：Rakuten完全云原生的O-RAN架构允许AI模型同时访问所有邻近小区的数据，而非仅依赖用户设备的测量报告。

Deutsche Telekom和Vodafone在切换性能上未报告统计上显著的变化。两家运营商均指出，其现有切换算法已针对欧洲城市环境进行了大量调优，AI模型无法超越数十年手工优化的成果。

NVIDIA Aerial：实验室与现场现实的对比

NVIDIA的Aerial平台——运行在NVIDIA融合加速器上的GPU加速软件RAN——发布了实验室基准测试，声称与传统基于DSP的RAN相比，吞吐量提升40%，能耗降低50%。这些数字在业界演示中被广泛引用。

现场试验数据讲述了更为细致的故事。T-Mobile在丹佛的部署在部分站点使用了NVIDIA Aerial，显示吞吐量提升18%——不到实验室声明的一半。差距由实验室测试中不存在的真实世界因素解释：小区间干扰、非理想传播、设备多样性（实验室测试使用参考设备），以及在共享GPU资源上同时运行AI推理和实时信号处理的计算开销。

NVIDIA在2026年3月的博文中承认了这一差距，指出"实验室基准测试代表理论上限性能"，"现场部署通常实现实验室增益的40-60%，具体取决于环境复杂度"。这是诚实的评估，18%的现场结果落在NVIDIA声明的范围内。

NVIDIA Aerial持续提供的是运营灵活性。该平台支持空中模型更新，允许运营商随网络条件变化每月重新训练AI模型。传统RAN厂商需要有停机时间的软件升级；Aerial在后台更新模型，不中断服务。

Nokia AirFrame AI：现有厂商的方法

Nokia的方法与NVIDIA有根本性的不同。Nokia不是用GPU替换RAN处理器，而是在现有基带硬件旁边添加AI推理加速器。AirFrame AI模块插入Nokia的AirScale平台，运行优化调度、功率控制和波束赋形的训练模型。

Nokia发布的基准测试显示吞吐量提升12-15%，节能18-20%——比NVIDIA的声明保守，但更接近运营商在现场试验中实际测量的结果。Deutsche Telekom柏林试验运行Nokia AirFrame AI，实现了11%的吞吐量提升和25%的节能——与Nokia声明的范围良好吻合。

权衡之处：Nokia的方法需要绑定到AirScale生态系统。AI模型在Nokia的云平台上训练，通过Nokia的管理系统部署。运营商无法引入自己的模型或使用第三方AI框架。对于致力于Nokia平台的运营商，这是可以接受的。对于追求多厂商O-RAN策略的运营商，这是无法接受的。

Samsung vRAN AI：基于运营商数据的训练

Samsung的AI-RAN策略强调在运营商特定数据而非通用网络模拟上训练模型。SK Telecom的试验使用了基于SKT自有18个月网络遥测数据训练的Samsung vRAN模型——4.2 TB的调度决策、信道测量和用户移动模式。

结果：SK Telecom实现了数据集中所有运营商最高的频谱效率提升（+18%）。Samsung将此归因于模型对SKT特定传播环境、用户行为模式和流量特征的深度熟悉。在同一环境中进行的对照比较中，基于合成数据训练的通用模型仅实现了+7%——证实运营商特定训练数据是AI-RAN性能中最重要的单一因素。

Samsung的方法有重大规模化限制：每个运营商部署都需要数月的数据收集和定制模型训练。Samsung正在通过联邦学习框架来解决这一问题——该框架允许多个运营商在不共享原始数据的情况下联合训练模型，但截至2026年Q1，该系统仍处于试点阶段，仅有SKT和KDDI参与。

O-RAN ML框架：AI-RAN标准化

O-RAN联盟的ML框架在O-RAN WG2技术规范中规定，旨在标准化多厂商RAN环境中AI模型的训练、部署和管理。截至第3版（2025年Q4最终确定），该框架定义了：

模型托管在Near-RT RIC（10 ms循环内推理）和Non-RT RIC（1秒循环内推理）上
模型与RAN通信的标准接口（A1、E2）
模型生命周期管理：训练、验证、部署、监控、回滚
性能监控和漂移检测——当已部署模型的性能下降时自动报警

Rakuten的部署是O-RAN ML框架唯一的大规模生产实施。其结果验证了该架构：Near-RT RIC在99.7%的调度间隔中实现了低于5 ms的推理时延，证实了实时AI优化在O-RAN控制环路约束内的可行性。

然而，互操作性仍是挑战。在2026年2月的O-RAN联盟互联互通测试中，8种厂商组合中只有3种成功在不同RIC实现上运行了通用AI模型。规范在数据格式和模型接口上留有足够的模糊性，使得厂商特定的适配仍然必要。

成本分析：AI-RAN的实际费用

部署AI-RAN并非免费。运营商面临三类成本：

硬件：GPU加速器（Aerial用NVIDIA A100/H100）或AI协处理器（Nokia AirFrame AI模块）每站点增加$5,000-15,000。对于拥有30,000个站点的一级运营商，硬件成本范围为$1.5亿至$4.5亿。
训练基础设施：模型训练的云计算费用每个运营商每年$200-500万。Samsung的运营商特定方法比通用模型需要更多训练算力。
人员：AI-RAN需要大多数运营商目前尚未雇用的数据科学家和ML工程师。典型团队规模为15-30名专家，薪资费用每年$300-800万。

对比这些成本，仅节能一项（一级运营商每年$1.2-2亿）就能在2-3年内产生正回报。加上改善吞吐量和容量带来的收入增长（用户体验改善估计ARPU提升3-5%），回收期缩短至18个月。

展望：2027年将发生哪些变化

三项进展将在未来12个月重塑AI-RAN基准测试：

1. RAN基础模型：NVIDIA和Ericsson均已宣布"基础模型"方法——在多样化网络数据上预训练的大型AI模型，可用最少的额外数据针对特定运营商进行微调。若成功，这将消除Samsung的数据收集瓶颈，使高性能AI-RAN民主化。

2. 6G AI原生设计：3GPP关于NR的AI/ML研究项目（第19版，预计2026年Q3）将标准化AI模型交换格式和性能要求。这为跨厂商比较AI-RAN实现创建了共同基准——这在今天尚不存在。

3. 边缘推理硬件：下一代推理芯片（NVIDIA Blackwell、高通Cloud AI 200、Intel Gaudi 3）将在推理吞吐量翻倍的同时，将每站点硬件成本降低40-60%。这解决了AI-RAN普及部署的主要障碍：站点层面的经济性。

2026年的基准测试建立了基线。AI-RAN提供可测量、可重复的效益——但幅度因架构、厂商和环境不同而显著变化。胜出者将是那些投资于数据收集基础设施和符合O-RAN规范架构的运营商，因为这些架构最大化了AI实时优化的能力。技术是有效的。问题不再是AI是否改善RAN——而是改善多少、在哪里改善，以及代价几何。