应用于无线接入网的人工智能——AI-RAN——已从会议幻灯片步入生产基础设施。2026年第一季度,三家一级运营商发布了独立现场试验结果,在相同硬件上将AI优化RAN与传统配置进行对比。这是业界首次获得同等条件下的性能数据。结果参差不齐:部分领域取得显著提升,其他方面仅有边际改善,还有少数情况下AI实际上导致性能下降。本报告汇编并分析了所有公开可用的基准测试数据。
方法论:我们测量了什么以及如何测量
本报告汇总了来自七个来源的数据:T-Mobile US(2026年3月现场试验,丹佛都市区)、Rakuten Mobile(2025年Q4生产数据,东京)、Deutsche Telekom(2026年2月试验,柏林)、SK Telecom(2026年1月试验,首尔)、Vodafone UK(2026年3月试验,伦敦)、NVIDIA Aerial平台基准测试(实验室条件)和Nokia AirFrame AI基准测试(实验室+现场)。所有结果均在相同硬件上对比启用AI与禁用AI的配置,消除了设备差异的影响。
关键跟踪指标:下行吞吐量(每小区Mbps)、上行吞吐量、平均时延(ms)、第99百分位时延、频谱效率(bps/Hz)、能耗(每TB传输数据kWh)、切换成功率和掉话率。对于运营商报告不同指标的情况,我们统一换算为公共单位并注明方法论差异。
吞吐量:+8-22%的提升,高度依赖场景
大多数运营商首先强调的核心数字是吞吐量提升。综合所有七个来源,AI-RAN实现了:
- 密集城区(>1,000用户/km²):平均下行吞吐量提升15-22%。T-Mobile报告丹佛市中心核心区提升18%(每小区平均从285 Mbps提升至336 Mbps)。SK Telecom在高峰时段测量江南区提升22%(从310 Mbps提升至378 Mbps)。
- 郊区(<500用户/km²):提升8-12%。Deutsche Telekom在柏林外围区域获得+11%。Vodafone报告伦敦郊区站点提升+8%。
- 农村(<50用户/km²):3-5%——统计上显著,但运营层面影响甚微。AI调度器需要优化的用户较少,限制了多用户分集增益。
- 室内(企业/体育场):高密度场馆提升25-30%。Rakuten在东京巨蛋的部署在一场满座棒球比赛期间(45,000台同时连接设备)显示+28%。
规律十分清晰:AI-RAN的吞吐量优势随用户密度增长而提升。这与底层机制相符——当有大量信道条件各异的用户可供选择时,AI调度器比比例公平算法更有效地利用多用户分集。
时延:最出乎意料的结果
时延结果最为反直觉。平均时延适度改善(5-15%),但第99百分位(尾部)时延——对实时应用最关键的指标——在部分试验中显示出显著改善,在其他试验中则出现劣化。
| 运营商 | 平均时延变化 | P99时延变化 | 备注 |
|---|---|---|---|
| T-Mobile US | -12% | -35% | 丹佛都市区,5G NR n41 |
| Rakuten Mobile | -8% | -42% | 东京,O-RAN 4G+5G |
| Deutsche Telekom | -15% | +8% | 柏林,Nokia AirScale |
| SK Telecom | -10% | -28% | 首尔,Samsung vRAN |
| Vodafone UK | -6% | +12% | 伦敦,Ericsson RAN |
P99结果的分歧十分显著。使用基于O-RAN架构的运营商(Rakuten、T-Mobile)获得了大幅度的尾部时延降低,而基于传统厂商协议栈的运营商(Deutsche Telekom用Nokia,Vodafone用Ericsson)的P99反而上升。可能的解释:O-RAN的Near-RT RIC允许在10 ms控制环路内执行AI推理,而专有架构会在负载下增加额外的推理跳转,偶尔超出时延预算。这是架构问题,而非AI问题——这表明AI-RAN的优势在解聚合的、符合O-RAN规范的基础设施上发挥最大。
能源效率:商业案例的核心驱动力
如果吞吐量和时延的改善是渐进式的,那么节能效果则具有变革性——这也是AI-RAN最有力的商业案例所在。
每家运营商都报告了能耗降低,结果出奇地一致:
- 休眠模式优化:AI控制的小区休眠/唤醒周期在低流量时段(午夜至早6点)将能耗降低18-25%。T-Mobile报告在丹佛1,200个站点实现夜间22%节能。Deutsche Telekom通过允许AI关闭单个MIMO层而非整个小区,实现了25%的最高节能数值。
- 波束赋形优化:AI驱动的波束管理在高峰时段将功放能耗降低8-12%。SK Telecom的Samsung vRAN部署通过预测用户移动并提前引导波束而非被动调整,实现了11%的高峰时段节能。
- 冷却成本降低:较低的射频输出功率使塔站冷却成本降低5-8%。Vodafone报告伦敦200个宏站的冷却费用降低7%。
- 总体节能:所有运营商平均而言,AI-RAN将每站点能耗降低15-22%,折合每个宏站年节约$8,000-15,000(取决于当地电费)。
在规模化条件下,这些数字重塑了投资逻辑。T-Mobile估计,若在美国全网部署AI-RAN,每年可节省电费$1.2亿。Deutsche Telekom欧洲网络的预计节省为每年2亿欧元。仅节能一项就能使大多数一级运营商在18-24个月内实现AI-RAN部署的正回报——甚至不计吞吐量和时延的提升。
频谱效率:实际条件下提升+10-18%
频谱效率——每赫兹每秒比特数——是衡量无线系统利用已分配频谱效果的基本指标。AI-RAN在这方面的改善具有直接财务价值,相当于在不购买频谱的情况下拥有更多频谱。
各运营商结果:
- SK Telecom:3.5 GHz n78频段频谱效率提升+18%(平均从7.2 bps/Hz提升至8.5 bps/Hz)。这是报告中的最高数值,反映了Samsung激进的AI调度器——使用基于18个月网络数据训练的Transformer模型。
- T-Mobile:n41频段(2.5 GHz)提升+14%(从6.8提升至7.8 bps/Hz)。AI模型同时协调3个载波分量的调度。
- Rakuten:4G/5G共享频谱提升+12%。值得注意的是,AI调度器根据需求实时动态重新分配4G和5G之间的频谱——这是其传统调度器无法做到的。
- Vodafone:3.5 GHz频段提升+10%(从5.9提升至6.5 bps/Hz)。提升幅度最低,归因于Vodafone已优化的Ericsson配置留给AI改进的空间较小。
切换与移动性:结果参差不齐
切换性能——用户在小区间切换的流畅程度——在所有试验中结果最不一致。对于网联车辆和移动VR/AR应用,这是至关重要的指标。
T-Mobile报告,借助AI辅助切换预测,切换成功率从98.2%提升至99.1%。AI模型在切换事件发生前2-3秒预测用户将移动至哪个小区,从而提前准备目标小区资源。但错误预测(约8%的情况)导致不必要的资源预留,略微增加了邻近小区的干扰。
Rakuten的结果更为显著:东京部署的切换失败率从1.5%降至0.4%。其优势在于:Rakuten完全云原生的O-RAN架构允许AI模型同时访问所有邻近小区的数据,而非仅依赖用户设备的测量报告。
Deutsche Telekom和Vodafone在切换性能上未报告统计上显著的变化。两家运营商均指出,其现有切换算法已针对欧洲城市环境进行了大量调优,AI模型无法超越数十年手工优化的成果。
NVIDIA Aerial:实验室与现场现实的对比
NVIDIA的Aerial平台——运行在NVIDIA融合加速器上的GPU加速软件RAN——发布了实验室基准测试,声称与传统基于DSP的RAN相比,吞吐量提升40%,能耗降低50%。这些数字在业界演示中被广泛引用。
现场试验数据讲述了更为细致的故事。T-Mobile在丹佛的部署在部分站点使用了NVIDIA Aerial,显示吞吐量提升18%——不到实验室声明的一半。差距由实验室测试中不存在的真实世界因素解释:小区间干扰、非理想传播、设备多样性(实验室测试使用参考设备),以及在共享GPU资源上同时运行AI推理和实时信号处理的计算开销。
NVIDIA在2026年3月的博文中承认了这一差距,指出"实验室基准测试代表理论上限性能","现场部署通常实现实验室增益的40-60%,具体取决于环境复杂度"。这是诚实的评估,18%的现场结果落在NVIDIA声明的范围内。
NVIDIA Aerial持续提供的是运营灵活性。该平台支持空中模型更新,允许运营商随网络条件变化每月重新训练AI模型。传统RAN厂商需要有停机时间的软件升级;Aerial在后台更新模型,不中断服务。
Nokia AirFrame AI:现有厂商的方法
Nokia的方法与NVIDIA有根本性的不同。Nokia不是用GPU替换RAN处理器,而是在现有基带硬件旁边添加AI推理加速器。AirFrame AI模块插入Nokia的AirScale平台,运行优化调度、功率控制和波束赋形的训练模型。
Nokia发布的基准测试显示吞吐量提升12-15%,节能18-20%——比NVIDIA的声明保守,但更接近运营商在现场试验中实际测量的结果。Deutsche Telekom柏林试验运行Nokia AirFrame AI,实现了11%的吞吐量提升和25%的节能——与Nokia声明的范围良好吻合。
权衡之处:Nokia的方法需要绑定到AirScale生态系统。AI模型在Nokia的云平台上训练,通过Nokia的管理系统部署。运营商无法引入自己的模型或使用第三方AI框架。对于致力于Nokia平台的运营商,这是可以接受的。对于追求多厂商O-RAN策略的运营商,这是无法接受的。
Samsung vRAN AI:基于运营商数据的训练
Samsung的AI-RAN策略强调在运营商特定数据而非通用网络模拟上训练模型。SK Telecom的试验使用了基于SKT自有18个月网络遥测数据训练的Samsung vRAN模型——4.2 TB的调度决策、信道测量和用户移动模式。
结果:SK Telecom实现了数据集中所有运营商最高的频谱效率提升(+18%)。Samsung将此归因于模型对SKT特定传播环境、用户行为模式和流量特征的深度熟悉。在同一环境中进行的对照比较中,基于合成数据训练的通用模型仅实现了+7%——证实运营商特定训练数据是AI-RAN性能中最重要的单一因素。
Samsung的方法有重大规模化限制:每个运营商部署都需要数月的数据收集和定制模型训练。Samsung正在通过联邦学习框架来解决这一问题——该框架允许多个运营商在不共享原始数据的情况下联合训练模型,但截至2026年Q1,该系统仍处于试点阶段,仅有SKT和KDDI参与。
O-RAN ML框架:AI-RAN标准化
O-RAN联盟的ML框架在O-RAN WG2技术规范中规定,旨在标准化多厂商RAN环境中AI模型的训练、部署和管理。截至第3版(2025年Q4最终确定),该框架定义了:
- 模型托管在Near-RT RIC(10 ms循环内推理)和Non-RT RIC(1秒循环内推理)上
- 模型与RAN通信的标准接口(A1、E2)
- 模型生命周期管理:训练、验证、部署、监控、回滚
- 性能监控和漂移检测——当已部署模型的性能下降时自动报警
Rakuten的部署是O-RAN ML框架唯一的大规模生产实施。其结果验证了该架构:Near-RT RIC在99.7%的调度间隔中实现了低于5 ms的推理时延,证实了实时AI优化在O-RAN控制环路约束内的可行性。
然而,互操作性仍是挑战。在2026年2月的O-RAN联盟互联互通测试中,8种厂商组合中只有3种成功在不同RIC实现上运行了通用AI模型。规范在数据格式和模型接口上留有足够的模糊性,使得厂商特定的适配仍然必要。
成本分析:AI-RAN的实际费用
部署AI-RAN并非免费。运营商面临三类成本:
- 硬件:GPU加速器(Aerial用NVIDIA A100/H100)或AI协处理器(Nokia AirFrame AI模块)每站点增加$5,000-15,000。对于拥有30,000个站点的一级运营商,硬件成本范围为$1.5亿至$4.5亿。
- 训练基础设施:模型训练的云计算费用每个运营商每年$200-500万。Samsung的运营商特定方法比通用模型需要更多训练算力。
- 人员:AI-RAN需要大多数运营商目前尚未雇用的数据科学家和ML工程师。典型团队规模为15-30名专家,薪资费用每年$300-800万。
对比这些成本,仅节能一项(一级运营商每年$1.2-2亿)就能在2-3年内产生正回报。加上改善吞吐量和容量带来的收入增长(用户体验改善估计ARPU提升3-5%),回收期缩短至18个月。
展望:2027年将发生哪些变化
三项进展将在未来12个月重塑AI-RAN基准测试:
1. RAN基础模型:NVIDIA和Ericsson均已宣布"基础模型"方法——在多样化网络数据上预训练的大型AI模型,可用最少的额外数据针对特定运营商进行微调。若成功,这将消除Samsung的数据收集瓶颈,使高性能AI-RAN民主化。
2. 6G AI原生设计:3GPP关于NR的AI/ML研究项目(第19版,预计2026年Q3)将标准化AI模型交换格式和性能要求。这为跨厂商比较AI-RAN实现创建了共同基准——这在今天尚不存在。
3. 边缘推理硬件:下一代推理芯片(NVIDIA Blackwell、高通Cloud AI 200、Intel Gaudi 3)将在推理吞吐量翻倍的同时,将每站点硬件成本降低40-60%。这解决了AI-RAN普及部署的主要障碍:站点层面的经济性。
2026年的基准测试建立了基线。AI-RAN提供可测量、可重复的效益——但幅度因架构、厂商和环境不同而显著变化。胜出者将是那些投资于数据收集基础设施和符合O-RAN规范架构的运营商,因为这些架构最大化了AI实时优化的能力。技术是有效的。问题不再是AI是否改善RAN——而是改善多少、在哪里改善,以及代价几何。