Benchmarks de performance AI-RAN 2026

L'intelligence artificielle appliquée aux réseaux d'accès radio — AI-RAN — a quitté les diapositives de conférences pour rejoindre les infrastructures de production. Au premier trimestre 2026, trois opérateurs Tier-1 ont publié des résultats indépendants d'essais sur le terrain comparant le RAN optimisé par IA à des configurations conventionnelles sur un matériel identique. Pour la première fois, le secteur dispose de données de performance comparables à conditions égales. Les résultats sont inégaux : des gains significatifs dans certains domaines, des améliorations marginales dans d'autres, et quelques cas où l'IA a réellement dégradé les performances. Ce rapport compile et analyse tous les benchmarks publiquement disponibles.

Méthodologie : ce que nous avons mesuré et comment

Ce rapport agrège des données provenant de sept sources : T-Mobile US (essai sur le terrain de mars 2026, agglomération de Denver), Rakuten Mobile (données de production T4 2025, Tokyo), Deutsche Telekom (essai de février 2026, Berlin), SK Telecom (essai de janvier 2026, Séoul), Vodafone UK (essai de mars 2026, Londres), benchmarks de la plateforme NVIDIA Aerial (conditions de laboratoire), et benchmarks Nokia AirFrame AI (laboratoire + terrain). Tous les résultats comparent les configurations avec et sans IA activée sur le même matériel, éliminant ainsi la variabilité des équipements.

Indicateurs clés suivis : débit descendant (Mbps par cellule), débit montant, latence moyenne (ms), latence au 99e percentile, efficacité spectrale (bps/Hz), consommation d'énergie (kWh par To transporté), taux de succès des transferts intercellulaires, et taux de coupure d'appel. Lorsque les opérateurs ont rapporté des indicateurs différents, nous les normalisons en unités communes et notons les différences de méthodologie.

Débit : gains de +8 à +22 %, très dépendants du scénario

Le chiffre phare mis en avant par la plupart des opérateurs était l'amélioration du débit. Sur l'ensemble des sept sources, l'AI-RAN a produit les résultats suivants :

Urbain dense (>1 000 utilisateurs/km²) : amélioration moyenne du débit descendant de +15 à +22 %. T-Mobile a rapporté +18 % dans le centre de Denver (de 285 Mbps à 336 Mbps en moyenne par cellule). SK Telecom a mesuré +22 % dans le quartier de Gangnam en heures de pointe (de 310 Mbps à 378 Mbps).
Périurbain (<500 utilisateurs/km²) : amélioration de +8 à +12 %. Deutsche Telekom a observé +11 % dans les quartiers périphériques de Berlin. Vodafone a rapporté +8 % sur les sites périurbains de Londres.
Rural (<50 utilisateurs/km²) : +3 à +5 % — statistiquement significatif mais opérationnellement mineur. L'ordonnanceur IA dispose de moins d'utilisateurs à optimiser, ce qui limite les gains de diversité multi-utilisateurs.
Intérieur (entreprise/stade) : +25 à +30 % dans les lieux à haute densité. Le déploiement de Rakuten au Tokyo Dome a affiché +28 % lors d'un match de baseball à guichets fermés (45 000 appareils simultanés).

Le schéma est clair : l'avantage de débit de l'AI-RAN évolue avec la densité d'utilisateurs. Cela s'aligne sur le mécanisme sous-jacent — les ordonnanceurs IA exploitent la diversité multi-utilisateurs plus efficacement que les algorithmes proportionnels équitables lorsqu'il y a de nombreux utilisateurs aux conditions de canal diversifiées.

Latence : le résultat le plus surprenant

Les résultats de latence ont été les plus contre-intuitifs. La latence moyenne s'est améliorée modestement (5 à 15 %), mais la latence au 99e percentile (queue) — l'indicateur le plus important pour les applications en temps réel — a montré des améliorations spectaculaires dans certains essais et des dégradations dans d'autres.

Opérateur	Variation latence moy.	Variation latence P99	Notes
T-Mobile US	-12 %	-35 %	Agglomération Denver, 5G NR n41
Rakuten Mobile	-8 %	-42 %	Tokyo, O-RAN 4G+5G
Deutsche Telekom	-15 %	+8 %	Berlin, Nokia AirScale
SK Telecom	-10 %	-28 %	Séoul, Samsung vRAN
Vodafone UK	-6 %	+12 %	Londres, Ericsson RAN

La divergence dans les résultats P99 est significative. Les opérateurs utilisant des architectures basées sur O-RAN (Rakuten, T-Mobile) ont constaté de grandes réductions de la latence de queue, tandis que ceux sur des piles propriétaires de fournisseurs (Deutsche Telekom sur Nokia, Vodafone sur Ericsson) ont vu le P99 augmenter. L'explication probable : le Near-RT RIC d'O-RAN permet l'inférence IA dans la boucle de contrôle de 10 ms, tandis que les architectures propriétaires ajoutent un saut d'inférence supplémentaire qui dépasse occasionnellement le budget de latence sous charge. Il s'agit d'un problème d'architecture, pas d'un problème d'IA — et cela suggère que les bénéfices de l'AI-RAN sont maximisés sur une infrastructure désagrégée et conforme à O-RAN.

Efficacité énergétique : le moteur du cas commercial

Si les améliorations de débit et de latence sont incrémentielles, les économies d'énergie sont transformationnelles — et c'est là que l'AI-RAN présente son argument commercial le plus solide.

Tous les opérateurs ont rapporté des réductions d'énergie, avec des résultats remarquablement cohérents :

Optimisation du mode veille : Les cycles de veille/réveil des cellules contrôlés par l'IA ont réduit la consommation d'énergie de 18 à 25 % pendant les périodes de faible trafic (minuit à 6 h). T-Mobile a rapporté 22 % d'économies nocturnes sur 1 200 sites à Denver. Deutsche Telekom a atteint 25 % — le chiffre le plus élevé — en permettant à l'IA d'éteindre des couches MIMO individuelles plutôt que des cellules entières.
Optimisation du beamforming : La gestion des faisceaux pilotée par l'IA a réduit la consommation des amplificateurs de puissance de 8 à 12 % pendant les heures de pointe. Le déploiement Samsung vRAN de SK Telecom a montré 11 % d'économies aux heures de pointe en prédisant le mouvement des utilisateurs et en pré-orientant les faisceaux plutôt qu'en les ajustant de manière réactive.
Réduction du refroidissement : La réduction de la puissance d'émission RF s'est traduite par des économies de 5 à 8 % sur les coûts de refroidissement des sites de tours. Vodafone a rapporté 7 % de réduction du refroidissement sur 200 sites macro à Londres.
Économies d'énergie totales : Sur l'ensemble des opérateurs, l'AI-RAN a réduit la consommation d'énergie par site de 15 à 22 % en moyenne, se traduisant par des économies annuelles de 8 000 à 15 000 dollars par site macro selon les coûts locaux de l'électricité.

À grande échelle, ces chiffres transforment l'argumentaire d'investissement. T-Mobile estime 120 millions de dollars d'économies d'énergie annuelles sur son réseau américain si l'AI-RAN est déployé à l'échelle nationale. Pour l'empreinte européenne de Deutsche Telekom, l'économie projetée est de 200 millions d'euros par an. Les économies d'énergie seules justifient le déploiement de l'AI-RAN en 18 à 24 mois pour la plupart des opérateurs Tier-1 — même sans compter les gains de débit et de latence.

Efficacité spectrale : +10 à +18 % en conditions réelles

L'efficacité spectrale — bits par seconde par Hertz — est la mesure fondamentale de la qualité d'utilisation du spectre alloué par un système radio. Les améliorations de l'AI-RAN ont une valeur financière directe, car elles équivalent à disposer de plus de spectre sans l'acheter.

Résultats par opérateur :

SK Telecom : amélioration de l'efficacité spectrale de +18 % (de 7,2 bps/Hz à 8,5 bps/Hz en moyenne) sur la bande 3,5 GHz n78. C'est le chiffre le plus élevé rapporté et il reflète l'ordonnanceur IA agressif de Samsung, qui utilise un modèle basé sur les transformers entraîné sur 18 mois de données réseau.
T-Mobile : +14 % (de 6,8 à 7,8 bps/Hz) sur n41 (2,5 GHz). Le modèle IA coordonne l'ordonnancement sur 3 composantes de porteuse simultanément.
Rakuten : +12 % sur leur spectre partagé 4G/5G. Notamment, l'ordonnanceur IA a réalloué dynamiquement le spectre entre 4G et 5G en temps réel selon la demande — ce que leur ordonnanceur traditionnel ne pouvait pas faire.
Vodafone : +10 % (de 5,9 à 6,5 bps/Hz) sur 3,5 GHz. L'amélioration la plus faible, attribuée à la configuration Ericsson déjà optimisée de Vodafone qui laisse peu de marge aux gains de l'IA.

Transferts intercellulaires et mobilité : résultats mitigés

La performance des transferts intercellulaires — la fluidité avec laquelle les utilisateurs transitent entre cellules — a montré les résultats les plus incohérents entre les essais. Il s'agit d'un indicateur critique pour les véhicules connectés et les applications VR/AR mobiles.

T-Mobile a rapporté une amélioration du taux de succès des transferts de 98,2 % à 99,1 % avec la prédiction de transfert assistée par IA. Le modèle IA prédit vers quelle cellule un utilisateur va se déplacer 2 à 3 secondes avant l'événement de transfert, permettant la préparation anticipée des ressources de la cellule cible. Cependant, les fausses prédictions (environ 8 % des cas) ont causé une réservation inutile de ressources, augmentant légèrement les interférences sur les cellules voisines.

Les résultats de Rakuten ont été plus spectaculaires : le taux d'échec des transferts est passé de 1,5 % à 0,4 % dans leur déploiement à Tokyo. Leur avantage : l'architecture entièrement cloud-native et O-RAN de Rakuten permet au modèle IA d'accéder simultanément aux données de toutes les cellules voisines, plutôt que de se fier uniquement aux rapports de mesure de l'appareil de l'utilisateur.

Deutsche Telekom et Vodafone n'ont rapporté aucun changement statistiquement significatif dans la performance des transferts. Les deux opérateurs ont noté que leurs algorithmes de transfert existants étaient déjà fortement ajustés pour les environnements urbains européens, et que les modèles IA ne disposaient pas de suffisamment de données d'entraînement pour surpasser des décennies d'optimisation manuelle.

NVIDIA Aerial : laboratoire versus réalité du terrain

La plateforme Aerial de NVIDIA — un RAN logiciel accéléré par GPU fonctionnant sur des accélérateurs convergés NVIDIA — a publié des benchmarks en laboratoire revendiquant une amélioration de débit de 40 % et une réduction d'énergie de 50 % par rapport au RAN traditionnel basé sur DSP. Ces chiffres ont été largement cités dans les présentations sectorielles.

Les données d'essais sur le terrain racontent une histoire plus nuancée. Le déploiement de T-Mobile à Denver, qui utilisait NVIDIA Aerial sur un sous-ensemble de sites, a montré une amélioration de débit de 18 % — moins de la moitié de la revendication en laboratoire. L'écart s'explique par des facteurs réels absents des tests en laboratoire : interférences entre cellules, propagation non idéale, diversité des appareils (les tests en laboratoire utilisent des appareils de référence), et la surcharge de calcul liée à l'exécution de l'inférence IA parallèlement au traitement du signal en temps réel sur des ressources GPU partagées.

NVIDIA a reconnu l'écart dans un billet de blog de mars 2026, notant que « les benchmarks de laboratoire représentent les performances plafond théoriques » et que « les déploiements sur le terrain atteignent généralement 40 à 60 % des gains en laboratoire selon la complexité de l'environnement ». C'est une évaluation honnête, et le résultat terrain de 18 % s'inscrit dans la plage annoncée par NVIDIA.

Ce que NVIDIA Aerial offre de manière constante, c'est la flexibilité opérationnelle. La plateforme prend en charge les mises à jour de modèles par voie hertzienne, permettant aux opérateurs de réentraîner les modèles IA mensuellement à mesure que les conditions du réseau évoluent. Les fournisseurs traditionnels de RAN nécessitent des mises à niveau logicielles avec des temps d'arrêt ; Aerial met à jour les modèles en arrière-plan sans interruption de service.

Nokia AirFrame AI : l'approche des acteurs établis

L'approche de Nokia diffère fondamentalement de celle de NVIDIA. Plutôt que de remplacer le processeur RAN par des GPU, Nokia ajoute un accélérateur d'inférence IA à côté du matériel de bande de base existant. Le module AirFrame AI se connecte à la plateforme AirScale de Nokia et exécute des modèles entraînés qui optimisent l'ordonnancement, le contrôle de puissance et le beamforming.

Les benchmarks publiés par Nokia montrent une amélioration de débit de 12 à 15 % et des économies d'énergie de 18 à 20 % — plus conservateurs que les revendications de NVIDIA mais plus proches de ce que les opérateurs ont réellement mesuré lors des essais sur le terrain. L'essai Deutsche Telekom à Berlin, exécutant Nokia AirFrame AI, a atteint 11 % d'amélioration du débit et 25 % d'économies d'énergie — s'alignant bien avec la plage annoncée par Nokia.

Le compromis : l'approche de Nokia exige un engagement de l'opérateur envers l'écosystème AirScale. Les modèles IA sont entraînés sur la plateforme cloud de Nokia et déployés via le système de gestion de Nokia. Les opérateurs ne peuvent pas apporter leurs propres modèles ni utiliser des frameworks IA tiers. Pour les opérateurs engagés dans la plateforme Nokia, cela est acceptable. Pour ceux qui poursuivent des stratégies O-RAN multi-fournisseurs, c'est rédhibitoire.

Samsung vRAN AI : entraînement sur les données des opérateurs

La stratégie AI-RAN de Samsung met l'accent sur l'entraînement de modèles sur des données spécifiques aux opérateurs plutôt que sur des simulations réseau génériques. L'essai de SK Telecom a utilisé un modèle Samsung vRAN entraîné sur 18 mois de télémétrie réseau propre à SKT — 4,2 To de décisions d'ordonnancement, de mesures de canal et de patterns de mobilité des utilisateurs.

Le résultat : SK Telecom a atteint la plus haute amélioration d'efficacité spectrale (+18 %) de tous les opérateurs de notre ensemble de données. Samsung attribue cela à la connaissance approfondie du modèle de l'environnement de propagation spécifique de SKT, des patterns de comportement des utilisateurs et des profils de trafic. Un modèle générique entraîné sur des données synthétiques n'a atteint que +7 % dans le même environnement lors d'une comparaison contrôlée — confirmant que les données d'entraînement spécifiques à l'opérateur sont le facteur le plus important dans la performance de l'AI-RAN.

L'approche de Samsung présente une limitation de mise à l'échelle significative : chaque déploiement chez un opérateur nécessite des mois de collecte de données et un entraînement de modèle personnalisé. Samsung y répond avec un framework d'apprentissage fédéré permettant à plusieurs opérateurs d'entraîner conjointement des modèles sans partager de données brutes, mais ce système est encore en phase pilote avec seulement SKT et KDDI participant au T1 2026.

Le framework ML d'O-RAN : standardiser l'AI-RAN

Le framework ML de l'O-RAN Alliance, spécifié dans les spécifications techniques O-RAN WG2, vise à standardiser la manière dont les modèles IA sont entraînés, déployés et gérés dans des environnements RAN multi-fournisseurs. À partir de la version 3 (finalisée au T4 2025), le framework définit :

Hébergement de modèles sur le Near-RT RIC (inférence dans la boucle de 10 ms) et le Non-RT RIC (inférence dans la boucle d'1 seconde)
Interfaces standard (A1, E2) pour la communication modèle-RAN
Gestion du cycle de vie des modèles : entraînement, validation, déploiement, surveillance, rollback
Surveillance des performances et détection de dérive — signalant automatiquement lorsque les performances d'un modèle déployé se dégradent

Le déploiement de Rakuten est la seule implémentation de production à grande échelle du framework ML d'O-RAN. Leurs résultats valident l'architecture : le Near-RT RIC a atteint une latence d'inférence inférieure à 5 ms dans 99,7 % des intervalles d'ordonnancement, confirmant que l'optimisation IA en temps réel est réalisable dans les contraintes de boucle de contrôle d'O-RAN.

Cependant, l'interopérabilité reste un défi. Lors d'un plugfest de l'O-RAN Alliance en février 2026, seulement 3 des 8 combinaisons de fournisseurs ont réussi à exécuter un modèle IA commun sur différentes implémentations de RIC. La spécification laisse suffisamment d'ambiguïté dans les formats de données et les interfaces de modèle pour que des adaptations spécifiques aux fournisseurs soient encore nécessaires.

Analyse des coûts : ce que l'AI-RAN coûte réellement

Déployer l'AI-RAN n'est pas gratuit. Les opérateurs font face à trois catégories de coûts :

Matériel : Les accélérateurs GPU (NVIDIA A100/H100 pour Aerial) ou les coprocesseurs IA (module Nokia AirFrame AI) ajoutent 5 000 à 15 000 dollars par site. Pour un opérateur Tier-1 avec 30 000 sites, le coût matériel varie de 150 à 450 millions de dollars.
Infrastructure d'entraînement : Le cloud computing pour l'entraînement des modèles coûte 2 à 5 millions de dollars par opérateur et par an. L'approche spécifique aux opérateurs de Samsung nécessite plus de puissance de calcul d'entraînement que les modèles génériques.
Personnel : L'AI-RAN requiert des data scientists et des ingénieurs ML que la plupart des opérateurs n'emploient pas actuellement. La taille typique d'une équipe est de 15 à 30 spécialistes, coûtant 3 à 8 millions de dollars annuellement en salaires.

Face à ces coûts, les économies d'énergie seules (120 à 200 millions de dollars annuellement pour un opérateur Tier-1) produisent un ROI positif en 2 à 3 ans. En ajoutant la hausse de revenus liée à l'amélioration du débit et de la capacité (estimée à une augmentation de 3 à 5 % de l'ARPU grâce à une meilleure expérience utilisateur), la période de retour tombe à 18 mois.

Perspectives : ce qui change en 2027

Trois développements vont remodeler les benchmarks AI-RAN au cours des 12 prochains mois :

1. Modèles de fondation pour le RAN : NVIDIA et Ericsson ont tous deux annoncé des approches de « modèles de fondation » — de grands modèles IA pré-entraînés sur des données réseau diversifiées qui peuvent être affinés pour des opérateurs spécifiques avec un minimum de données supplémentaires. En cas de succès, cela éliminerait le goulot d'étranglement de collecte de données de Samsung et démocratiserait l'AI-RAN haute performance.

2. Conception 6G native IA : L'étude 3GPP sur l'IA/ML pour NR (version 19, attendue au T3 2026) standardisera les formats d'échange de modèles IA et les exigences de performance. Cela crée une base commune pour comparer les implémentations AI-RAN entre fournisseurs — quelque chose qui n'existe pas aujourd'hui.

3. Matériel d'inférence en périphérie : Les puces d'inférence de nouvelle génération (NVIDIA Blackwell, Qualcomm Cloud AI 200, Intel Gaudi 3) réduiront le coût matériel par site de 40 à 60 % tout en doublant le débit d'inférence. Cela répond à la principale barrière au déploiement universel de l'AI-RAN : l'économie au niveau du site.

Les benchmarks 2026 établissent une ligne de base. L'AI-RAN offre des avantages mesurables et reproductibles — mais l'ampleur varie significativement selon l'architecture, le fournisseur et l'environnement. Les gagnants seront les opérateurs qui investissent dans l'infrastructure de collecte de données et les architectures conformes à O-RAN qui maximisent la capacité de l'IA à optimiser en temps réel. La technologie fonctionne. La question n'est plus de savoir si l'IA améliore le RAN — c'est dans quelle mesure, où, et à quel coût.