AI-RAN Leistungs-Benchmarks 2026

Künstliche Intelligenz im Funkzugangsnetz — AI-RAN — hat den Sprung von Konferenzfolien zu Produktionsinfrastruktur vollzogen. Im ersten Quartal 2026 veröffentlichten drei Tier-1-Betreiber unabhängige Feldversuchsergebnisse, die KI-optimiertes RAN mit konventionellen Konfigurationen auf identischer Hardware verglichen. Zum ersten Mal verfügt die Branche über vergleichbare Leistungsdaten unter gleichen Bedingungen. Die Ergebnisse sind uneinheitlich: in einigen Bereichen erhebliche Gewinne, in anderen marginale Verbesserungen, und einige Fälle, in denen die KI die Leistung tatsächlich verschlechtert hat. Dieser Bericht kompiliert und analysiert alle öffentlich verfügbaren Benchmarks.

Methodik: Was wir gemessen haben und wie

Dieser Bericht aggregiert Daten aus sieben Quellen: T-Mobile US (Feldversuch März 2026, Großraum Denver), Rakuten Mobile (Produktionsdaten Q4 2025, Tokio), Deutsche Telekom (Versuch Februar 2026, Berlin), SK Telecom (Versuch Januar 2026, Seoul), Vodafone UK (Versuch März 2026, London), NVIDIA-Aerial-Plattform-Benchmarks (Laborbedingungen) und Nokia-AirFrame-AI-Benchmarks (Labor + Feld). Alle Ergebnisse vergleichen KI-aktivierte mit KI-deaktivierten Konfigurationen auf derselben Hardware, wodurch die Gerätevariabilität eliminiert wird.

Erfasste Schlüsselkennzahlen: Downlink-Durchsatz (Mbps pro Zelle), Uplink-Durchsatz, durchschnittliche Latenz (ms), 99. Perzentil-Latenz, spektrale Effizienz (bps/Hz), Energieverbrauch (kWh pro transportiertem TB), Handover-Erfolgsrate und Verbindungsabbruchrate. Wenn Betreiber unterschiedliche Kennzahlen angaben, normalisieren wir auf gemeinsame Einheiten und notieren Methodologieunterschiede.

Durchsatz: +8 bis +22 % Gewinne, stark szenarioabhängig

Die Hauptzahl, mit der die meisten Betreiber aufwarteten, war die Durchsatzverbesserung. Über alle sieben Quellen erzielte AI-RAN folgende Ergebnisse:

Dichtes Stadtgebiet (>1.000 Nutzer/km²): +15 bis +22 % durchschnittliche Downlink-Durchsatzverbesserung. T-Mobile meldete +18 % im Kern von Denver (von 285 Mbps auf 336 Mbps Durchschnitt pro Zelle). SK Telecom maß +22 % im Bezirk Gangnam in Spitzenstunden (von 310 Mbps auf 378 Mbps).
Vorstadt (<500 Nutzer/km²): +8 bis +12 % Verbesserung. Deutsche Telekom verzeichnete +11 % in Berlins Außenbezirken. Vodafone meldete +8 % auf Vorstadtstandorten in London.
Ländlich (<50 Nutzer/km²): +3 bis +5 % — statistisch signifikant, aber operativ geringfügig. Der KI-Scheduler hat weniger Nutzer zu optimieren, was die Mehrnutzer-Diversity-Gewinne begrenzt.
Innenbereich (Unternehmen/Stadion): +25 bis +30 % in hochdichten Veranstaltungsorten. Rakutens Einsatz im Tokyo Dome zeigte +28 % während eines ausverkauften Baseballspiels (45.000 gleichzeitige Geräte).

Das Muster ist klar: Der Durchsatzvorteil von AI-RAN skaliert mit der Nutzerdichte. Dies stimmt mit dem zugrundeliegenden Mechanismus überein — KI-Scheduler nutzen Mehrnutzer-Diversity effektiver als proportional-faire Algorithmen, wenn es viele Nutzer mit unterschiedlichen Kanalbedingungen gibt.

Latenz: Das überraschendste Ergebnis

Latenz-Ergebnisse waren die kontraintuitivsten. Die durchschnittliche Latenz verbesserte sich moderat (5 bis 15 %), aber die 99. Perzentil-Latenz (Tail-Latenz) — die Kennzahl, die für Echtzeit-Anwendungen am wichtigsten ist — zeigte in einigen Versuchen dramatische Verbesserungen und in anderen Verschlechterungen.

Betreiber	Änderung Durchschn.-Latenz	Änderung P99-Latenz	Anmerkungen
T-Mobile US	-12 %	-35 %	Großraum Denver, 5G NR n41
Rakuten Mobile	-8 %	-42 %	Tokio, O-RAN 4G+5G
Deutsche Telekom	-15 %	+8 %	Berlin, Nokia AirScale
SK Telecom	-10 %	-28 %	Seoul, Samsung vRAN
Vodafone UK	-6 %	+12 %	London, Ericsson RAN

Die Divergenz in den P99-Ergebnissen ist bedeutsam. Betreiber, die O-RAN-basierte Architekturen verwenden (Rakuten, T-Mobile), verzeichneten große Reduzierungen der Tail-Latenz, während jene mit proprietären Vendor-Stacks (Deutsche Telekom auf Nokia, Vodafone auf Ericsson) einen P99-Anstieg sahen. Die wahrscheinliche Erklärung: O-RANs Near-RT RIC erlaubt KI-Inferenz innerhalb der 10-ms-Regelschleife, während proprietäre Architekturen einen zusätzlichen Inferenz-Hop hinzufügen, der unter Last gelegentlich das Latenzbudget überschreitet. Dies ist ein Architekturproblem, kein KI-Problem — und es deutet darauf hin, dass AI-RAN-Vorteile auf disaggregierter, O-RAN-konformer Infrastruktur maximiert werden.

Energieeffizienz: Der Treiber des Geschäftsszenarios

Wenn Durchsatz- und Latenzverbesserungen inkrementell sind, sind Energieeinsparungen transformativ — und hier präsentiert AI-RAN sein stärkstes Geschäftsszenario.

Alle Betreiber meldeten Energiereduzierungen mit bemerkenswert konsistenten Ergebnissen:

Schlafmodus-Optimierung: KI-gesteuerte Zellschlaf-/Aufwachzyklen reduzierten den Energieverbrauch in verkehrsschwachen Zeiten (Mitternacht bis 6 Uhr) um 18 bis 25 %. T-Mobile meldete 22 % nächtliche Einsparungen über 1.200 Denver-Standorte. Deutsche Telekom erzielte 25 % — den höchsten Wert — indem sie der KI erlaubte, einzelne MIMO-Schichten statt ganzer Zellen abzuschalten.
Beamforming-Optimierung: KI-gesteuertes Strahlmanagement reduzierte den Leistungsverstärkerverbrauch in Spitzenstunden um 8 bis 12 %. SK Telecoms Samsung-vRAN-Einsatz zeigte 11 % Einsparungen in Spitzenstunden durch Vorhersage der Nutzerbewegung und proaktive Strahlausrichtung statt reaktiver Anpassung.
Kühlkostenreduzierung: Geringere HF-Ausgangsleistung führte zu 5 bis 8 % Kühlkosteneinsparungen an Turmstandorten. Vodafone meldete 7 % Kühlreduzierung über 200 Londoner Makrostandorte.
Gesamte Energieeinsparungen: Über alle Betreiber reduzierte AI-RAN den standortbezogenen Energieverbrauch im Durchschnitt um 15 bis 22 %, was je nach lokalen Stromkosten jährlichen Einsparungen von 8.000 bis 15.000 Dollar pro Makrostandort entspricht.

In großem Maßstab gesehen verändern diese Zahlen das Investitionsszenario. T-Mobile schätzt 120 Millionen Dollar jährliche Energieeinsparungen über sein US-Netz, wenn AI-RAN landesweit eingesetzt wird. Für den europäischen Fußabdruck der Deutschen Telekom beläuft sich die projizierte Einsparung auf 200 Millionen Euro pro Jahr. Energieeinsparungen allein rechtfertigen den AI-RAN-Einsatz innerhalb von 18 bis 24 Monaten für die meisten Tier-1-Betreiber — selbst ohne Berücksichtigung von Durchsatz- und Latenzgewinnen.

Spektrale Effizienz: +10 bis +18 % unter realen Bedingungen

Spektrale Effizienz — Bits pro Sekunde pro Hertz — ist das grundlegende Maß dafür, wie gut ein Funksystem sein zugewiesenes Spektrum nutzt. AI-RAN-Verbesserungen hier haben direkten finanziellen Wert, da sie dem Besitz von mehr Spektrum ohne Kauf entsprechen.

Ergebnisse nach Betreiber:

SK Telecom: +18 % Verbesserung der spektralen Effizienz (von 7,2 bps/Hz auf 8,5 bps/Hz Durchschnitt) im 3,5-GHz-n78-Band. Dies ist der höchste gemeldete Wert und spiegelt Samsungs aggressiven KI-Scheduler wider, der ein Transformer-basiertes Modell nutzt, das auf 18 Monaten Netzdaten trainiert wurde.
T-Mobile: +14 % (von 6,8 auf 7,8 bps/Hz) auf n41 (2,5 GHz). Das KI-Modell koordiniert das Scheduling gleichzeitig über 3 Trägerkomponenten.
Rakuten: +12 % über ihr gemeinsam genutztes 4G/5G-Spektrum. Bemerkenswert: Der KI-Scheduler wies Spektrum dynamisch in Echtzeit zwischen 4G und 5G basierend auf der Nachfrage um — etwas, das ihr traditioneller Scheduler nicht konnte.
Vodafone: +10 % (von 5,9 auf 6,5 bps/Hz) bei 3,5 GHz. Die geringste Verbesserung, zurückgeführt auf Vodafones bereits optimierte Ericsson-Konfiguration, die wenig Spielraum für KI-Gewinne lässt.

Handover und Mobilität: Gemischte Ergebnisse

Die Handover-Leistung — wie reibungslos Nutzer zwischen Zellen wechseln — zeigte die inkonsistentesten Ergebnisse über alle Versuche hinweg. Dies ist eine kritische Kennzahl für vernetzte Fahrzeuge und mobile VR/AR-Anwendungen.

T-Mobile meldete eine Verbesserung der Handover-Erfolgsrate von 98,2 % auf 99,1 % mit KI-gestützter Handover-Vorhersage. Das KI-Modell sagt vorher, zu welcher Zelle ein Nutzer 2 bis 3 Sekunden vor dem Handover-Ereignis wechseln wird, und ermöglicht so die Vorvorbereitung der Zielzellressourcen. Jedoch verursachten Fehlvorhersagen (etwa 8 % der Fälle) unnötige Ressourcenreservierungen und erhöhten leicht die Interferenz auf benachbarten Zellen.

Rakutens Ergebnisse waren dramatischer: Die Handover-Fehlerrate sank in ihrem Tokioter Einsatz von 1,5 % auf 0,4 %. Ihr Vorteil: Rakutens vollständig cloud-native O-RAN-Architektur ermöglicht es dem KI-Modell, gleichzeitig auf Daten aller benachbarten Zellen zuzugreifen, anstatt sich allein auf Messberichte des Nutzergeräts zu verlassen.

Deutsche Telekom und Vodafone meldeten keine statistisch signifikante Änderung in der Handover-Leistung. Beide Betreiber merkten an, dass ihre bestehenden Handover-Algorithmen bereits stark für europäische städtische Umgebungen abgestimmt waren und die KI-Modelle nicht über ausreichende Trainingsdaten verfügten, um jahrzehntelange manuelle Optimierung zu übertreffen.

NVIDIA Aerial: Labor versus Feldrealität

NVIDIAs Aerial-Plattform — ein GPU-beschleunigtes Software-RAN, das auf NVIDIA-konvergierten Beschleunigern läuft — veröffentlichte Labor-Benchmarks, die eine Durchsatzverbesserung von 40 % und eine Energiereduzierung von 50 % gegenüber traditionellem DSP-basiertem RAN beanspruchen. Diese Zahlen wurden in Branchenpräsentationen weithin zitiert.

Die Feldversuchsdaten erzählen eine nuanciertere Geschichte. T-Mobiles Denver-Einsatz, der NVIDIA Aerial auf einem Teil der Standorte nutzte, zeigte eine Durchsatzverbesserung von 18 % — weniger als die Hälfte des Labor-Anspruchs. Die Lücke wird durch reale Faktoren erklärt, die bei Labortests fehlen: Inter-Zell-Interferenz, nicht-ideale Ausbreitung, Gerätediversität (Labortests verwenden Referenzgeräte) und der Rechenaufwand für die KI-Inferenz neben der Echtzeitsignalverarbeitung auf gemeinsam genutzten GPU-Ressourcen.

NVIDIA erkannte die Lücke in einem Blog-Beitrag vom März 2026 an und stellte fest, dass „Labor-Benchmarks die theoretische Obergrenze der Leistung darstellen" und dass „Feldeinsätze typischerweise 40 bis 60 % der Labor-Gewinne je nach Umgebungskomplexität erreichen". Dies ist eine ehrliche Einschätzung, und das Feldergebnis von 18 % liegt innerhalb von NVIDIAs angegebener Spanne.

Was NVIDIA Aerial konsistent bietet, ist operative Flexibilität. Die Plattform unterstützt Over-the-Air-Modellaktualisierungen, die es Betreibern ermöglichen, KI-Modelle monatlich neu zu trainieren, wenn sich die Netzbedingungen ändern. Traditionelle RAN-Anbieter erfordern Software-Upgrades mit Ausfallzeiten; Aerial aktualisiert Modelle im Hintergrund ohne Serviceunterbrechung.

Nokia AirFrame AI: Der Ansatz der etablierten Anbieter

Nokias Ansatz unterscheidet sich grundlegend von NVIDIAs. Anstatt den RAN-Prozessor durch GPUs zu ersetzen, fügt Nokia neben der bestehenden Basisbandhardware einen KI-Inferenzbeschleuniger hinzu. Das AirFrame-AI-Modul verbindet sich mit Nokias AirScale-Plattform und führt trainierte Modelle aus, die Scheduling, Leistungssteuerung und Beamforming optimieren.

Nokias veröffentlichte Benchmarks zeigen 12 bis 15 % Durchsatzverbesserung und 18 bis 20 % Energieeinsparungen — konservativer als NVIDIAs Ansprüche, aber näher an dem, was Betreiber tatsächlich in Feldversuchen gemessen haben. Der Deutsche-Telekom-Berlin-Versuch mit Nokia AirFrame AI erzielte 11 % Durchsatz- und 25 % Energieverbesserung — gut übereinstimmend mit Nokias angegebener Spanne.

Der Kompromiss: Nokias Ansatz erfordert die Bindung des Betreibers an das AirScale-Ökosystem. KI-Modelle werden auf Nokias Cloud-Plattform trainiert und über Nokias Managementsystem eingesetzt. Betreiber können weder eigene Modelle einbringen noch KI-Frameworks von Drittanbietern verwenden. Für Betreiber, die sich zur Nokia-Plattform bekennen, ist dies akzeptabel. Für jene, die Multi-Vendor-O-RAN-Strategien verfolgen, ist es ein Ausschlusskriterium.

Samsung vRAN AI: Training auf Betreiberdaten

Samsungs AI-RAN-Strategie betont das Training von Modellen auf betreiberspezifischen Daten statt auf generischen Netzsimulationen. SK Telecoms Versuch verwendete ein Samsung-vRAN-Modell, das auf 18 Monaten SKT-eigener Netztelemetrie trainiert wurde — 4,2 TB Scheduling-Entscheidungen, Kanalmessungen und Nutzermobilitätsmuster.

Das Ergebnis: SK Telecom erzielte die höchste spektrale Effizienzverbesserung (+18 %) aller Betreiber in unserem Datensatz. Samsung führt dies auf die tiefe Vertrautheit des Modells mit SKTs spezifischer Ausbreitungsumgebung, Nutzerverhalten und Verkehrsprofilen zurück. Ein generisches, auf synthetischen Daten trainiertes Modell erzielte in derselben Umgebung bei einem kontrollierten Vergleich nur +7 % — was bestätigt, dass betreiberspezifische Trainingsdaten der wichtigste Einzelfaktor für die AI-RAN-Leistung sind.

Samsungs Ansatz hat eine erhebliche Skalierungsbeschränkung: Jeder Betreibereinsatz erfordert monatelange Datenerhebung und individuelles Modell-Training. Samsung adressiert dies mit einem Federated-Learning-Framework, das mehreren Betreibern ermöglicht, Modelle gemeinsam zu trainieren ohne Rohdaten zu teilen, aber dieses System befindet sich mit nur SKT und KDDI als Teilnehmer im Q1 2026 noch in der Pilotphase.

Das O-RAN ML Framework: AI-RAN standardisieren

Das ML-Framework der O-RAN Alliance, in den technischen Spezifikationen des O-RAN WG2 festgelegt, zielt darauf ab, zu standardisieren, wie KI-Modelle in Multi-Vendor-RAN-Umgebungen trainiert, eingesetzt und verwaltet werden. Ab Release 3 (finalisiert Q4 2025) definiert das Framework:

Modell-Hosting auf Near-RT RIC (Inferenz innerhalb der 10-ms-Schleife) und Non-RT RIC (Inferenz innerhalb der 1-Sekunden-Schleife)
Standard-Schnittstellen (A1, E2) für die Modell-RAN-Kommunikation
Modell-Lifecycle-Management: Training, Validierung, Einsatz, Überwachung, Rollback
Leistungsüberwachung und Drift-Erkennung — automatisches Markieren, wenn die Leistung eines eingesetzten Modells nachlässt

Rakutens Einsatz ist die einzige großangelegte Produktionsimplementierung des O-RAN ML Frameworks. Ihre Ergebnisse validieren die Architektur: Der Near-RT RIC erzielte in 99,7 % der Scheduling-Intervalle eine Inferenzlatenz unter 5 ms und bestätigt, dass KI-Optimierung in Echtzeit innerhalb von O-RANs Regelschleifenbeschränkungen machbar ist.

Interoperabilität bleibt jedoch eine Herausforderung. Bei einem O-RAN-Alliance-Plugfest im Februar 2026 führten nur 3 von 8 Anbieter-Kombinationen erfolgreich ein gemeinsames KI-Modell über verschiedene RIC-Implementierungen aus. Die Spezifikation lässt genug Mehrdeutigkeit in Datenformaten und Modellschnittstellen, dass anbieterspezifische Anpassungen noch erforderlich sind.

Kostenanalyse: Was AI-RAN tatsächlich kostet

Den Einsatz von AI-RAN gibt es nicht umsonst. Betreiber sehen sich drei Kostenkategorien gegenüber:

Hardware: GPU-Beschleuniger (NVIDIA A100/H100 für Aerial) oder KI-Koprozessoren (Nokia AirFrame AI-Modul) fügen pro Standort 5.000 bis 15.000 Dollar hinzu. Für einen Tier-1-Betreiber mit 30.000 Standorten liegen die Hardwarekosten zwischen 150 und 450 Millionen Dollar.
Trainingsinfrastruktur: Cloud-Computing für das Modell-Training kostet 2 bis 5 Millionen Dollar pro Betreiber pro Jahr. Samsungs betreiberspezifischer Ansatz erfordert mehr Trainingsrechnen als generische Modelle.
Personal: AI-RAN erfordert Data Scientists und ML-Ingenieure, die die meisten Betreiber derzeit nicht beschäftigen. Die typische Teamgröße beträgt 15 bis 30 Spezialisten, was jährlich 3 bis 8 Millionen Dollar an Gehältern kostet.

Diesen Kosten gegenüber produzieren die Energieeinsparungen allein (120 bis 200 Millionen Dollar jährlich für einen Tier-1-Betreiber) innerhalb von 2 bis 3 Jahren einen positiven ROI. Addiert man den Umsatzzuwachs durch verbesserten Durchsatz und Kapazität (geschätzte Steigerung des ARPU um 3 bis 5 % durch bessere Nutzererfahrung), sinkt die Amortisationszeit auf 18 Monate.

Ausblick: Was sich 2027 ändert

Drei Entwicklungen werden die AI-RAN-Benchmarks in den nächsten 12 Monaten neu gestalten:

1. Foundation Models für RAN: Sowohl NVIDIA als auch Ericsson haben „Foundation Model"-Ansätze angekündigt — große KI-Modelle, die auf vielfältigen Netzdaten vortrainiert sind und mit minimalen zusätzlichen Daten für spezifische Betreiber feinabgestimmt werden können. Bei Erfolg würde dies Samsungs Datenerhebungsengpass beseitigen und leistungsstarkes AI-RAN demokratisieren.

2. KI-natives 6G-Design: Das 3GPP Study Item zu KI/ML für NR (Release 19, erwartet Q3 2026) wird KI-Modell-Austauschformate und Leistungsanforderungen standardisieren. Dies schafft eine gemeinsame Basis zum Vergleich von AI-RAN-Implementierungen über Anbieter hinweg — etwas, das heute nicht existiert.

3. Edge-Inferenz-Hardware: Nächste-Generation-Inferenzchips (NVIDIA Blackwell, Qualcomm Cloud AI 200, Intel Gaudi 3) werden die standortbezogenen Hardwarekosten um 40 bis 60 % reduzieren und gleichzeitig den Inferenzdurchsatz verdoppeln. Dies adressiert die primäre Barriere für den universellen AI-RAN-Einsatz: die standortbezogene Wirtschaftlichkeit.

Die Benchmarks 2026 etablieren eine Basislinie. AI-RAN liefert messbare, reproduzierbare Vorteile — aber das Ausmaß variiert erheblich je nach Architektur, Anbieter und Umgebung. Die Gewinner werden Betreiber sein, die in Datenerhebungsinfrastruktur und O-RAN-konforme Architekturen investieren, die KIs Fähigkeit zur Optimierung in Echtzeit maximieren. Die Technologie funktioniert. Die Frage ist nicht mehr, ob KI RAN verbessert — sondern wie viel, wo und zu welchen Kosten.