Бенчмарки производительности AI-RAN 2026

Искусственный интеллект, применяемый в сетях радиодоступа — AI-RAN — перешёл со слайдов конференций в производственную инфраструктуру. В первом квартале 2026 года три оператора первого уровня опубликовали независимые результаты полевых испытаний, сравнивающих AI-оптимизированную RAN с традиционными конфигурациями на идентичном оборудовании. Впервые в отрасли появились данные производительности в одинаковых условиях. Результаты неоднородны: значительные улучшения в одних областях, незначительные — в других, и несколько случаев, когда AI фактически ухудшила производительность. Этот отчёт компилирует и анализирует все публично доступные бенчмарки.

Методология: что и как мы измеряли

Отчёт агрегирует данные из семи источников: T-Mobile US (полевые испытания в марте 2026, метрополия Денвера), Rakuten Mobile (производственные данные за Q4 2025, Токио), Deutsche Telekom (испытания в феврале 2026, Берлин), SK Telecom (испытания в январе 2026, Сеул), Vodafone UK (испытания в марте 2026, Лондон), бенчмарки платформы NVIDIA Aerial (лабораторные условия) и бенчмарки Nokia AirFrame AI (лаборатория + поле). Все результаты сравнивают конфигурации с включённым и выключенным AI на одном и том же оборудовании, что исключает влияние различий в оснащении.

Ключевые отслеживаемые метрики: нисходящая пропускная способность (Мбит/с на соту), восходящая пропускная способность, средняя задержка (мс), задержка 99-го процентиля, спектральная эффективность (бит/с/Гц), потребление энергии (кВт·ч на ТБ переданных данных), процент успешных хэндоверов и доля обрывов звонков. В случаях, когда операторы фиксировали разные метрики, мы приводим их к единым единицам и отмечаем различия в методологии.

Пропускная способность: прирост 8–22%, сильно зависящий от сценария

Главный показатель, который большинство операторов выделяло в первую очередь, — улучшение пропускной способности. По всем семи источникам AI-RAN обеспечил:

Плотная городская среда (>1 000 пользователей/км²): прирост нисходящей пропускной способности на 15–22% в среднем. T-Mobile сообщила о +18% в центре Денвера (с 285 до 336 Мбит/с в среднем на соту). SK Telecom зафиксировала +22% в районе Каннам в часы пик (с 310 до 378 Мбит/с).
Пригород (<500 пользователей/км²): прирост 8–12%. Deutsche Telekom получила +11% в периферийных районах Берлина. Vodafone сообщила о +8% на пригородных объектах Лондона.
Сельская местность (<50 пользователей/км²): 3–5% — статистически значимо, но операционно незначительно. Планировщик AI имеет меньше пользователей для оптимизации, что ограничивает выгоды от многопользовательского разнообразия.
Внутри помещений (корпоративные объекты/стадионы): +25–30% на площадках с высокой плотностью. Развёртывание Rakuten на Токио Доум показало +28% во время аншлагового бейсбольного матча (45 000 одновременно подключённых устройств).

Закономерность очевидна: преимущество AI-RAN по пропускной способности растёт вместе с плотностью пользователей. Это согласуется с базовым механизмом — AI-планировщики более эффективно используют многопользовательское разнообразие по сравнению с алгоритмами пропорционального разделения, когда есть много пользователей с разнообразными условиями канала для выбора.

Задержка: самый неожиданный результат

Результаты по задержке оказались наиболее неинтуитивными. Средняя задержка улучшилась умеренно (5–15%), но задержка 99-го процентиля (хвостовая задержка) — метрика, наиболее важная для приложений реального времени — показала драматическое улучшение в одних испытаниях и ухудшение в других.

Оператор	Изменение средней задержки	Изменение задержки P99	Примечания
T-Mobile US	-12%	-35%	Метрополия Денвера, 5G NR n41
Rakuten Mobile	-8%	-42%	Токио, O-RAN 4G+5G
Deutsche Telekom	-15%	+8%	Берлин, Nokia AirScale
SK Telecom	-10%	-28%	Сеул, Samsung vRAN
Vodafone UK	-6%	+12%	Лондон, Ericsson RAN

Расхождение в результатах P99 весьма значительно. Операторы, использующие архитектуры на базе O-RAN (Rakuten, T-Mobile), зафиксировали значительное снижение хвостовой задержки, тогда как операторы на традиционных вендорских стеках (Deutsche Telekom на Nokia, Vodafone на Ericsson) получили рост P99. Вероятное объяснение: Near-RT RIC в O-RAN позволяет выполнять инференс AI в пределах 10-миллисекундного контрольного цикла, тогда как проприетарные архитектуры добавляют дополнительный шаг инференса, который иногда превышает бюджет задержки под нагрузкой. Это проблема архитектуры, а не AI — и она указывает на то, что преимущества AI-RAN максимальны на дезагрегированной инфраструктуре, совместимой с O-RAN.

Энергоэффективность: главный бизнес-аргумент

Если улучшения пропускной способности и задержки носят постепенный характер, то экономия энергии трансформационна — и именно здесь AI-RAN выдвигает наиболее весомые бизнес-аргументы.

Все операторы зафиксировали снижение потребления энергии, причём с поразительно согласованными результатами:

Оптимизация режима сна: управляемые AI циклы сна/пробуждения соты снизили потребление энергии на 18–25% в периоды низкого трафика (с полуночи до 6 утра). T-Mobile сообщила об экономии 22% в ночное время на 1 200 объектах в Денвере. Deutsche Telekom достигла 25% — наивысшего показателя — за счёт того, что AI отключала отдельные слои MIMO, а не целые соты.
Оптимизация формирования луча: управление лучом на основе AI снизило потребление усилителей мощности на 8–12% в часы пик. Развёртывание SK Telecom на Samsung vRAN показало 11% экономии в часы пик за счёт прогнозирования движения пользователей и предварительного направления лучей вместо реактивной корректировки.
Снижение расходов на охлаждение: меньшая мощность радиоизлучения привела к 5–8% экономии на охлаждение на объектах башен. Vodafone сообщила о 7% снижении расходов на охлаждение на 200 макросотах в Лондоне.
Общая экономия энергии: в среднем по всем операторам AI-RAN снизил потребление энергии на объект на 15–22%, что соответствует ежегодной экономии $8 000–15 000 на макросоту в зависимости от местных тарифов на электроэнергию.

В масштабе эти цифры меняют инвестиционный расчёт. T-Mobile оценивает ежегодную экономию энергии в $120 млн по всей сети США при повсеместном развёртывании AI-RAN. Для европейского подразделения Deutsche Telekom прогнозируемая экономия составляет €200 млн в год. Только экономия энергии обосновывает развёртывание AI-RAN в течение 18–24 месяцев для большинства операторов первого уровня — даже без учёта улучшений пропускной способности и задержки.

Спектральная эффективность: +10–18% в реальных условиях

Спектральная эффективность — бит в секунду на Герц — является фундаментальной мерой того, насколько хорошо радиосистема использует выделенный спектр. Улучшения AI-RAN здесь имеют прямую финансовую ценность, поскольку равнозначны наличию дополнительного спектра без его покупки.

Результаты по операторам:

SK Telecom: улучшение спектральной эффективности на +18% (с 7,2 до 8,5 бит/с/Гц в среднем) в диапазоне 3,5 ГГц n78. Это наивысший зафиксированный показатель, отражающий агрессивный AI-планировщик Samsung, использующий трансформерную модель, обученную на 18 месяцах сетевых данных.
T-Mobile: +14% (с 6,8 до 7,8 бит/с/Гц) в диапазоне n41 (2,5 ГГц). AI-модель координирует планирование одновременно по 3 несущим компонентам.
Rakuten: +12% по совместному спектру 4G/5G. Примечательно, что AI-планировщик динамически перераспределял спектр между 4G и 5G в режиме реального времени на основе спроса — что традиционный планировщик делать не мог.
Vodafone: +10% (с 5,9 до 6,5 бит/с/Гц) в диапазоне 3,5 ГГц. Наименьший прирост, объясняемый уже оптимизированной конфигурацией Ericsson Vodafone, оставляющей меньше пространства для улучшений AI.

Хэндовер и мобильность: неоднозначные результаты

Производительность хэндовера — насколько плавно пользователи переходят между сотами — показала наиболее непоследовательные результаты среди всех испытаний. Это критическая метрика для подключённых транспортных средств и мобильных приложений VR/AR.

T-Mobile сообщила об улучшении процента успешных хэндоверов с 98,2% до 99,1% благодаря AI-прогнозированию хэндовера. AI-модель предсказывает, в какую соту переместится пользователь за 2–3 секунды до события хэндовера, позволяя заблаговременно подготовить ресурсы целевой соты. Однако ложные прогнозы (примерно 8% случаев) вызывали ненужное резервирование ресурсов, незначительно увеличивая помехи в соседних сотах.

Результаты Rakuten оказались более впечатляющими: частота неудачных хэндоверов снизилась с 1,5% до 0,4% в токийском развёртывании. Их преимущество: полностью облачная нативная архитектура O-RAN Rakuten позволяет AI-модели одновременно получать данные от всех соседних сот, а не полагаться исключительно на отчёты об измерениях от устройства пользователя.

Deutsche Telekom и Vodafone не зафиксировали статистически значимых изменений в производительности хэндовера. Оба оператора отметили, что их существующие алгоритмы хэндовера уже были глубоко настроены для европейской городской среды, и AI-модели не смогли превзойти результаты десятилетий ручной оптимизации.

NVIDIA Aerial: лаборатория против реальности поля

Платформа NVIDIA Aerial — программная RAN с GPU-ускорением, работающая на конвергентных ускорителях NVIDIA — опубликовала лабораторные бенчмарки, заявив о 40% улучшении пропускной способности и 50% снижении потребления энергии по сравнению с традиционной RAN на базе DSP. Эти цифры широко цитируются в отраслевых презентациях.

Данные полевых испытаний рассказывают более нюансированную историю. Развёртывание T-Mobile в Денвере, использующее NVIDIA Aerial на части объектов, показало 18% улучшение пропускной способности — менее половины от лабораторного заявления. Разрыв объясняется реальными факторами, отсутствующими в лабораторных тестах: межсотовые помехи, неидеальное распространение, разнообразие устройств (лабораторные тесты используют эталонные устройства) и вычислительные издержки параллельного выполнения инференса AI и обработки сигналов в реальном времени на общих GPU-ресурсах.

NVIDIA признала этот разрыв в публикации в блоге в марте 2026 года, отметив, что «лабораторные бенчмарки представляют теоретическую максимальную производительность» и что «полевые развёртывания обычно достигают 40–60% от лабораторных результатов в зависимости от сложности среды». Это честная оценка, и 18% полевой результат укладывается в заявленный NVIDIA диапазон.

То, что NVIDIA Aerial стабильно обеспечивает, — это операционная гибкость. Платформа поддерживает обновление моделей по воздуху, позволяя операторам ежемесячно переобучать AI-модели по мере изменения условий сети. Традиционные RAN-вендоры требуют обновлений программного обеспечения с простоем; Aerial обновляет модели в фоновом режиме без прерывания сервиса.

Nokia AirFrame AI: подход действующего игрока

Подход Nokia принципиально отличается от подхода NVIDIA. Вместо замены RAN-процессора GPU Nokia добавляет ускоритель инференса AI рядом с существующим оборудованием базовой полосы. Модуль Nokia AirFrame AI подключается к платформе Nokia AirScale и выполняет обученные модели, оптимизирующие планирование, управление мощностью и формирование луча.

Опубликованные Nokia бенчмарки показывают улучшение пропускной способности на 12–15% и экономию энергии 18–20% — более консервативно, чем заявления NVIDIA, но ближе к тому, что операторы реально измерили в полевых испытаниях. Берлинское испытание Deutsche Telekom с Nokia AirFrame AI показало 11% улучшения пропускной способности и 25% экономии энергии — хорошо согласуется с заявленным Nokia диапазоном.

Компромисс: подход Nokia требует привязки к экосистеме AirScale. AI-модели обучаются на облачной платформе Nokia и развёртываются через систему управления Nokia. Операторы не могут использовать собственные модели или сторонние AI-фреймворки. Для операторов, приверженных платформе Nokia, это приемлемо. Для тех, кто реализует стратегии мультивендорного O-RAN, это неприемлемо.

Samsung vRAN AI: обучение на данных оператора

Стратегия Samsung в области AI-RAN делает акцент на обучении моделей на специфических данных оператора, а не на общих симуляциях сети. В испытании SK Telecom использовалась модель Samsung vRAN, обученная на 18 месяцах собственной сетевой телеметрии SKT — 4,2 ТБ решений о планировании, измерений канала и паттернов мобильности пользователей.

Результат: SK Telecom достигла наибольшего улучшения спектральной эффективности (+18%) среди всех операторов в нашем наборе данных. Samsung объясняет это глубоким знакомством модели со специфической средой распространения SKT, паттернами поведения пользователей и профилями трафика. Обобщённая модель, обученная на синтетических данных, достигла лишь +7% в той же среде в ходе контролируемого сравнения — подтверждая, что специфические данные оператора являются единственным наиболее важным фактором производительности AI-RAN.

Подход Samsung имеет существенное ограничение масштабируемости: каждое развёртывание у оператора требует месяцев сбора данных и обучения кастомной модели. Samsung решает эту проблему с помощью фреймворка федеративного обучения, позволяющего нескольким операторам совместно обучать модели без обмена сырыми данными, но эта система всё ещё находится в пилотной фазе: по состоянию на Q1 2026 в ней участвуют только SKT и KDDI.

ML-фреймворк O-RAN: стандартизация AI-RAN

ML-фреймворк Альянса O-RAN, закреплённый в технических спецификациях O-RAN WG2, нацелен на стандартизацию обучения, развёртывания и управления AI-моделями в мультивендорных RAN-средах. По состоянию на Релиз 3 (финализирован Q4 2025), фреймворк определяет:

Размещение моделей на Near-RT RIC (инференс в пределах 10-мс цикла) и Non-RT RIC (инференс в пределах 1 секунды)
Стандартные интерфейсы (A1, E2) для взаимодействия модели с RAN
Управление жизненным циклом модели: обучение, валидация, развёртывание, мониторинг, откат
Мониторинг производительности и обнаружение дрейфа — автоматическая сигнализация при снижении производительности развёрнутой модели

Развёртывание Rakuten — единственная крупномасштабная производственная реализация ML-фреймворка O-RAN. Их результаты подтверждают архитектуру: Near-RT RIC обеспечивал задержку инференса менее 5 мс в 99,7% интервалов планирования, подтверждая осуществимость оптимизации AI в реальном времени в рамках ограничений управляющего цикла O-RAN.

Тем не менее совместимость остаётся проблемой. На плагфесте Альянса O-RAN в феврале 2026 года только 3 из 8 комбинаций вендоров успешно запустили общую AI-модель на разных реализациях RIC. Спецификация оставляет достаточно неоднозначности в форматах данных и интерфейсах моделей, что вендорско-специфические адаптации по-прежнему необходимы.

Анализ затрат: что реально стоит AI-RAN

Развёртывание AI-RAN не бесплатно. Операторы сталкиваются с тремя категориями затрат:

Оборудование: GPU-ускорители (NVIDIA A100/H100 для Aerial) или AI-сопроцессоры (модуль Nokia AirFrame AI) добавляют $5 000–15 000 на объект. Для оператора первого уровня с 30 000 объектов затраты на оборудование составят от $150 до $450 млн.
Инфраструктура обучения: облачные вычисления для обучения моделей стоят $2–5 млн на оператора в год. Специфический подход Samsung требует больше вычислительных ресурсов, чем обобщённые модели.
Персонал: AI-RAN требует специалистов по данным и ML-инженеров, которых большинство операторов сейчас не имеет. Типичный размер команды — 15–30 специалистов, ежегодные затраты на зарплаты $3–8 млн.

На фоне этих затрат только экономия энергии ($120–200 млн ежегодно для оператора первого уровня) обеспечивает положительный ROI в течение 2–3 лет. С учётом прироста выручки от улучшения пропускной способности и ёмкости (оценочное увеличение ARPU на 3–5% за счёт лучшего пользовательского опыта) срок окупаемости сокращается до 18 месяцев.

Перспективы: что изменится в 2027 году

Три разработки изменят бенчмарки AI-RAN в течение следующих 12 месяцев:

1. Фундаментальные модели для RAN: NVIDIA и Ericsson объявили о подходах с «фундаментальными моделями» — крупными AI-моделями, предварительно обученными на разнообразных сетевых данных, которые можно дообучить для конкретных операторов с минимальным количеством дополнительных данных. В случае успеха это устранит узкое место Samsung по сбору данных и демократизирует высокопроизводительный AI-RAN.

2. AI-нативный дизайн 6G: Исследовательский элемент 3GPP по AI/ML для NR (Релиз 19, ожидаемый Q3 2026) стандартизирует форматы обмена AI-моделями и требования к производительности. Это создаст общую базу для сравнения реализаций AI-RAN от разных вендоров — чего сегодня не существует.

3. Оборудование для граничного инференса: чипы инференса следующего поколения (NVIDIA Blackwell, Qualcomm Cloud AI 200, Intel Gaudi 3) снизят затраты на оборудование на объект на 40–60%, удвоив при этом пропускную способность инференса. Это устраняет главный барьер для повсеместного развёртывания AI-RAN: экономику на уровне объекта.

Бенчмарки 2026 года устанавливают базовый уровень. AI-RAN обеспечивает измеримые, воспроизводимые результаты — но их масштаб существенно варьируется в зависимости от архитектуры, вендора и среды. Победителями станут операторы, инвестирующие в инфраструктуру сбора данных и архитектуры, совместимые с O-RAN, которые максимизируют способность AI к оптимизации в реальном времени. Технология работает. Вопрос больше не в том, улучшает ли AI производительность RAN — а в том, насколько, где и какой ценой.