Benchmarks de Desempenho AI-RAN 2026

A inteligência artificial aplicada às redes de acesso de rádio — AI-RAN — saiu das apresentações em conferências e entrou na infraestrutura de produção. No primeiro trimestre de 2026, três operadoras Tier-1 publicaram resultados independentes de testes de campo comparando RAN otimizada por IA com configurações convencionais no mesmo hardware. Pela primeira vez, o setor dispõe de dados de desempenho comparáveis em condições idênticas. Os resultados são heterogêneos: ganhos significativos em algumas áreas, melhorias marginais em outras, e alguns casos em que a IA chegou a degradar o desempenho. Este relatório compila e analisa todos os benchmarks disponíveis publicamente.

Metodologia: O Que Medimos e Como

Este relatório agrega dados de sete fontes: T-Mobile US (teste de campo de março de 2026, área metropolitana de Denver), Rakuten Mobile (dados de produção do Q4 2025, Tóquio), Deutsche Telekom (teste de fevereiro de 2026, Berlim), SK Telecom (teste de janeiro de 2026, Seul), Vodafone UK (teste de março de 2026, Londres), benchmarks da plataforma NVIDIA Aerial (condições de laboratório) e benchmarks Nokia AirFrame AI (laboratório + campo). Todos os resultados comparam configurações com IA ativada versus IA desativada no mesmo hardware, eliminando a variabilidade de equipamentos.

Métricas monitoradas: throughput de downlink (Mbps por célula), throughput de uplink, latência média (ms), latência no percentil 99, eficiência espectral (bps/Hz), consumo de energia (kWh por TB transportado), taxa de sucesso de handover e taxa de queda de chamadas. Onde os operadores reportaram métricas diferentes, normalizamos para unidades comuns e registramos as diferenças metodológicas.

Throughput: Ganhos de +8-22%, Altamente Dependentes do Cenário

O número principal com que a maioria dos operadores liderou foi a melhoria de throughput. Entre todas as sete fontes, o AI-RAN entregou:

Urbano denso (>1.000 usuários/km²): +15-22% de melhoria média no throughput de downlink. A T-Mobile reportou +18% no centro de Denver (de 285 Mbps para 336 Mbps de média por célula). A SK Telecom mediu +22% no distrito de Gangnam durante os horários de pico (de 310 Mbps para 378 Mbps).
Suburbano (<500 usuários/km²): +8-12% de melhoria. A Deutsche Telekom obteve +11% nos distritos externos de Berlim. A Vodafone reportou +8% em sites suburbanos de Londres.
Rural (<50 usuários/km²): +3-5% — estatisticamente significativo, mas operacionalmente menor. O escalonador de IA tem menos usuários para otimizar, limitando os ganhos de diversidade multiusuário.
Indoor (corporativo/estádio): +25-30% em locais de alta densidade. A implantação da Rakuten no Tokyo Dome mostrou +28% durante um jogo de beisebol com lotação esgotada (45.000 dispositivos simultâneos).

O padrão é claro: a vantagem de throughput do AI-RAN escala com a densidade de usuários. Isso está alinhado com o mecanismo subjacente — os escalonadores de IA exploram a diversidade multiusuário de forma mais eficaz do que os algoritmos de fair proporcional quando há muitos usuários com condições de canal diversas para escolher.

Latência: O Resultado Mais Surpreendente

Os resultados de latência foram os mais contraintuitivos. A latência média melhorou modestamente (5-15%), mas a latência no percentil 99 (cauda) — a métrica mais importante para aplicações em tempo real — mostrou melhoria dramática em alguns testes e degradação em outros.

Operadora	Variação Latência Média	Variação Latência P99	Notas
T-Mobile US	-12%	-35%	Área metropolitana de Denver, 5G NR n41
Rakuten Mobile	-8%	-42%	Tóquio, O-RAN 4G+5G
Deutsche Telekom	-15%	+8%	Berlim, Nokia AirScale
SK Telecom	-10%	-28%	Seul, Samsung vRAN
Vodafone UK	-6%	+12%	Londres, Ericsson RAN

A divergência nos resultados de P99 é significativa. Operadoras que utilizam arquiteturas baseadas em O-RAN (Rakuten, T-Mobile) obtiveram grandes reduções na latência de cauda, enquanto as que operam em stacks tradicionais de fornecedores (Deutsche Telekom na Nokia, Vodafone na Ericsson) viram o P99 aumentar. A provável explicação: o Near-RT RIC do O-RAN permite inferência de IA dentro do loop de controle de 10 ms, enquanto arquiteturas proprietárias adicionam um salto de inferência extra que ocasionalmente ultrapassa o orçamento de latência sob carga. Trata-se de um problema de arquitetura, não de IA — e isso sugere que os benefícios do AI-RAN são maximizados em infraestrutura desagregada e compatível com O-RAN.

Eficiência Energética: O Motor do Caso de Negócio

Se as melhorias de throughput e latência são incrementais, a economia de energia é transformacional — e é aqui que o AI-RAN apresenta seu argumento de negócio mais forte.

Todos os operadores reportaram reduções de energia, com resultados notavelmente consistentes:

Otimização do modo de suspensão: Os ciclos de suspensão/ativação de células controlados por IA reduziram o consumo de energia em 18-25% durante períodos de baixo tráfego (meia-noite às 6h). A T-Mobile reportou 22% de economia noturna em 1.200 sites em Denver. A Deutsche Telekom alcançou 25% — a maior cifra — permitindo que a IA desligasse camadas MIMO individuais em vez de células inteiras.
Otimização de beamforming: O gerenciamento de feixes orientado por IA reduziu o consumo dos amplificadores de potência em 8-12% durante os horários de pico. A implantação Samsung vRAN da SK Telecom mostrou 11% de economia no pico, prevendo o movimento dos usuários e pré-orientando os feixes em vez de ajustá-los reativamente.
Redução de refrigeração: A menor saída de potência de RF resultou em 5-8% de economia de custos de refrigeração em sites de torres. A Vodafone reportou 7% de redução de refrigeração em 200 sites macro em Londres.
Economia total de energia: Entre todos os operadores, o AI-RAN reduziu o consumo de energia por site em média 15-22%, traduzindo-se em $8.000-15.000 de economia anual por site macro, dependendo dos custos locais de eletricidade.

Em escala, esses números reformulam o caso de investimento. A T-Mobile estima $120 milhões em economia anual de energia em toda a sua rede nos EUA se o AI-RAN for implantado nacionalmente. Para o portfólio europeu da Deutsche Telekom, a economia projetada é de €200 milhões por ano. A economia de energia sozinha justifica a implantação do AI-RAN dentro de 18-24 meses para a maioria das operadoras Tier-1 — mesmo sem contar os ganhos de throughput e latência.

Eficiência Espectral: +10-18% em Condições Reais

Eficiência espectral — bits por segundo por Hertz — é a medida fundamental de quão bem um sistema de rádio utiliza o espectro alocado. As melhorias de AI-RAN aqui têm valor financeiro direto, pois equivalem a ter mais espectro sem comprá-lo.

Resultados entre os operadores:

SK Telecom: +18% de melhoria na eficiência espectral (de 7,2 bps/Hz para 8,5 bps/Hz de média) na banda 3,5 GHz n78. Esta é a maior cifra reportada e reflete o agressivo escalonador de IA da Samsung, que usa um modelo baseado em transformer treinado em 18 meses de dados de rede.
T-Mobile: +14% (de 6,8 para 7,8 bps/Hz) no n41 (2,5 GHz). O modelo de IA coordena o escalonamento em 3 componentes de portadora simultaneamente.
Rakuten: +12% em todo o espectro compartilhado 4G/5G. Notavelmente, o escalonador de IA realocou dinamicamente o espectro entre 4G e 5G em tempo real com base na demanda — algo que seu escalonador tradicional não conseguia fazer.
Vodafone: +10% (de 5,9 para 6,5 bps/Hz) em 3,5 GHz. A menor melhoria, atribuída à configuração Ericsson já otimizada da Vodafone, que deixa menos margem para ganhos de IA.

Handover e Mobilidade: Resultados Mistos

O desempenho de handover — a suavidade com que os usuários transitam entre células — mostrou os resultados mais inconsistentes entre os testes. Esta é uma métrica crítica para veículos conectados e aplicações móveis de VR/AR.

A T-Mobile reportou melhoria na taxa de sucesso de handover de 98,2% para 99,1% com previsão de handover assistida por IA. O modelo de IA prevê para qual célula um usuário irá se mover 2-3 segundos antes do evento de handover, permitindo a pré-preparação dos recursos da célula de destino. No entanto, previsões falsas (aproximadamente 8% dos casos) causaram reserva desnecessária de recursos, aumentando levemente a interferência nas células vizinhas.

Os resultados da Rakuten foram mais dramáticos: a taxa de falha de handover caiu de 1,5% para 0,4% em sua implantação em Tóquio. Sua vantagem: a arquitetura totalmente cloud-native e compatível com O-RAN da Rakuten permite que o modelo de IA acesse dados de todas as células vizinhas simultaneamente, em vez de depender apenas dos relatórios de medição do dispositivo do usuário.

A Deutsche Telekom e a Vodafone não reportaram nenhuma mudança estatisticamente significativa no desempenho de handover. Ambas as operadoras observaram que seus algoritmos de handover existentes já eram fortemente ajustados para ambientes urbanos europeus, e os modelos de IA não tinham dados de treinamento suficientes para superar décadas de otimização manual.

NVIDIA Aerial: Realidade de Laboratório vs. Campo

A plataforma Aerial da NVIDIA — uma RAN de software acelerada por GPU rodando em aceleradores convergidos NVIDIA — publicou benchmarks de laboratório alegando 40% de melhoria de throughput e 50% de redução de energia em comparação com RAN tradicional baseada em DSP. Esses números foram amplamente citados em apresentações do setor.

Os dados de testes de campo contam uma história mais matizada. A implantação da T-Mobile em Denver, que usou NVIDIA Aerial em um subconjunto de sites, mostrou 18% de melhoria de throughput — menos da metade da afirmação de laboratório. A diferença é explicada por fatores do mundo real ausentes nos testes de laboratório: interferência entre células, propagação não ideal, diversidade de dispositivos (testes de laboratório usam dispositivos de referência) e a sobrecarga computacional de executar inferência de IA junto com processamento de sinal em tempo real em recursos de GPU compartilhados.

A NVIDIA reconheceu a diferença em um post de blog de março de 2026, observando que "benchmarks de laboratório representam desempenho de teto teórico" e que "implantações de campo tipicamente alcançam 40-60% dos ganhos de laboratório dependendo da complexidade do ambiente." Esta é uma avaliação honesta, e o resultado de 18% no campo está dentro do intervalo declarado pela NVIDIA.

O que o NVIDIA Aerial entrega consistentemente é flexibilidade operacional. A plataforma suporta atualizações de modelo over-the-air, permitindo que os operadores retreinem modelos de IA mensalmente à medida que as condições da rede mudam. Os fornecedores tradicionais de RAN requerem atualizações de software com tempo de inatividade; o Aerial atualiza modelos em segundo plano sem interrupção de serviço.

Nokia AirFrame AI: A Abordagem do Incumbente

A abordagem da Nokia difere fundamentalmente da NVIDIA. Em vez de substituir o processador RAN por GPUs, a Nokia adiciona um acelerador de inferência de IA ao lado do hardware de banda base existente. O módulo Nokia AirFrame AI conecta-se à plataforma AirScale da Nokia e executa modelos treinados que otimizam escalonamento, controle de potência e beamforming.

Os benchmarks publicados pela Nokia mostram 12-15% de melhoria de throughput e 18-20% de economia de energia — mais conservadores do que as afirmações da NVIDIA, mas mais próximos do que os operadores realmente mediram nos testes de campo. O teste da Deutsche Telekom em Berlim, rodando Nokia AirFrame AI, alcançou 11% de melhoria de throughput e 25% de melhoria de energia — alinhando-se bem com o intervalo declarado pela Nokia.

A contrapartida: a abordagem da Nokia exige lock-in do operador ao ecossistema AirScale. Os modelos de IA são treinados na plataforma de nuvem da Nokia e implantados por meio do sistema de gerenciamento da Nokia. Os operadores não podem trazer seus próprios modelos ou usar frameworks de IA de terceiros. Para operadores comprometidos com a plataforma Nokia, isso é aceitável. Para aqueles que buscam estratégias O-RAN multi-fornecedor, é inaceitável.

Samsung vRAN AI: Treinamento em Dados do Operador

A estratégia AI-RAN da Samsung enfatiza o treinamento de modelos em dados específicos do operador, em vez de simulações genéricas de rede. O teste da SK Telecom usou um modelo Samsung vRAN treinado em 18 meses de telemetria de rede própria da SKT — 4,2 TB de decisões de escalonamento, medições de canal e padrões de mobilidade dos usuários.

O resultado: a SK Telecom alcançou a maior melhoria de eficiência espectral (+18%) de qualquer operadora em nosso conjunto de dados. A Samsung atribui isso à profunda familiaridade do modelo com o ambiente de propagação específico da SKT, padrões de comportamento dos usuários e perfis de tráfego. Um modelo genérico treinado em dados sintéticos alcançou apenas +7% no mesmo ambiente durante uma comparação controlada — confirmando que os dados de treinamento específicos do operador são o fator mais importante no desempenho do AI-RAN.

A abordagem da Samsung tem uma limitação de escala significativa: cada implantação de operador requer meses de coleta de dados e treinamento de modelo personalizado. A Samsung está abordando isso com um framework de aprendizado federado que permite que múltiplos operadores treinem modelos conjuntamente sem compartilhar dados brutos, mas este sistema ainda está em fase piloto, com apenas SKT e KDDI participando no Q1 2026.

O Framework ML do O-RAN: Padronizando o AI-RAN

O framework ML da O-RAN Alliance, especificado nas especificações técnicas do O-RAN WG2, visa padronizar como os modelos de IA são treinados, implantados e gerenciados em ambientes RAN multi-fornecedor. A partir do Release 3 (finalizado no Q4 2025), o framework define:

Hospedagem de modelos no Near-RT RIC (inferência dentro do loop de 10 ms) e Non-RT RIC (inferência dentro do loop de 1 segundo)
Interfaces padrão (A1, E2) para comunicação modelo-RAN
Gerenciamento do ciclo de vida do modelo: treinamento, validação, implantação, monitoramento, reversão
Monitoramento de desempenho e detecção de drift — sinalizando automaticamente quando o desempenho de um modelo implantado se degrada

A implantação da Rakuten é a única implementação de produção em larga escala do framework ML do O-RAN. Seus resultados validam a arquitetura: o Near-RT RIC alcançou latência de inferência abaixo de 5 ms em 99,7% dos intervalos de escalonamento, confirmando que a otimização de IA em tempo real é viável dentro das restrições do loop de controle do O-RAN.

No entanto, a interoperabilidade continua sendo um desafio. Em um plugfest da O-RAN Alliance em fevereiro de 2026, apenas 3 de 8 combinações de fornecedores executaram com sucesso um modelo de IA comum em diferentes implementações de RIC. A especificação deixa ambiguidade suficiente em formatos de dados e interfaces de modelo para que adaptações específicas de fornecedores ainda sejam necessárias.

Análise de Custos: O Que o AI-RAN Realmente Custa

Implantar o AI-RAN não é gratuito. Os operadores enfrentam três categorias de custo:

Hardware: Aceleradores GPU (NVIDIA A100/H100 para Aerial) ou coprocessadores de IA (módulo Nokia AirFrame AI) adicionam $5.000-15.000 por site. Para uma operadora Tier-1 com 30.000 sites, o custo de hardware varia de $150 milhões a $450 milhões.
Infraestrutura de treinamento: Computação em nuvem para treinamento de modelos custa $2-5 milhões por operadora por ano. A abordagem específica de operador da Samsung requer mais computação de treinamento do que modelos genéricos.
Pessoal: O AI-RAN requer cientistas de dados e engenheiros de ML que a maioria dos operadores não emprega atualmente. O tamanho típico da equipe é de 15-30 especialistas, custando $3-8 milhões anuais em salários.

Contra esses custos, a economia de energia sozinha ($120-200 milhões anualmente para uma operadora Tier-1) produz um ROI positivo dentro de 2-3 anos. Adicionando o aumento de receita da melhoria de throughput e capacidade (estimado em aumento de 3-5% no ARPU de melhor experiência do usuário), o período de retorno cai para 18 meses.

Perspectivas: O Que Muda em 2027

Três desenvolvimentos vão remodelar os benchmarks de AI-RAN nos próximos 12 meses:

1. Modelos fundacionais para RAN: Tanto a NVIDIA quanto a Ericsson anunciaram abordagens de "modelo fundacional" — grandes modelos de IA pré-treinados em dados de rede diversos que podem ser ajustados para operadores específicos com dados adicionais mínimos. Se bem-sucedida, isso eliminaria o gargalo de coleta de dados da Samsung e democratizaria o AI-RAN de alto desempenho.

2. Design AI-native para 6G: O Study Item do 3GPP sobre IA/ML para NR (Release 19, previsto para o Q3 2026) padronizará formatos de troca de modelos de IA e requisitos de desempenho. Isso cria uma base comum para comparar implementações de AI-RAN entre fornecedores — algo que não existe hoje.

3. Hardware de inferência de borda: Chips de inferência de próxima geração (NVIDIA Blackwell, Qualcomm Cloud AI 200, Intel Gaudi 3) reduzirão o custo de hardware por site em 40-60% enquanto dobram o throughput de inferência. Isso aborda a principal barreira para a implantação universal de AI-RAN: a economia no nível do site.

Os benchmarks de 2026 estabelecem uma linha de base. O AI-RAN entrega benefícios mensuráveis e reproduzíveis — mas a magnitude varia significativamente por arquitetura, fornecedor e ambiente. Os vencedores serão os operadores que investirem em infraestrutura de coleta de dados e arquiteturas compatíveis com O-RAN que maximizem a capacidade da IA de otimizar em tempo real. A tecnologia funciona. A questão não é mais se a IA melhora a RAN — é quanto, onde e a que custo.