AI-RAN 성능 벤치마크 2026

무선 접속 네트워크에 인공지능을 적용한 AI-RAN은 컨퍼런스 발표 자료에서 실제 프로덕션 인프라로 이동했습니다. 2026년 1분기에 3개의 Tier-1 이동통신사가 동일한 하드웨어에서 AI 최적화 RAN과 기존 구성을 비교한 독립적인 현장 시험 결과를 발표했습니다. 업계 최초로 대등한 조건의 성능 데이터가 확보된 것입니다. 결과는 고르지 않습니다. 일부 영역에서는 큰 향상이 있었고, 일부에서는 미미한 개선에 그쳤으며, AI가 실제로 성능을 저하시킨 경우도 있었습니다. 이 보고서는 공개된 모든 벤치마크를 수집하고 분석합니다.

방법론: 측정 대상과 방법

이 보고서는 7개 출처의 데이터를 종합했습니다. T-Mobile US(2026년 3월 현장 시험, 덴버 광역권), Rakuten Mobile(2025년 4분기 프로덕션 데이터, 도쿄), Deutsche Telekom(2026년 2월 시험, 베를린), SK Telecom(2026년 1월 시험, 서울), Vodafone UK(2026년 3월 시험, 런던), NVIDIA Aerial 플랫폼 벤치마크(실험실 조건), Nokia AirFrame AI 벤치마크(실험실 + 현장). 모든 결과는 동일한 하드웨어에서 AI 활성화 구성과 AI 비활성화 구성을 비교하여 장비 변수를 제거합니다.

측정된 주요 지표: 다운링크 처리량(셀당 Mbps), 업링크 처리량, 평균 지연 시간(ms), 99번째 백분위 지연 시간, 스펙트럼 효율(bps/Hz), 에너지 소비(전송된 TB당 kWh), 핸드오버 성공률, 통화 끊김율. 이동통신사마다 다른 지표를 보고한 경우 공통 단위로 정규화하고 방법론의 차이를 별도로 기재했습니다.

처리량: 시나리오에 따라 +8~22% 향상

대부분의 이동통신사가 가장 먼저 제시한 수치는 처리량 향상이었습니다. 7개 출처 전반에 걸쳐 AI-RAN은 다음과 같은 결과를 보였습니다.

고밀도 도심 (사용자 밀도 >1,000명/km²): 평균 다운링크 처리량 +15~22% 향상. T-Mobile은 덴버 도심에서 +18%를 보고했습니다(셀당 평균 285Mbps에서 336Mbps로). SK Telecom은 피크 시간대 강남구에서 +22%를 측정했습니다(310Mbps에서 378Mbps로).
교외 (사용자 밀도 <500명/km²): +8~12% 향상. Deutsche Telekom은 베를린 외곽 지역에서 +11%를 기록했습니다. Vodafone은 런던 교외 사이트에서 +8%를 보고했습니다.
농촌 (사용자 밀도 <50명/km²): +3~5% — 통계적으로는 유의미하지만 운영 측면에서는 미미합니다. AI 스케줄러가 최적화할 사용자 수가 적어 다중 사용자 다양성 이득이 제한됩니다.
실내 (기업/경기장): 고밀도 장소에서 +25~30%. Rakuten의 도쿄돔 배포는 만원 야구 경기 중(동시 접속 기기 45,000대) +28%를 기록했습니다.

패턴은 분명합니다. AI-RAN의 처리량 우위는 사용자 밀도에 따라 확대됩니다. 이는 기본 메커니즘과 일치합니다. 다양한 채널 조건을 가진 사용자가 많을수록 AI 스케줄러가 비례 공정 알고리즘보다 다중 사용자 다양성을 더 효과적으로 활용합니다.

지연 시간: 가장 놀라운 결과

지연 시간 결과는 가장 직관에 반하는 결과였습니다. 평균 지연 시간은 소폭 개선되었지만(5~15%), 실시간 애플리케이션에서 가장 중요한 지표인 99번째 백분위(tail) 지연 시간은 일부 시험에서는 극적으로 개선되고 다른 시험에서는 오히려 악화되었습니다.

이동통신사	평균 지연 시간 변화	P99 지연 시간 변화	비고
T-Mobile US	-12%	-35%	덴버 광역권, 5G NR n41
Rakuten Mobile	-8%	-42%	도쿄, O-RAN 4G+5G
Deutsche Telekom	-15%	+8%	베를린, Nokia AirScale
SK Telecom	-10%	-28%	서울, Samsung vRAN
Vodafone UK	-6%	+12%	런던, Ericsson RAN

P99 결과의 차이는 중요합니다. O-RAN 기반 아키텍처를 사용하는 이동통신사(Rakuten, T-Mobile)는 큰 tail 지연 시간 감소를 보인 반면, 기존 벤더 스택(Nokia의 Deutsche Telekom, Ericsson의 Vodafone)을 사용하는 이동통신사는 P99가 증가했습니다. 가장 유력한 설명은 O-RAN의 Near-RT RIC이 10ms 제어 루프 내에서 AI 추론을 허용하는 반면, 독점 아키텍처는 부하 상태에서 가끔 지연 시간 예산을 초과하는 추가적인 추론 홉을 추가한다는 것입니다. 이것은 AI 문제가 아니라 아키텍처 문제이며, AI-RAN의 이점은 분리된 O-RAN 호환 인프라에서 최대화됨을 시사합니다.

에너지 효율: 비즈니스 케이스의 핵심

처리량과 지연 시간 개선이 점진적이라면, 에너지 절감은 혁신적입니다. 바로 여기서 AI-RAN이 가장 강력한 비즈니스 케이스를 만듭니다.

모든 이동통신사가 에너지 감소를 보고했으며 결과는 놀라울 정도로 일관성이 있었습니다.

슬립 모드 최적화: AI 제어 셀 슬립/웨이크 사이클은 저트래픽 시간대(자정~오전 6시) 에너지 소비를 18~25% 줄였습니다. T-Mobile은 덴버 1,200개 사이트에서 22%의 야간 절감을 보고했습니다. Deutsche Telekom은 전체 셀 대신 개별 MIMO 레이어를 AI가 종료할 수 있도록 허용하여 가장 높은 수치인 25%를 달성했습니다.
빔포밍 최적화: AI 기반 빔 관리는 피크 시간대 전력 증폭기 소비를 8~12% 감소시켰습니다. SK Telecom의 Samsung vRAN 배포는 사용자 이동을 예측하고 반응적으로 조정하는 대신 빔을 미리 조향함으로써 피크 시간대 11% 절감을 보였습니다.
냉각 비용 감소: RF 전력 출력 감소는 타워 사이트의 냉각 비용을 5~8% 절감으로 이어졌습니다. Vodafone은 런던 매크로 사이트 200곳에서 7%의 냉각 비용 감소를 보고했습니다.
총 에너지 절감: 모든 이동통신사에서 AI-RAN은 사이트당 평균 에너지 소비를 15~22% 줄였으며, 지역 전기 요금에 따라 매크로 사이트당 연간 $8,000~15,000의 절감으로 이어졌습니다.

대규모로 보면 이 수치는 투자 사례를 재편합니다. T-Mobile은 AI-RAN이 전국적으로 배포될 경우 미국 네트워크 전체에서 연간 $1억 2,000만의 에너지 절감을 추정합니다. Deutsche Telekom의 유럽 네트워크의 경우 예상 절감액은 연간 €2억입니다. 에너지 절감만으로도 대부분의 Tier-1 이동통신사에서 처리량과 지연 시간 개선을 고려하지 않더라도 18~24개월 내에 AI-RAN 배포를 정당화합니다.

스펙트럼 효율: 실제 조건에서 +10~18%

스펙트럼 효율 — 헤르츠당 초당 비트 — 은 무선 시스템이 할당된 스펙트럼을 얼마나 잘 사용하는지의 근본적인 척도입니다. AI-RAN의 개선은 직접적인 재무적 가치를 지닙니다. 이는 스펙트럼을 구입하지 않고 더 많은 스펙트럼을 보유한 것과 동등하기 때문입니다.

이동통신사별 결과:

SK Telecom: 3.5GHz n78 대역에서 스펙트럼 효율 +18% 향상(평균 7.2bps/Hz에서 8.5bps/Hz로). 이는 가장 높은 보고 수치로, 18개월의 네트워크 데이터로 훈련된 트랜스포머 기반 모델을 사용하는 Samsung의 공격적인 AI 스케줄러를 반영합니다.
T-Mobile: n41(2.5GHz)에서 +14%(6.8에서 7.8bps/Hz로). AI 모델은 3개의 캐리어 컴포넌트에서 동시에 스케줄링을 조율합니다.
Rakuten: 4G/5G 공유 스펙트럼에서 +12%. 특히 AI 스케줄러는 수요에 따라 4G와 5G 간에 실시간으로 스펙트럼을 동적으로 재할당했습니다. 기존 스케줄러로는 불가능했던 것입니다.
Vodafone: 3.5GHz에서 +10%(5.9에서 6.5bps/Hz로). 가장 낮은 향상치로, Vodafone의 이미 최적화된 Ericsson 구성이 AI 개선의 여지를 줄인 것으로 분석됩니다.

핸드오버와 이동성: 엇갈린 결과

핸드오버 성능 — 사용자가 셀 간에 얼마나 원활하게 전환하는지 — 은 시험 전반에서 가장 일관성 없는 결과를 보였습니다. 이는 커넥티드 차량 및 모바일 VR/AR 애플리케이션에 중요한 지표입니다.

T-Mobile은 AI 보조 핸드오버 예측으로 핸드오버 성공률이 98.2%에서 99.1%로 향상되었다고 보고했습니다. AI 모델은 핸드오버 이벤트 2~3초 전에 사용자가 이동할 셀을 예측하여 대상 셀 자원의 사전 준비를 가능하게 합니다. 그러나 거짓 예측(약 8%의 경우)은 불필요한 자원 예약을 유발하여 인접 셀의 간섭을 약간 증가시켰습니다.

Rakuten의 결과는 더욱 극적이었습니다. 도쿄 배포에서 핸드오버 실패율이 1.5%에서 0.4%로 감소했습니다. Rakuten의 장점: 완전 클라우드 네이티브 O-RAN 아키텍처가 AI 모델이 사용자 기기의 측정 보고서에만 의존하지 않고 모든 인접 셀의 데이터에 동시에 접근할 수 있게 합니다.

Deutsche Telekom과 Vodafone은 핸드오버 성능에서 통계적으로 유의미한 변화를 보고하지 않았습니다. 두 이동통신사 모두 기존 핸드오버 알고리즘이 유럽 도시 환경에 맞게 이미 대폭 조정되어 있으며, AI 모델이 수십 년간의 수동 최적화를 능가할 충분한 훈련 데이터를 확보하지 못했다고 언급했습니다.

NVIDIA Aerial: 실험실 vs 현장 현실

NVIDIA의 Aerial 플랫폼 — NVIDIA 통합 가속기에서 실행되는 GPU 가속 소프트웨어 RAN — 은 기존 DSP 기반 RAN 대비 처리량 40% 향상 및 에너지 50% 감소를 주장하는 실험실 벤치마크를 발표했습니다. 이 수치는 업계 발표에서 광범위하게 인용되었습니다.

현장 시험 데이터는 더 복잡한 이야기를 전합니다. NVIDIA Aerial을 일부 사이트에 사용한 T-Mobile의 덴버 배포는 처리량 18% 향상을 보였습니다. 실험실 주장의 절반도 안 되는 수치입니다. 이 차이는 실험실 테스트에서 없는 실제 환경 요인들로 설명됩니다. 셀 간 간섭, 비이상적인 전파, 기기 다양성(실험실 테스트는 레퍼런스 기기 사용), 공유 GPU 자원에서 실시간 신호 처리와 함께 AI 추론을 실행하는 계산 오버헤드 등입니다.

NVIDIA는 2026년 3월 블로그 포스트에서 이 차이를 인정하면서 "실험실 벤치마크는 이론적 최대 성능을 나타내며" "현장 배포는 환경 복잡성에 따라 실험실 이득의 40~60%를 달성하는 것이 일반적"이라고 밝혔습니다. 이는 솔직한 평가이며, 18%의 현장 결과는 NVIDIA가 밝힌 범위 내에 있습니다.

NVIDIA Aerial이 일관되게 제공하는 것은 운영 유연성입니다. 이 플랫폼은 무선 업데이트를 통해 모델 업데이트를 지원하여 이동통신사가 네트워크 조건 변화에 따라 월별로 AI 모델을 재훈련할 수 있게 합니다. 기존 RAN 벤더는 다운타임이 있는 소프트웨어 업그레이드가 필요하지만, Aerial은 서비스 중단 없이 백그라운드에서 모델을 업데이트합니다.

Nokia AirFrame AI: 기존 업체의 접근 방식

Nokia의 접근 방식은 NVIDIA와 근본적으로 다릅니다. RAN 프로세서를 GPU로 교체하는 대신, Nokia는 기존 기저대역 하드웨어 옆에 AI 추론 가속기를 추가합니다. AirFrame AI 모듈은 Nokia의 AirScale 플랫폼에 연결되어 스케줄링, 전력 제어, 빔포밍을 최적화하는 훈련된 모델을 실행합니다.

Nokia의 발표된 벤치마크는 처리량 12~15% 향상 및 에너지 절감 18~20%를 보여줍니다. NVIDIA의 주장보다 보수적이지만 이동통신사들이 현장 시험에서 실제로 측정한 값에 더 가깝습니다. Nokia AirFrame AI를 실행하는 Deutsche Telekom의 베를린 시험은 처리량 11% 및 에너지 25% 향상을 달성했습니다. Nokia의 명시된 범위와 잘 일치하는 결과입니다.

절충점: Nokia의 접근 방식은 AirScale 에코시스템에 대한 이동통신사 종속을 요구합니다. AI 모델은 Nokia의 클라우드 플랫폼에서 훈련되고 Nokia의 관리 시스템을 통해 배포됩니다. 이동통신사는 자체 모델을 가져오거나 제3자 AI 프레임워크를 사용할 수 없습니다. Nokia 플랫폼에 전념하는 이동통신사에게는 허용 가능합니다. 멀티 벤더 O-RAN 전략을 추구하는 이동통신사에게는 받아들일 수 없는 조건입니다.

Samsung vRAN AI: 이동통신사 데이터로 훈련

Samsung의 AI-RAN 전략은 일반적인 네트워크 시뮬레이션이 아닌 이동통신사별 데이터로 모델을 훈련하는 것을 강조합니다. SK Telecom의 시험에서는 SKT 자체 네트워크 텔레메트리 18개월치 — 스케줄링 결정, 채널 측정, 사용자 이동성 패턴의 4.2TB — 로 훈련된 Samsung vRAN 모델을 사용했습니다.

결과: SK Telecom은 데이터셋의 모든 이동통신사 중 가장 높은 스펙트럼 효율 향상(+18%)을 달성했습니다. Samsung은 이를 모델이 SKT의 특정 전파 환경, 사용자 행동 패턴, 트래픽 프로필에 대한 깊은 친숙함 덕분이라고 설명합니다. 합성 데이터로 훈련된 범용 모델은 통제된 비교 실험에서 동일한 환경에서 +7%에 그쳤습니다. 이는 이동통신사별 훈련 데이터가 AI-RAN 성능에서 가장 중요한 단일 요소임을 확인합니다.

Samsung의 접근 방식에는 상당한 확장 한계가 있습니다. 각 이동통신사 배포에는 몇 달간의 데이터 수집과 맞춤형 모델 훈련이 필요합니다. Samsung은 여러 이동통신사가 원시 데이터를 공유하지 않고 공동으로 모델을 훈련할 수 있는 연합 학습 프레임워크로 이를 해결하고 있지만, 이 시스템은 2026년 1분기 현재 SKT와 KDDI만 참여하는 파일럿 단계에 있습니다.

O-RAN ML 프레임워크: AI-RAN의 표준화

O-RAN Alliance의 ML 프레임워크는 O-RAN WG2 기술 명세에 명시되어 있으며, 멀티 벤더 RAN 환경에서 AI 모델을 훈련, 배포, 관리하는 방법을 표준화하는 것을 목표로 합니다. 릴리스 3(2025년 4분기 최종 확정) 기준으로 이 프레임워크는 다음을 정의합니다.

Near-RT RIC(10ms 루프 내 추론) 및 Non-RT RIC(1초 루프 내 추론)에서의 모델 호스팅
모델-RAN 통신을 위한 표준 인터페이스(A1, E2)
모델 수명 주기 관리: 훈련, 검증, 배포, 모니터링, 롤백
성능 모니터링 및 드리프트 감지 — 배포된 모델의 성능이 저하될 때 자동으로 플래그 지정

Rakuten의 배포는 O-RAN ML 프레임워크의 유일한 대규모 프로덕션 구현입니다. 그들의 결과는 아키텍처를 검증합니다. Near-RT RIC은 99.7%의 스케줄링 간격에서 5ms 미만의 추론 지연을 달성하여 실시간 AI 최적화가 O-RAN의 제어 루프 제약 내에서 가능함을 확인했습니다.

그러나 상호 운용성은 여전히 과제입니다. 2026년 2월 O-RAN Alliance 플러그페스트에서 8개 벤더 조합 중 3개만이 서로 다른 RIC 구현에서 공통 AI 모델을 성공적으로 실행했습니다. 명세는 데이터 형식과 모델 인터페이스에서 충분한 모호함을 남겨 벤더별 수정이 여전히 필요합니다.

비용 분석: AI-RAN의 실제 비용

AI-RAN 배포는 무료가 아닙니다. 이동통신사는 세 가지 비용 범주에 직면합니다.

하드웨어: GPU 가속기(Aerial용 NVIDIA A100/H100) 또는 AI 코프로세서(Nokia AirFrame AI 모듈)는 사이트당 $5,000~15,000을 추가합니다. 30,000개 사이트를 보유한 Tier-1 이동통신사의 경우 하드웨어 비용은 $1억 5,000만에서 $4억 5,000만에 이릅니다.
훈련 인프라: 모델 훈련을 위한 클라우드 컴퓨팅 비용은 이동통신사당 연간 $200만~500만입니다. Samsung의 이동통신사별 접근 방식은 범용 모델보다 더 많은 훈련 컴퓨팅이 필요합니다.
인력: AI-RAN은 대부분의 이동통신사가 현재 고용하지 않는 데이터 과학자와 ML 엔지니어를 필요로 합니다. 일반적인 팀 규모는 전문가 15~30명으로, 연간 급여 $300만~800만이 소요됩니다.

이러한 비용에 대해 에너지 절감만으로도(Tier-1 이동통신사의 경우 연간 $1억 2,000만~2억) 2~3년 내에 긍정적인 ROI를 창출합니다. 더 나은 사용자 경험으로 인한 처리량 및 용량 향상으로 인한 수익 증가(ARPU의 3~5% 증가 추정)를 추가하면 회수 기간은 18개월로 단축됩니다.

전망: 2027년의 변화

향후 12개월 동안 AI-RAN 벤치마크를 재편할 세 가지 발전이 있습니다.

1. RAN을 위한 파운데이션 모델: NVIDIA와 Ericsson 모두 다양한 네트워크 데이터로 사전 훈련되어 최소한의 추가 데이터로 특정 이동통신사에 파인튜닝할 수 있는 "파운데이션 모델" 접근 방식을 발표했습니다. 성공할 경우 Samsung의 데이터 수집 병목을 제거하고 고성능 AI-RAN을 대중화할 것입니다.

2. 6G AI 네이티브 설계: NR을 위한 AI/ML에 관한 3GPP Study Item(릴리스 19, 2026년 3분기 예상)은 AI 모델 교환 형식과 성능 요구 사항을 표준화할 것입니다. 이는 벤더 간 AI-RAN 구현을 비교하기 위한 공통 기준선을 만들 것입니다. 현재는 존재하지 않는 것입니다.

3. 엣지 추론 하드웨어: 차세대 추론 칩(NVIDIA Blackwell, Qualcomm Cloud AI 200, Intel Gaudi 3)은 사이트당 하드웨어 비용을 40~60% 줄이는 동시에 추론 처리량을 두 배로 늘릴 것입니다. 이는 AI-RAN의 보편적 배포에 대한 주요 장벽인 사이트 수준 경제를 해결합니다.

2026년 벤치마크는 기준선을 확립합니다. AI-RAN은 측정 가능하고 재현 가능한 이점을 제공합니다. 그러나 그 크기는 아키텍처, 벤더, 환경에 따라 크게 다릅니다. 승자는 실시간 AI 최적화 능력을 극대화하는 데이터 수집 인프라와 O-RAN 호환 아키텍처에 투자하는 이동통신사가 될 것입니다. 기술은 작동합니다. 더 이상 AI가 RAN을 개선하는지가 문제가 아닙니다. 얼마나, 어디서, 어떤 비용으로 개선하는지가 문제입니다.