CXL, 왜 삼성과 하이닉스가 목숨 걸까? 메모리 장벽을 허무는 차세대 인터페이스의 본질

얼마전에 회사에서 서버 증설 건으로 시스템 아키텍처 설계 검토 미팅에 들어갔다가 마라톤 회의를 했었는데요. 늘 그렇듯 문제는 ‘메모리 용량’이었습니다. 장비를 만지다 보면 CPU 코어 수는 무섭게 늘어나는데, 그 코어들이 제 성능을 내기 위해 필요한 메모리 슬롯은 물리적 공간 한계 때문에 늘릴 수가 없어서 병목현상이 생기거든요. “그냥 램 더 꽂으면 안 돼요?”라는 동료분의 질문에 다들 헛웃음을 지었는데, 사실 그 해결책으로 나온 게 바로 오늘 이야기할 CXL입니다. 요즘 반도체 시장에서 HBM만큼이나 뜨겁게 달궈지고 있는 이 녀석이 왜 앞으로 단순한 기술 표준을 넘어 ‘게임 체인저’로 불리는지 알아보려고 합니다.

CXL은 단순히 빠른 연결 통로가 아닌 ‘메모리 확장성’의 해방군입니다

흔히 CXL(Compute Express Link)을 설명할 때 PCIe를 기반으로 한 인터페이스라고 하니, 단순히 “데이터 전송 속도가 빨라지는 건가?”라고 생각하기 쉽습니다. 하지만 현장에서 느끼는 CXL의 진짜 가치는 속도보다는 ‘메모리 공유와 확장의 유연성’에 있습니다. 기존 시스템에서는 CPU 하나가 관리할 수 있는 DRAM 슬롯이 딱 정해져 있었습니다. 슬롯이 꽉 차면 더 이상 메모리를 늘릴 방법이 없었죠. 하지만 CXL은 기존에 그래픽카드나 SSD를 꽂던 PCIe 슬롯에 그대로 메모리 확장 장치를 꽂아 DRAM 용량을 수 테라바이트(TB) 단위로 무한정 늘릴 수 있게 해줍니다.

기존 CPU-DRAM 구조와 CXL 기반 메모리 풀링 구조 비교 인포그래픽
기존 CPU-DRAM 구조와 CXL 기반 메모리 풀링 구조 비교

이게 왜 중요하냐면, 지금의 AI 모델들은 데이터 덩어리가 상상을 초월하기 때문입니다. LLM(거대언어모델)을 돌리려면 엄청난 양의 파라미터를 메모리에 올려두어야 하는데, 기존 방식으로는 서버 한 대의 물리적 한계에 계속 부딪히더라고요. CXL은 마치 거실에 가구가 꽉 찼을 때 벽을 허물고 옆방까지 거실로 쓰는 것과 같은 효과를 냅니다. 특히 CXL 2.0부터는 ‘메모리 풀링(Pooling)’ 기능이 들어가는데, 이건 여러 대의 서버가 하나의 거대한 메모리 창고를 공유해서 쓰는 방식이라 자원 효율성 측면에서 완전히 다른 차원의 이야기를 하고 있는 겁니다.

HBM이 ‘속도’라면 CXL은 ‘용량’과 ‘효율’, 두 마리 토끼를 잡습니다

가끔 “HBM이 있는데 CXL이 왜 필요하냐”는 질문도 받습니다. 하지만 두 기술은 경쟁 관계라기보다 서로 부족한 부분을 채워주는 완벽한 보완재에 가깝더라고요. HBM(고대역폭 메모리)은 연산 장치 바로 옆에서 엄청나게 빠른 속도로 데이터를 밀어 넣어주는 ‘고속도로’ 역할이라면, CXL은 거대한 데이터 저장 공간을 시스템 전체가 유연하게 사용할 수 있게 해주는 ‘거대 물류 센터’라고 보시면 됩니다. 실제 현업에서 AI 가속기를 돌려보면 속도만큼이나 절실한 게 바로 ‘메모리 가용성’입니다.

HBM과 CXL의 성능인 대역폭과 용량을 비교한 그래프
HBM과 CXL의 성능 비교

기존 시스템의 고질적인 문제 중 하나가 ‘메모리 스트랜딩(Memory Stranding)’ 현상입니다. 어떤 서버는 메모리가 남고, 어떤 서버는 모자란데 서로 나눠 쓸 수 없는 낭비 상태를 말하죠. 데이터센터 운영자 입장에서 이건 다 돈이거든요. CXL 3.0으로 넘어가면 패브릭(Fabric) 구조를 통해 수백 대의 장치가 메모리를 유기적으로 공유하게 되는데, 이는 전체 서버 비용(TCO)을 획기적으로 낮출 수 있는 핵심 열쇠가 됩니다. 결국 비싼 HBM은 핵심 연산에 집중시키고, 방대한 데이터 처리는 CXL 기반의 확장형 DRAM이 맡는 이원화 구조가 미래 표준이 될 수밖에 없다는 게 제 생각입니다.

컴퓨팅 패러다임의 변화, ‘서버 중심’에서 ‘데이터 중심’으로

CXL이 바꿀 미래는 단순히 부품 하나가 바뀌는 수준이 아닐 겁니다. 지금까지의 컴퓨터는 CPU가 주인이 되어 모든 자원을 통제하는 구조였죠. 하지만 CXL이 보편화되면 ‘컴포저블 인프라(Composable Infrastructure)’가 가능해집니다. 필요에 따라 메모리, 스토리지, 가속기를 레고 블록처럼 조합해서 쓰는 시대가 오는 거죠. 엊그제 해외 기술 포럼 리포트를 읽다 보니 이젠 메모리 자체가 연산 기능을 갖는 PIM(Processor In Memory)과 CXL이 결합하는 시나리오까지 나오더라고요.

엔지니어로서 가장 기대되는 부분은 시스템 설계의 자유도입니다. 예전에는 보드 설계할 때 배선 길이 하나하나 따져가며 메모리 슬롯 위치 잡느라 머리 싸매고 고민했는데, CXL 기반 시스템이 정착되면 물리적 거리에 따른 신호 감쇄 문제(캐시 일관성 포함)를 프로토콜 차원에서 해결해주니 훨씬 유연한 설계가 가능해질 겁니다. 삼성전자가 CXL 2.0 DRAM을 선제적으로 공개하고 SK하이닉스가 CXL 솔루션 개발에 열을 올리는 이유도, 결국 이 인터페이스 주도권을 쥐는 쪽이 차세대 데이터센터 생태계를 지배할 것이라는 확신이 있기 때문이겠죠. 이제 메모리는 단순한 저장소를 넘어 시스템의 심장이자 혈관이 되어가고 있는 것 같습니다.

💡 Insight Notes:

CXL의 본질은 유연성: 물리적 슬롯 한계를 극복하고 테라바이트급 메모리 확장을 가능케 하는 차세대 표준.
HBM과의 공생: 연산 속도는 HBM이, 방대한 용량과 효율적 자원 관리는 CXL이 담당하는 이원화 체제 확립 전망.
메모리 풀링의 혁명: 버려지는 메모리 자원을 최소화하여 데이터센터 운영 효율(TCO)을 극대화하는 핵심 기술.


※ 본 글은 4월14일 기준의 데이터와 개인적 분석을 바탕으로 작성되었으며, 특정 자산에 대한 투자 권유나 재무적 조언이 아닙니다.

댓글 달기

이메일 주소는 공개되지 않습니다. 필수 필드는 *로 표시됩니다

위로 스크롤