구글 ‘터보퀀트’ 충격에도…차세대 메모리 수요 기대감

구글, 압축 기술 ‘터보퀀트’ 발표
메모리 사용 줄이고 연산속도 높여
시장 충격…업계 “수요 계속될 것”
기술 발전에 차세대 메모리 기대감

입력 : 2026-03-27 오전 11:39:40
[뉴스토마토 이명신 기자] 구글이 인공지능(AI) 모델의 메모리 사용량을 줄여주는 기술인 ‘터보퀀트’를 발표하면서 메모리 시장이 흔들리는 가운데, 업계는 시장의 혼란이 과도하다고 보고 있습니다. 메모리 병목을 줄이기 위한 기술 발전은 계속되겠지만, 근본적인 수요는 꺾이지 않을 것이라는 분석입니다. 터보퀀트와 같은 압축 기술이 발전하면, 맞춤형 고대역폭메모리(커스텀 HBM)나 고대역폭플래시(HBF) 등 차세대 메모리 수요가 더 늘어날 것이라는 시각도 있습니다.
 
지난달 인도 뉴델리에서 열린 ‘인도 AI 임팩트 서밋 2026’에서 관람객들이 구글 로고 근처를 걷고 있다. (사진=연합뉴스)
 
최근 구글이 발표한 터보퀀트 기술 여파로 반도체 기업들의 주가는 일제히 급락하고 있습니다. 마이크론 주가는 26일(현지시각) 7% 가까이 급락했으며, 낸드플래시 업체 샌디스크(-11.02%), 엔비디아(-4.16%)도 주가가 하락했습니다. 삼성전자와 SK하이닉스는 27일 오전 11시 기준 전 거래일 대비 주가가 각각 3.72%, 4.07% 떨어졌습니다.
 
터보퀀트는 벡터 양자화 기술로 대형언어모델(LLM)의 임시 기억장치인 ‘KV캐시’를 3비트 수준으로 압축해 메모리 사용량을 줄일 수 있는 기술입니다. KV캐시는 AI가 사용자와 나눈 대화의 맥락을 저장하기 때문에, 대화가 계속되면 맥락 데이터가 늘고 메모리 사용량도 그만큼 증가하게 됩니다. 이에 KV캐시를 효율화하는 것이 업계의 과제였습니다. 엔비디아의 NVFP4, 마이크로소프트의 딥스피드 등 기존에도 압축 기술은 존재했지만, 터보퀀트는 손실량이 거의 없다는 점에서 차이가 있습니다.
 
구글은 오픈소스 AI 모델인 구글 젬마와 미스트랄 등에 터보퀀트를 적용한 결과 KV캐시 용량을 최대 6배 줄이고, 엔비디아의 H100 그래픽처리장치(GPU) 연산 속도를 최대 8배까지 높였다고 밝혔습니다. 이에 메모리 수요가 줄어들 수 있다는 해석이 나오면서 시장의 충격이 이어지는 상황입니다.
 
다만 업계는 지금의 혼란이 과도하다고 보고 있습니다. 오히려 장기적으로 메모리 시장에 긍정적인 영향을 미칠 것이라는 분석입니다. 기술의 효율성이 높아질수록 제품 채택과 수요가 늘어나는 ‘제번스의 역설’ 적용된다는 것입니다. 아울러 처리 속도가 높아지면 데이터를 빠르게 주고받는 대역폭의 중요성이 더 커진다는 설명입니다.
 
업계 관계자는 “KV캐시를 효율화하기 위한 기술이 나온 것은, 그만큼 메모리가 많이 필요하다는 방증”이라며 “이 같은 효율화 기술이 개발되다 보면 AI 산업의 파이가 커지고, 메모리 시장도 더 커질 수 있다”고 전했습니다.
 
SK하이닉스가 지난 16일(현지시각) 미국 새너제이에서 열린 ‘GTC 2026’에서 HBM4 16단 제품 내부 구조를 보여주는 모형을 전시했다. (사진=SK하이닉스)
 
전문가들도 신중론을 펼쳤습니다. 김정호 카이스트 전기및전자공학부 교수는 “논문을 보면 메모리 사용을 줄일 수 있는 가능성은 분명히 있다”면서도 “다만 구글이 제시한 효과를 그대로 받아들이기는 아직 이르다”고 밝혔습니다.
 
그러면서 “압축된 데이터를 다시 풀어 쓰는 과정에서 시간 지연이 발생할 수밖에 없다”며 “HBM처럼 초고속 접근이 필요한 영역에는 적용이 쉽지 않을 것”이라고 설명했습니다. 터보퀀트가 HBM을 대체하거나 수요를 직접적으로 줄일 기술로 보기는 어렵다는 겁니다.
 
대신 영향은 낸드플래시 등 저장장치 쪽에서 나타날 수 있다고 바라봤습니다. 김 교수는 “속도보다 용량과 비용이 중요한 영역에서는 이런 압축 기술이 의미를 가질 수 있다”며 “낸드 기반 스토리지 활용 방식에는 변화가 생길 수 있다”고 진단했습니다.
 
차세대 메모리 수요가 증가할 가능성도 제기됩니다. 김록호 하나증권 연구원은 “터보퀀트와 같은 기술은 압축된 데이터를 풀고 연산하는 과정이 필요해 HBM의 커스텀화가 가속화될 것으로 예상한다”며 “‘메모리처럼 작동하는 스토리지’의 비중이 커질 것으로 예상돼 HBF 상용화를 앞당길 가능성도 상존한다”고 분석했습니다.
 
김 교수는 “엔비디아도 그록 등을 통해 새로운 구조를 시도하는 것처럼, 전반적으로 AI 인프라에서 메모리 문제를 해결하려는 흐름이 이어지고 있다”며 “터보퀀트 역시 이런 큰 흐름 속에서 이해해야 한다”고 했습니다.
 
이명신 기자 sin@etomato.com
ⓒ 맛있는 뉴스토마토, 무단 전재 - 재배포 금지
이명신 기자
SNS 계정 : 메일
많이 본 뉴스