[뉴스토마토 오세은 기자] 엔비디아의 차세대 AI 가속기 블랙웰이 서버 과열 문제에 봉착했다는 외신 보도가 나오면서 해당 가속기를 공급받기로 한 구글, 마이크로소프트(MS), 메타 등 글로벌 빅테크들의 AI 설비투자 스케줄도 차질이 불가피할 것으로 관측됩니다.
미 IT전문매체 디인포메이션은 17일(현지시간) 소식통을 인용해 “엔비디아가 공급업체들을 대상으로 여러 번 서버 랙(복수의 서버를 저장하는 특수 프레임) 디자인을 변경해달라고 요청하고 있다”고 전했습니다. 현재 설계로는 블랙웰을 탑재했을 때 과열 현상이 발생하고 있기 때문입니다.
보도에 따르면 엔비디아는 빅테크 기업들에게 내년 상반기 말까지 블랙웰을 배송할 수 있다는 입장이지만, 이미 설계 결함으로 한 차례 출시가 지연된 바 있어 고객사들의 우려는 더 커지고 있습니다.
가격이 4만달러(약5584만원)에 이르는 블랙웰은 엔비디아의 첨단 프로세서 2개를 비롯해 수많은 부품으로 구성되는데, 칩에 들어가는 부품이 늘어날수록 결함이나 발열 가능성이 높습니다.
지난 3월 엔비디아는 블랙웰을 처음 공개했으며 블랙웰을 올해 2분기에 출시할 수 있다고 발표했지만 생산 과정에서 결함이 발견되면서 한 차례 미룬 바 있습니다. 그리고 지난 8월 실적발표에서 올 4분기에는 양산하겠다는 계획을 밝혔지만 또 다시 설계 문제가 거론되면서 더 늦춰질 가능성도 커졌습니다.
블랙웰은 기존 차세대 AI칩 H100 대비 성능은 30% 향상됐으며 에너지 소비는 최대 25분의1수준으로, AI 데이터센터와 같은 설비투자 확장에 속도를 내고 있는 빅테크들이 선제적으로 계약한 칩입니다. 구글 등은 내년 1분기부터는 자사 데이터센터에서 이를 활용할 계획을 세운 상태입니다. 메타·구글은 그레이스 블랙웰(GB)200을 100억달러(약 13조9600억원) 이상 구매했고, MS는 자사뿐 아니라 오픈AI가 쓸 물량을 최대 6만5000개 주문한 것으로 알려졌습니다.
하지만 설계 결함이 발생했다는 보도가 올해에만 두 차례나 나오면서 구글, 메타, MS 등의 AI 설비 투자 스케줄도 영향을 받을 것으로 관측됩니다.
IT업계 관계자는 “AI의 정확도를 높이기 위한 연산과 추론을 위해서는 방대한 학습량이 필요하고 이를 뒷받침할 수 있는 가속기가 충분히 확보돼야 한다”면서 “칩이 적기에 공급되지 않으면 AI 기술 고도화 플랜에도 영향은 있을 것”이라고 말했습니다.
지난 12일 일본 도쿄에서 열린 '엔비디아 AI 서빗 재팬'에서 젠슨 황 엔비디아 최고경영자가 블랙웰을 선보이고 있다. (사진=엔비디아)
오세은 기자 ose@etomato.com