17일(현지시간) 미 정보기술(IT) 전문매체 디인포메이션 등에 따르면 엔비디아는 블랙웰 칩을 서버 랙에 연결했을 때 과열 문제가 발생해 랙 공급업체에게 수차례 설계 변경을 요구한 것으로 알려졌다. AI 구동을 위해선 여러 개의 그래픽처리장치(GPU), 중앙처리장치(CPU)를 한데 묶은 완성용 서버가 필요하다. 이를 서버 랙이라 한다. 엔비디아는 3월 72개의 블랙웰 GPU를 탑재한 ‘GB200 NVL72’를 공개한 바 있다.
이렇게 완성된 ‘냉장고만한’ 랙의 무게는 1.5 t(톤)에 이르고, 자연스레 높은 전력과 발열 문제를 일으킨다. 블랙웰은 이전 세대 GPU에 비해 쉽게 열이 오르는데, 이 발열 문제를 잡기 위해 블랙웰을 연결한 랙 설계에 어려움을 겪고 있는 것으로 파악된다.
전남혁 기자 forward@donga.com