뉴스 트렌드 생활정보 International edition 매체

퓨리오사AI, TSMC 포럼서 2세대 '레니게이드' AI 반도체 첫 공개

입력 | 2024-04-26 10:26:00


미국 캘리포니아주 샌타클래라에서 TSMC 주최로 개최된 제30회 북미 기술 심포지엄(TSMC Tech Symposium 24)에서 국내 AI 반도체 기업 퓨리오사AI가 2세대 NPU(신경망 처리 장치) 레니게이드(이하 RNGD)의 실물을 처음으로 공개했다. RNGD는 1세대 NPU 워보이(WARBOY)에 이어 두 번째로 공개되는 반도체로, TSMC 5나노미터 공정 기반에 HBM3 메모리를 탑재해 글로벌 반도체 기업의 AI 가속기와 비견되는 성능을 발휘한다.

백준호 퓨리오사AI 대표가 TSMC 테크 심포지엄 24 행사에서 2세대 반도체 레니게이드를 소개하고 있다 / 출처=퓨리오사AI


백준호 퓨리오사AI 대표는 차세대 AI 칩 아키텍처 개발 경쟁에서 주도권을 잡기 위한 핵심 요소인 프로그래밍 가능성과 확장성, 와트당 성능, 손쉬운 배포 방식을 소개하기 위해 연단에 섰다. 이 자리에서 백 대표는 “챗GPT가 나오기 전 선제적으로 HBM3를 탑재한 고성능 AI 반도체 개발에 착수했고, 이후 TSMC, 글로벌 유니칩(GUC) 등 글로벌 파트너사와의 협업 및 지원을 통해 RNGD를 완성할 수 있었다”라면서, “시기적으로 추론용 AI 반도체 수요가 급증하는 만큼, 시장 기회를 선점하도록 노력할 것”이라고 말했다.

글로벌 AI 반도체 경쟁에 우뚝 선 퓨리오사AI의 RNGD

퓨리오사AI의 2세대 반도체 레니게이드(RNGD)의 SoC(시스템 온 칩) / 출처=퓨리오사AI


퓨리오사AI가 공개한 RNGD는 가로 및 세로 각 5.5cm에 400억 개 이상의 트랜지스터를 집적하고 있으며, TSMC CoWoS(칩 온 웨이퍼 온 서브스트레이트) 패키지로 제작됐다. CoWoS 패키지는 엔비디아의 A100, H100 등 서버용 GPU 제조에 사용되는 TSMC의 2.5차원 반도체 적층 기술이다. 메모리는 온칩 256MB 및 2스택 48GB HBM3 메모리를 탑재해 초당 1.5테라바이트의 대역폭을 제공한다.

상호 연결 인터페이스는 PCIe 5세대 16배속으로 동작하며, 최대 64GB의 통신 속도를 갖춘다. 최대 속도에 따른 처리 속도는 BF16(16비트 부동 소수점)에서 256테라플롭스, FP8(8비트 부동 소수점)에서 512테라플롭스, INT8(8비트 정수 연산)및 INT4(4비트 정수 연산)가 각각 512 TOPS 및 1024TOPS다.

퓨리오사AI의 2세대 반도체 RNGD는 인공지능 개발 및 초거대언어모델 처리에 필요한 작업을 수행하게 된다. 제품은 오는 9월 중 정식 공개되며, 제품 출시에 맞춰 MLPerf 전체 영역 테스트 결과도 함께 공개될 예정이다.

2세대 반도체 공개에 사활··· 파트너십 등에도 열 올려


퓨리오사AI 관계자가 HBM3가 실장된 RNGD 칩 실물을 소개하고 있다 / 출처=퓨리오사AI


글로벌 AI 반도체 시장의 경쟁이 격화됨에 따라 퓨리오사AI 역시 우군 확보에 열을 올리고 있다. 지난해 퓨리오사AI는 AI 기반 디지털 교육 기업 엘리스(elice)와 AI 반도체 관련 사업 협력 양해각서(MOU)를 체결한 바 있고, 올해 1월에는 한국정보통신진흥협회의 주선으로 사피온코리아, 리벨리온과 생성형 AI 및 AI 반도체 분야 공동 기획, 교육 프로그램 인증 및 개발, 활용 기업 발굴 및 컨설팅 등 AI 생태계 확산에 협력하기로 했다.

또한 지난 2월에는 대만의 컴퓨터 하드웨어 제조기업 에이수스(ASUS)와 함께 스페인 바르셀로나에서 열린 모바일월드콩그레스 2024(MWC 2024)에서 1세대 반도체 워보이 카드를 세계 시장에 선보였고, 2세대 RND 칩에 대한 협업도 논의했다. 퓨리오사AI의 글로벌 협력관계 확보는 RNGD 출시 전후로 계속 이어질 전망이다.

동아닷컴 IT전문 남시현 기자 (sh@itdonga.com)