뉴스 트렌드 생활정보 International edition 매체

“챗GPT 답변 하나에 전기료 수 달러”… 절전형 AI 개발에 사활

입력 | 2023-03-13 03:00:00

AI 복잡한 연산 수행에 막대한 전력
업계 “산업 가치 떨어질 것 막아야”
최적화 SW 통해 AI 성능 개선하고
전력 소모 적은 전용 반도체 개발




“챗GPT가 하나의 답변을 만들어 내기까지 수 달러가 든다. 컴퓨팅 비용이 눈물이 날 정도로 막대하다. 반드시 수익화가 필요하다.”(샘 올트먼 오픈AI 최고경영자·CEO)

인공지능(AI)의 고도화로 복잡한 연산을 수행하기 위해 막대한 전력이 소모되자 정보기술(IT) 업계에서는 소비 전력 감축과 비용 절감을 위한 전략 마련에 한창이다. 전력 소비 문제를 해결하지 않으면 비용 부담이 커져 생성 AI 등 미래 AI 서비스의 산업적 가치가 점차 떨어질 수 있다는 우려 때문이다.

12일 IT 업계에 따르면 대규모 AI 모델을 개발하는 기업들은 기업 간 협업을 통해 소비 전력 감축 등에 나서고 있다. 최적화 소프트웨어를 통해 AI 성능을 끌어올려 시간당 전력 소모를 최소화하거나 AI 구동에 전력 소비가 적은 반도체를 사용하는 식이다.

국내 통신사들은 AI 반도체 기업과 손잡고 대규모 AI 모델 효율화에 나섰다. 현재 통신 3사는 초거대 AI를 활용한 서비스를 준비 중인데 ‘AI 반도체’를 활용해 AI 성능을 높이고 수익성을 극대화한다는 전략이다. AI 반도체는 AI를 구동하는 데 특화된 반도체로 범용으로 사용되는 기존 반도체와 비교해 AI 구동을 위한 연산에 사용되는 전력 소모량이 적다.

SK텔레콤은 지난해 사내 AI 반도체 사업 부문을 따로 떼어내 사피온코리아를 설립하고 미국 실리콘밸리에 사피온 본사를 꾸렸다. 사피온은 올해 상반기(1∼6월) 내 차세대 AI 반도체 칩 ‘사피온 X330’을 출시할 예정이다.

사피온 관계자는 “X330은 이전 버전인 X220보다 4배가량 성능이 향상됐으며, 전력 소비는 더 큰 폭으로 줄어들 것”이라고 했다. X220의 경우 가장 많이 쓰이는 엔비디아 GPU에 비해 전력 소비는 40%, 성능은 1.6배 향상됐다.

KT와 협업 중인 리벨리온은 데이터센터용 AI 반도체 ‘아톰’을 출시해 현재 KT 데이터센터에서 테스트 중이다. 4월 말 ‘믿음’의 경량화 모델에 적용할 예정이며 향후 고성능 컴퓨터(하이퍼스케일 컴퓨터)에도 적용할 계획이다.

통신업계 관계자는 “초거대 AI를 수지타산에 맞게 구동하려면 AI 반도체 개발이 필수”라며 “AI 경쟁에서 승기를 잡기 위해 장기적으로 AI 반도체에 더 많은 투자를 지속할 것”이라고 했다.

당장 서비스 출시를 앞두고 있거나 AI 반도체를 개발할 여력이 안 되는 스타트업의 경우 최적화 소프트웨어로 눈을 돌리고 있다. 한때 성희롱 발언으로 논란이 됐던 AI 챗봇 ‘이루다’를 개발한 스캐터랩은 지난해 10월 ‘이루다 2.0’을 출시하며 최적화 소프트웨어를 적용해 전력 소비를 크게 줄였다. 스캐터랩이 사용한 소프트웨어는 프랜들리 AI가 개발한 ‘페리플로우’다.

회사에 따르면 이루다 2.0의 기반이 된 GPT2의 경우 페리플로우를 적용하면 이전보다 전력 소모가 30배 이상 줄어든다. 페리플로우는 생성 AI에 특화된 최적화 소프트웨어 기술로, 여러 가지 요청이 들어왔을 때 중복되는 작업을 최소화한다. 그만큼 같은 시간 안에 처리할 수 있는 요청이 많아지고 사용 전력이 줄어든다. 마이크로소프트 역시 클라우드 시스템 ‘애저’ 내 AI 인프라의 전력 소모를 줄이기 위해 페리플로우를 적용하고 있다.

프랜들리 AI를 창업한 전병곤 서울대 교수는 “갈수록 생성 AI처럼 대규모 데이터를 활용하는 기업이 많아지면서 최적화 소프트웨어에 대한 국내외 수요가 늘고 있다”고 했다.


최지원 기자 jwchoi@donga.com