챗GPT선 “독도는 영토분쟁지역”
美빅테크에 가치관 종속 우려
佛 ‘르 챗’ 각광, 삼성전자 등 투자
국내선 네이버가 개발 적극 나서

“한국과 일본 간의 영토 분쟁 지역.”
미국 오픈AI의 생성형 인공지능(AI) ‘챗GPT’에서 ‘다케시마(竹島·일본이 독도를 가리키는 명칭)’를 검색하면 나오는 설명이다. 독도는 대한민국 영토임에도 다케시마로 검색하면 편향된 답변이 나오는 것이다. ‘독도’로 검색을 하면 “대한민국 정부가 실효적으로 지배하고 있다”고 답한다. 정보기술(IT) 업계 관계자는 “챗GPT는 미국에서 만들어진 거대언어모델(LLM)이라서, 특정 지역의 역사나 문화 등을 완전히 이해하지 못하는 일이 있다”고 분석했다.

중국 스타트업 ‘문샷 AI’는 중국어 문장 처리에 특화된 챗봇 ‘키미’를 선보였다. 문샷 AI는 중국 알리바바가 지분 약 36%를 보유하고 있다. 인도 AI 스타트업 크루트림은 현지 인도어를 학습한 LLM ‘크루트림’을 내놨다. 힌디어와 타밀어, 텔루구어 등 10가지 이상의 현지어가 지원된다. 핀란드 스타트업 사일로는 북유럽 언어 기반 LLM인 ‘포로’와 ‘바이킹’을 공개했다.
각국 정부도 소버린 AI 강화에 열을 올리고 있다. 일본은 최근 미국 기술 의존도를 줄이고자 약 725억 엔(약 6200억 원)의 자금을 기업들에 지원하고 나섰다. 일본은 이미 엔비디아와 협력해 일본어 특화 LLM을 개발하고 있다. 지역별 건축 및 지형에 특화된 자연 재해 대응 방법이나 기후 변화 등을 분석하는 식이다.
대만은 올해 1월 중국의 AI 공세에 대응하고자 소버린 AI 강화에 약 7400억 원의 예산을 책정했다. 대만 사람들이 쓰는 번체자로 콘텐츠를 제공하는 AI 챗봇 ‘타이드’ 개발에 집중하겠다는 계획이다.
한국에서는 네이버가 가장 적극적이다. 네이버는 2021년 초거대 AI ‘하이퍼클로바’를 공개하고 지난해 성능을 개선한 ‘하이퍼클로바X’를 공개했다. 자체 개발한 LLM을 바탕으로 한국어 능력을 갖춘 것은 물론이고 한국의 사회·문화적 맥락에 대한 이해도가 높다는 평가를 받는다. 하정우 네이버 퓨처AI 센터장은 “미국 실리콘밸리 빅테크가 만든 생성형 AI는 90% 이상 미국 데이터로 학습해 미국 가치관에 편향돼 있다”며 “기술과 문화 종속, 국가 정체성 약화로 이어질 것을 우려하고 있다”고 말했다.
변종국 기자 bjk@donga.com