구글 바드의 한국어 성능은 매우 뛰어납니다. 한국어로 된 질문을 이해하고 정확하게 답변할 수 있습니다. 또한, 한국어로 된 텍스트를 생성할 수도 있으며, 그 품질은 사람과 구별하기 어려울 정도입니다. 또한, 구글 검색을 통해 실제 세계의 정보에 액세스하고 처리할 수 있으므로, 한국어로 된 질문에 대한 최신 정보를 제공할 수 있습니다.
구글의 인공지능(AI) 챗봇 바드에게 “구글 바드의 한국어 성능에 대해 설명하는 기사를 작성해 줘”라고 부탁하자 내놓은 답변의 일부다.
구글은 앞서 지난 10일 인공지능(AI) 챗봇 바드에 한국어와 일본어를 공식 지원 언어로 추가 발표했다. 바드가 영어 외 지원하는 언어는 현재 한국어와 일본어가 유일하다.
출처=구글
업계에서는 막대한 비용과 데이터가 필요한 대규모 언어 모델은 국내 기업들이 글로벌 빅테크 기업과의 경쟁에서 우위를 점하기 어려운 분야로 평가한다. 다만 한국어 능력만큼은 더 많은 데이터를 보유한 국내 기업들이 유리한 위치에 있는 것으로 보고 있다. 네이버가 하이퍼클로바의 한국어 능력을 강조하거나, 카카오가 한국어 특화 모델인 KoGPT에 집중하겠다고 밝힌 것도 이런 이유에서다.
하지만 현재는 오픈AI의 챗GPT 한국어 성능이 빠르게 개선되고 있고, 구글도 적극적인 한국어 지원에 나서면서 안심할 수만은 없는 상황이다.
출처=구글
특히 구글은 그간 지메일 등 일부 서비스에 선보였던 인공지능 관련 기능의 한국어 서비스를 수년 동안 지원하지 않을 정도로 소극적이었지만, 이번에는 이례적일 정도로 발 빠른 행보를 보이고 있다. 이 때문에 구글이 인공지능을 지렛대 삼아 국내 검색 시장에서의 영향력을 키우려는 게 아니냐는 해석도 나온다.
그렇다면 구글 바드의 한국어 성능은 스스로 소개한 것처럼 정말 매우 뛰어날까?
또한 같은 내용의 질문이라도 영어 버전과 한국어 버전의 답변의 풍부함이 달라지는 문제는 챗GPT나 빙 챗봇 등과 마찬가지로 구글 바드에서도 볼 수 있었다.
종종 동문서답을 하는 사례도 관찰됐다. 가령 “신은 존재할까?”라는 질문을 던졌더니 “로봇은 인공 지능을 가지고 있을 수 있지만, 인공 지능은 로봇이 아니다”라는 엉뚱한 답변을 내놓았다. 질문 취지를 전혀 이해하지 못한 모습이다.
동문서답하는 바드. 출처=구글 바드 캡처
일부 질문에는 딱히 답변하지 못할 이유가 없음에도 답변을 내놓지 못하기도 했다. “등 근육 마사지 방법 알려줘”라고 하니 “저는 단지 언어 모델일 뿐이고, 그것을 이해하고 응답하는 능력이 없기 때문에 도와드릴 수가 없습니다”라는 답변이 돌아왔다. 같은 취지의 질문을 영어로 던지니 문제 없이 답변을 받을 수 있었다.
일부 질문에는 어째서인지 답변을 내놓지 못하는 모습이었다. 아래는 같은 질문을 영어로 던지자 문제 없이 답변을 내놓는 모습. 출처=구글 바드 캡처
아직은 한국어 프롬프트를 이해하고 처리하는 능력이 완전하지 않다는 걸 짐작할 수 있는 대목이다. 다만 현재는 실험 버전이므로 추후 학습 데이터가 쌓이면 개선이 이뤄질 것으로 기대해 볼 수 있다.
동아닷컴 IT전문 권택경 기자 tk@itdonga.com