뉴스 트렌드 생활정보 International edition 매체

[일하며 생각하며]이광형/한글,이래서 우수하다

입력 | 1997-10-08 19:52:00


9일은 한글날. 유네스코가 최근 조선왕조실록과 함께 훈민정음을 세계기록유산으로 지정, 올해 한글날은 더욱 뜻깊은 날이 되었다. 한글이 과학적이고 우수한 글자라는 것을 배웠지만 그 이유를 이해하지 못한 필자는 우연한 기회에 그 우수성을 증명하는 두가지 사실을 발견했다. ▼ 서양선 교사도 철자 틀려 ▼ 첫번째는 프랑스와 미국에서 프랑스어와 영어를 배우면서 알게 되었다. 우리나라에서는 중등학교 정도의 교육만 충실히 받으면 한글의 맞춤법을 틀리지 않는다. 그러나 서양사람들은 대학교 졸업자는 물론이고 교사들까지도 자주 철자를 틀리게 쓰는 경우를 보았다. 그런데 거의 모든 교사들이 그렇고, 또 그들 모두가 자격증 소지자라는 것을 알고는 그들의 글자에 문제가 있음을 깨달았다. 우리는 발음할 수 있는 말은 모두 글로 쓸 수 있다. 그러나 그들은 발음을 해도 어떻게 쓰는지 알 수 없는 경우가 허다하다. 그것은 말과 글이 얼마나 일치하느냐, 일치하지 않느냐를 잘 나타내주는 것으로 한글이 쉬운 글자라는 것을 증명한다. 한국의 문맹률이 0%에 가까운데 반하여 서양의 문맹률은 20%를 웃도는 현실은 이런 관찰결과와 무관하지 않다고 본다. 두번째 우수성은 컴퓨터 공부를 하다가 발견했다. 정보화시대에는 문자인식이라 하여 컴퓨터가 사람이 쓴 글자를 읽게 하는 작업이 필요하다. 이 작업의 원리는 컴퓨터가 문자(패턴)를 기억하고 있다가 읽은 내용을 이 기억된 문자와 비교하여 일치하면 해당문자라고 인식하는 것이다. 이때 인식하는 단위를 어느 것으로 하느냐 하는 문제가 생긴다. 「학교(School)」라는 단어를 인식한다고 해보자. 영어에서는 알파벳문자(s, c, h 등)와 단어(School) 단위 등 두 가지로 할 수 있다. 그런데 알파벳문자 단위로 읽으면 글자 획이 단순해서 다른 문자와 구별이 안되는 경우가 많다. 예를 들면 알파벳문자 P와 R는 비슷해서 혼동하기 쉽다. ▼ 컴퓨터 문자인식률 높아 ▼ 그렇다고 해서 단어 단위로 인식하게 하려면 기억하고 있어야 할 단어가 수십만개가 되어 비현실적이다. 그래서 할 수 없이 알파벳문자 단위로 읽는다. 즉 「학교」를 영어로 인식하게 하려면 s, c, h, o, o, l의 6개 문자를 각각 읽어 이것들을 기억된 알파벳 모양(패턴)과 비교하게 한다. 그런데 한글에서는 「모아쓰기」라는 특징이 있다. 영어에서처럼 자모를 옆으로 나열하지 않고 모아서(「학」 「교」 등으로) 쓰는 것이다. 그래서 한글에서는 컴퓨터가 인식하는 단위를 정할 때 세가지 선택이 있다. 첫째는 한글 자모단위(ㅎ, ㅏ, ㄱ 등), 둘째는 글자단위(학, 교 등), 셋째는 단어단위(학교,소년 등)로 읽는 것이다. 첫번째 방법은 영어에서처럼 획이 너무 단순하여 구별이 잘 안되고 셋째 방법은 기억해야 할 단어가 너무 많게 된다. 그런데 두번째 방법인 글자단위로 하면 글자 하나 하나가 적당히 복잡하여 다른 글자와 구별이 잘된다. 또한 한글 자모로 이루어지는 글자가 3만자가 안되기 때문에 컴퓨터가 기억하기도 쉽다. 앞의 「학교」를 읽게 하려면 「학」 「교」 라는 두 개의 글자를 받아들여 이것을 기억하고 있는 패턴과 비교하면 된다. 이런 이유 때문에 동일한 수준의 문자인식프로그램을 이용하여 영어와 한글을 인식하게 하면 한글인식률이 더 높다. 위와 같은 비교관찰은 전문적이고 종합적이라고 할 수는 없다. 그러나 무조건 한글이 우수하다고 가르치는 것보다는 외국어와 비교해서 이같은 장점이 있음을 설명해주며 가르치면 더욱 효과적일 것이다. 이광형 (한국과학기술원 교수·전산학)