[과학세상/박영서]데이터중심과학, 제4의 패러다임

  • Array
  • 입력 2011년 4월 6일 03시 00분


코멘트
박영서 한국과학기술 정보연구원장
박영서 한국과학기술 정보연구원장
동일본 대지진 여파로 일본과 마주한 우리나라에도 언제 어떤 재앙이 생길지 모른다는 두려움이 커지고 있다. 다행스럽게도 범지구적 환경 변화에 대처하기 위한 과학계의 관심이 높아지고 있고 이에 대한 연구도 세계적으로 점차 활성화되고 있다. 그렇지만 국내 연구 환경이 그리 순탄하지는 않다.

지구 환경 변화와 그것이 우리나라에 미칠 영향력을 연구하고 있는 지구과학자 A 박사. 그의 연구에 대한 기대와 관심은 날로 커지고 있지만 A 박사는 ‘과학데이터 확보’라는 난제 앞에만 서면 한숨만 푹푹 내쉬게 된다. 연구를 위해 대기, 해양, 위성, 지각 등에 관한 관측데이터를 광범위하게 확보해야 하지만 모두 각기 다른 기관에서 담당하는 탓에 엄청난 시간과 비용, 까다로운 절차를 감수해야 하기 때문이다. 이미 생산된 데이터를 구하는 것도 하늘의 별 따기다.

위 사례는 가상이지만, 결코 가상일 수만은 없는 스토리다. 과학기술 연구 패러다임이 1단계 실험과학, 2단계 이론과학, 3단계 계산과학을 거쳐 4단계 데이터중심과학으로 넘어오면서 이제 과학데이터 없는 연구는 상상하기 힘들다. 과학데이터란 인공위성과 전자현미경 등을 통해 관측된 데이터, 설문이나 시장조사 같은 조사데이터, 각종 실험장비에서 나온 실험데이터 등 과학기술 활동의 결과로 얻은 각종 데이터를 말한다.

이렇게 어마어마한 양의 데이터와 이를 중심으로 하는 데이터중심과학이 새 패러다임으로 정착되고 있지만 연구자들의 인식은 상당히 낮은 단계에 머물러 있다. 논문 같은 문헌정보와는 달리 데이터는 한 번 쓰면 사라지는 일회성 존재라고 여기거나 공유할 필요도 의무도 없다고 생각하는 것이 보통이다. 실제로 한국과학기술정보연구원(KISTI) 조사 결과를 보면 국내 연구자 중 30%는 과학데이터를 공유하지 않고 있고, 59%는 폐쇄된 커뮤니티에서 공유하고 있다. 공공기관 등 공식 루트를 통해 유통되는 과학데이터는 1%에 불과하다.

과학데이터의 재활용이 꽉 막혀 있는 현실은 국가 차원에서 보면 상당한 낭비다. 올해 우리나라 연구개발(R&D) 예산은 지난해보다 7.3% 증액된 14조5000억 원이다. 세계적으로도 적지 않은 액수다. 그런데 이를 통해 도출된 성과 중 문헌으로 된 것만 체계적으로 재활용될 뿐 과학데이터는 대부분 그대로 날려버린다. 이를 막기 위해 선진국에서는 수년 전부터 과학데이터의 보존과 재사용을 위한 정책을 마련해 왔다. 미국의 ‘연방기구 간 워킹그룹 활동’, 호주의 앤즈(ANDS)와 악스(ARCS) 국가 프로젝트 등이 대표 사례다. 중국은 40개 이상의 과학데이터센터를 구축하고 있다.

그나마 다행인 것은 KISTI가 10년 전부터 다양한 과학데이터를 수집, 유통하면서 상당한 노하우를 구축해 왔고 세계 최고 수준의 슈퍼컴퓨터를 보유하고 있어 과학데이터를 손쉽게 문서나 영상으로 만들어 줄 수 있다는 점이다. 과학데이터의 유통과 슈퍼컴퓨팅 역량을 동시에 가진 기관은 세계적으로 KISTI가 유일한 것으로 알려져 있다. KISTI는 최근 과학데이터를 활발하게 사용하는 각 분야 전문가를 모아 과학데이터 자문위원회를 결성하는 등 이 분야 사업을 강력하게 추진할 계획이다.

얼마 전 한 과학자에게 들은 말이 있다. 유비쿼터스시대의 도래로 주변의 모든 기기들이 데이터를 생산하는 시대가 될 것이고, 엄청난 종류와 양의 데이터를 현명하게 처리하지 못하면 어느 순간 ‘데이터의 역습’을 받게 될지도 모른다는 말이었다. 이 말이 현실이 되지 않도록 지금부터라도 데이터중심과학에 더욱 관심과 지원을 집중해야겠다.

박영서 한국과학기술 정보연구원장
  • 좋아요
    0
  • 슬퍼요
    0
  • 화나요
    0
  • 추천해요

댓글 0

지금 뜨는 뉴스