데이터 공유-협력이 살길… ‘오픈 사이언스’ 바람

  • 동아일보
  • 입력 2016년 6월 17일 03시 00분


코멘트

‘빅사이언스’ 시대 과학계 새 움직임

지난달 27일 벨기에 브뤼셀에서 열린 ‘유럽연합(EU) 경쟁력위원회’. 이날 회의에서는 ‘허라이즌 2020’ 계획의 일환으로 2020년부터 유럽에서 발간되는 과학 논문 중 공적 자금이 조금이라도 투입된 논문은 즉시 공개한다는 내용에 합의했다. EU 경쟁력위원회 제공
지난달 27일 벨기에 브뤼셀에서 열린 ‘유럽연합(EU) 경쟁력위원회’. 이날 회의에서는 ‘허라이즌 2020’ 계획의 일환으로 2020년부터 유럽에서 발간되는 과학 논문 중 공적 자금이 조금이라도 투입된 논문은 즉시 공개한다는 내용에 합의했다. EU 경쟁력위원회 제공
공유냐, 보안이냐. 방대한 정보를 다뤄야 하는 ‘빅사이언스’에서 최근 과학계가 공유로 연구 방향을 틀고 있다. 공유와 협력을 통해 더 다양하고 풍부한 데이터를 얻고 이를 통해 좋은 연구 성과를 어느 정도 담보할 수 있기 때문이다.

○ 공유, 협력은 ‘빅사이언스’ 유지에 필수

지난달 2일 과학 학술지 ‘네이처’에 실린 전 세계 유방암 환자 560명의 전체 게놈(유전체) 분석 프로젝트는 공유를 표방하는 빅사이언스의 대표적인 예다. 이 프로젝트에는 우리나라를 포함해 12개국 48개 기관이 공동으로 참여해 유방암 환자 연구에서는 세계 최대 규모를 기록했다.

국내 환자 83명을 포함해 아시아권 환자의 유전체 분석을 담당한 공구 한양대 의대 교수는 “전체 연구비의 100분의 1만 투입해 전 세계 유방암 환자의 유전체 데이터를 확보하고 이들을 비교할 수 있었다”며 “이 연구는 개인 맞춤형 치료를 위한 항암제 개발의 토대가 될 것”이라고 말했다.

2013년 ‘신의 입자’로 불리는 힉스 입자를 발견한 유럽입자물리연구소(CERN)는 ‘공유의 아이콘’으로 불린다. 현재 CERN에는 40개국 172개 기관에서 약 3000명의 과학자가 거대강입자가속기(LHC)를 이용한 실험과 연구에 참여하고 있다.

이형진 한국과학기술정보연구원(KISTI) 정책연구실장은 “테라바이트(TB·1TB는 1024GB)급 데이터를 생산하는 가속기 등 첨단 과학장비를 활용한 연구에서는 국제 협력이 불가피하다”며 “대용량 데이터에 쉽게 접근할 수 있도록 ‘글로벌 대용량 과학실험 데이터 허브센터(GSDC)’를 구축해 지원하고 있다”고 말했다.

최근 아인슈타인이 예견한 중력파를 또다시 감지하는 데 성공한 라이고(LIGO) 과학협력단에 소속된 한국중력파연구협력단은 LIGO의 중력파 관측 데이터에 연동된 컴퓨팅 환경을 갖춘 GSDC를 활용해 블랙홀과 중성자별의 물리량 측정 연구를 수행하고 있다. 유럽은 이와 유사한 클라우드 환경인 ‘유럽오픈사이언스클라우드(EOSC)’를 구축하는 데 67억 유로(약 8조8275억 원)를 투입해 2021년 완공한다는 계획을 세웠다.

공 교수는 “국제 협력 연구에 참여하기 전에는 비용 대비 얼마나 가치 있는 데이터를 얻을 수 있는지, 연구 분야를 선도할 수 있는지 등을 면밀히 따져봐야 한다”고 말했다.

○ 유럽-미국, 논문과 데이터까지 무료 공개 방침

일각에서는 연구 데이터와 결과를 다른 분야의 과학자와 일반 대중에게 공개하자는 ‘오픈 액세스(OA)’ 바람도 불고 있다. 정부 예산 등 국민의 세금이 들어간 연구 논문은 무상으로 공개하자는 것이다.

유럽연합(EU)은 지난달 27일 벨기에 브뤼셀에서 열린 ‘EU 경쟁력위원회’에서 ‘삶을 바꾸는 개혁’의 하나로 “2020년부터 유럽에서 발간되는 과학 논문 중 공적자금이 조금이라도 투입된 논문은 즉시 공개한다”는 내용의 ‘허라이즌 2020’ 계획에 합의했다. 대부분의 학술지들이 유료로 논문을 공개하고 있어 과학 정보에 접근하는 데 비용이 너무 많이 든다는 지적이 받아들여졌기 때문이다.

논문 무료 공개 사이트인 ‘사이언스허브(Sci-Hub)’는 최근 5년간 논문 5000만 편을 무료로 제공해 왔고 이용자 수도 폭발적으로 증가했다. 과학 학술지 ‘사이언스’에 따르면, 2월 한 달간 사이언스허브에서 내려받은 논문 수는 621만3089편을 기록했다. 사이언스는 “국가별로는 중국에서 가장 많이 활용하고 있는 것으로 나타났다”며 “논문 구매가 어려운 개발도상국뿐만 아니라 미국과 유럽 등 선진국에서도 이용자 수가 늘고 있다”고 밝혔다.

미국은 논문뿐만 아니라 연구에 사용된 데이터를 공개해 연구 과정까지 공유하는 ‘오픈 데이터’를 지향하고 있다. 미 백악관 과학기술정책실은 2013년 연구개발(R&D) 예산 규모가 1억 달러(약 1171억 원) 이상인 연방정부 기관을 대상으로 “정부 예산이 투입된 논문에 대해서는 재가공이 가능한 디지털 형식의 데이터를 공개할 수 있는 방안을 마련하라”는 지침을 전달했다. 미 국립과학재단(NSF) 등은 이런 정책에 발맞춰 연구 계획서를 제출하는 단계에서 논문 공개 계획을 밝히도록 했고, 논문을 게재한 지 1년 이내에 논문 전체와 데이터를 공개하는 제도를 마련했다.

주원균 KISTI NTIS사업실장은 “국내에도 연구 논문과 디지털 데이터를 공유할 수 있도록 ‘오픈사이언스 랩’ 등 서비스를 운영하고 있지만 아직 이용률이 저조하다”며 “오픈 액세스 움직임에 대비할 필요가 있다”고 말했다.

송경은 동아사이언스 기자 kyungeun@donga.com
#빅사이언스#연구 데이터 공유#사이언스허브
  • 좋아요
    0
  • 슬퍼요
    0
  • 화나요
    0
  • 추천해요

댓글 0

지금 뜨는 뉴스