국내 연구진이 유전체 빅데이터에서 질병에 관여하는 유전자 후보군을 기존보다 2배 이상 많이 발굴해낼 수 있는 분석법을 개발했다. 신약 개발과 질병 연구에 들어가는 비용과 시간을 획기적으로 줄일 수 있을 것으로 전망된다.
울산과학기술원(UNIST)은 수학자 출신인 남덕우 생명과학부 교수 연구팀이 1만 명 미만의 적은 유전체 데이터만으로도 질병 유전자 후보군을 신속하고 정확하게 찾아낼 수 있는 통계 알고리즘 ‘GSA-SNP2’를 개발했다고 26일 밝혔다.
기존에는 통계적인 방법으로 찾아낼 수 있는 질병 유전자 후보군이 전체의 10∼40%에 불과했다. 나머지는 오랜 시간에 걸친 실험을 통해 밝힐 수밖에 없었다. 하지만 GSA-SNP2를 활용하면 특정 질병에 관여하는 유전자 후보군을 80% 가까이 밝힐 수 있는 것으로 나타났다. 남 교수는 “이 후보군에 대해 우선적으로 검증을 할 수 있기 때문에 그만큼 실험의 효율을 높일 수 있다”고 설명했다.
연구진이 이미 발병에 관여하는 유전자 군을 알고 있는 당뇨병에 대해 예측 시뮬레이션을 한 결과 GSA-SNP2는 시중 최고 성능의 ‘마그마(MAGMA)’ 알고리즘보다 당뇨병 유전자를 2배 더 많이 찾아냈다. 가장 많이 쓰이는 알고리즘인 ‘마젠타(MAGENTA)’보다는 5배 이상 많았다. 그러면서도 오답을 내놓을 확률은 마젠타, 마그마와 마찬가지로 0에 가까웠다.
또 기존에는 유의미한 질병 유전자 후보군을 가려내려면 최소 1만 명의 유전체 데이터가 필요했다. 하지만 GSA-SNP2를 활용할 경우 수천 명 단위에서도 질병 유전자 후보군을 정확하게 찾아낼 수 있는 것으로 나타났다. 분석 시간은 일반 노트북 기준 2분 남짓이다. 같은 조건에서 30분에서 열흘 이상까지 걸렸던 기존 알고리즘보다 훨씬 효율적이다. 연구 결과는 국제학술지 ‘뉴클레익 애시드 리서치’ 19일자 온라인판에 게재됐다.
댓글 0