30억 쌍 인간 유전체 염기 완벽히 해독…풀리지 않던 ‘8%의 빈칸’ 모두 채웠다

  • 동아일보
  • 입력 2022년 4월 4일 03시 00분


한 번에 염기서열 1만개 이상 읽는 ‘HiFi’ ‘울트라 롱 리드’ 기술 적용
짧게 잘라 읽던 방식의 한계 극복
2억 개의 염기쌍 추가로 밝혀…질환과 연관된 변이 662개 확인
난임-다운증후군 예방할 길 열려

2003년 처음 발표된 인간 유전체(게놈)의 완전한 염기서열은 실제로는 공백이 많았다. 유전체를 구성하는 30억 쌍의 DNA 염기쌍 중 15%가량을 기술적 한계로 확인하지 못했다. 반복되는 염기쌍이 많은 염색체 중심에 있는 동원체는 상당 부분 알아내지 못했다. 그 뒤로도 인간 유전체 프로젝트를 통해 인간 참조 유전체 해독 정보가 구축됐고 자료가 추가됐지만 2019년까지도 8%는 공백으로 남았다.

마침내 이 공백을 채우는 데 성공했다. 미국 영국 독일 러시아 등 4개국 33개 연구기관 과학자 114명으로 구성된 ‘텔로미어 투 텔로미어(T2T)’ 컨소시엄은 지난달 31일 국제학술지 ‘사이언스’에 DNA 염기쌍 30억 쌍을 완벽히 해독한 인간 유전체 정보를 공개했다. 텔로미어는 염색체 양쪽 끝에 있는 말단 염기서열로 T2T는 유전체 전체를 뜻한다.
○ “유전체 읽는 새 안경 쓴 것과 같은 성과”
연구팀은 새롭게 등장한 유전자 해독 방식으로 한 번에 수만 개의 염기쌍 서열을 읽어내는 ‘롱 리드’를 적용해 과거의 기술적 난제를 극복했다. 앞선 인간 유전체 분석에는 DNA를 약 150염기쌍 길이로 잘게 잘라 해독한 뒤 다시 원래 DNA로 짜 맞추는 ‘쇼트 리드’ 기술이 쓰였다. 문제는 인간의 DNA 중 반복되는 부분이 너무 많아 위치를 특정할 수 없는 경우가 생긴다는 점이다. 파란 하늘이 배경인 퍼즐을 맞추는데 너무 비슷한 조각이 많아 정확한 위치를 찾기 어려워지는 것과 같은 이치다.

반면 롱 리드는 유전자의 염기서열을 한 번에 1만 개 이상 읽어내는 시퀀싱 기법이다. 반복되지 않는 부분까지 퍼즐 조각에 포함시켜 상대적으로 맞추기 쉬운 큰 퍼즐 조각을 만드는 원리다. 연구팀은 생명공학기업 팩바이오의 ‘하이파이(HiFi)’ 기술과 옥스퍼드 나노포어의 ‘울트라 롱 리드’ 기술을 섞어 활용했다. DNA를 자른 후 고리 형태로 만들어 여러 번 읽는 방식으로 정확도를 높인 하이파이는 한 번에 약 2만 개의 염기쌍을 정확하게 분석한다. 나노미터(nm·10억분의 1m) 크기 구멍에 DNA를 통과시켜 염기쌍을 읽는 세포의 기능을 구현한 울트라 롱 리드는 정확도는 다소 떨어지지만 한 번에 최대 100만 개의 염기쌍을 읽어낸다.

연구팀은 이번에 2억 개의 DNA 염기쌍을 새롭게 밝혀내면서 인간 유전체 중 해독된 염기쌍의 수를 30억5500만 쌍으로 늘렸다. 단백질을 만들 수 있는 유전자 약 2000개와 DNA 변이 200만 개도 새로 발견했다. 622개 변이는 질환과 연관된 유전자에서 확인됐다. T2T 컨소시엄 공동 의장인 애덤 필리피 NHGRI 선임연구원은 “마치 새 안경을 쓰는 것과 같다”며 “모든 것을 명확하게 볼 수 있고 유전체 서열이 무슨 뜻인지를 이해하는 데 한발 더 다가섰다”고 평가했다.

연구팀은 향후 유전체 분석 정확도를 높이고 인종 등 유전체의 다양성도 확대할 계획이다. 이번에 구축된 유전체는 유럽 남성의 유전체가 쓰였는데 아직 오류가 0.3% 포함될 수 있다고 추정된다. 연구팀은 첫 분석에서는 오차 확률을 줄이기 위해 X염색체(성염색체)를 가진 세포를 이용했다. 하지만 추가로 또 다른 성염색체인 Y염색체에 대해서도 분석을 진행해 데이터를 이번에 함께 공개했다. 인간 범유전체 참조 컨소시엄과도 손을 잡고 2024년까지 전 세계 350명의 유전체를 분석하는 작업도 진행 중이다.
○ 난임·다운증후군 해결 실마리, 값싸고 빠른 분석기술의 승리 평가

인간 유전체를 밝혀내면 유전체의 기초적 특성과 함께 유전자와 관련된 각종 질환의 기원을 밝혀내는 데 도움을 줄 수 있을 것으로 기대된다. 사이언스는 이번에 구축한 인간 유전체 지도로 연구한 유전체 구조와 유전자 변이에 관한 연구 결과 6편도 함께 발표했다. 인간 유전체에서 밝혀지지 않았던 동원체의 구조를 알게 되면서 염색체 쌍이 감수분열에서 분리되지 않아 일어나는 난임 질환과 다운증후군을 예방할 새로운 길이 열렸다고 평가했다.

이번 성과는 더 값싸고 정교해진 인간 유전체 분석 기술의 승리라는 평가도 나온다. 인간 유전체 프로젝트가 13년간 30억 달러의 예산을 투입한 것과 달리 T2T는 겨우 4년이 걸렸다. 유전체 분석에 쓴 비용도 약 100만 달러에 머문다. 속도와 비용에서 비약적인 성장이 일어난 셈이다.

연구 1저자인 이아랑 NHGRI 연구원은 “컨소시엄에서 확보한 기술로 지금은 수주 내로 인간 유전체를 정확히 확인하는 게 가능하다”며 “미래에는 하루 만에 100만 원 이하로 자신의 유전체를 분석하고 질병 치료에 활용하는 시대가 올 것”이라고 말했다.

#인간 유전체#게놈#염기서열#동원체#염색체#유전자#난임#다운증후군#hifi#울트라 롱 리드
  • 좋아요
    0
  • 슬퍼요
    0
  • 화나요
    0

댓글 0

지금 뜨는 뉴스

  • 좋아요
    0
  • 슬퍼요
    0
  • 화나요
    0