소스코드 공개로 연구활동 ‘새바람’
알파폴드가 해독한 여러 단백질의 3차원(3D) 구조. 다양한 단백질 구조를 통해 생명 현상에 관여하는 단백질의 기능이 구현된다. 딥마인드 제공
구글의 인공지능(AI) 자회사 딥마인드는 2018년 ‘알파폴드’라는 AI 기반 단백질 구조 예측도구를 공개했다. 알파폴드는 기존에 습득한 데이터를 통해 단백질 구조를 파악한다. 2020년 12월 단백질 구조 예측 학술대회(CASP)에서 우승하며 과학계의 이목을 끈 이후 최근 들어 각종 생명과학 연구에 활력을 주고 있다.
1000여 개 단백질이 30개 이상의 구조로 이뤄진 ‘뉴클레오포린’ 단백질 구조를 밝히는 데에도 혁혁한 공을 세웠다. 지난해 7월 딥마인드가 알파폴드의 소스코드를 공개하자 마르틴 베크 독일 막스플랑크 생물물리학연구소장 연구팀은 이를 활용해 지난 10년에 걸쳐 했던 연구량을 단 3개월 만에 해낼 수 있었다.
○ 생물학 연구 판도 바꾼 ‘알파폴드’
단백질은 모든 생명현상에 관여하는 생체 분자로 수백 개에서 수천 개의 아미노산 결합 구조에 따라 다양한 특성과 기능을 갖는다. 20여 종의 아미노산이 복잡한 사슬 구조로 연결된 단백질은 사슬 구조가 꼬이고 얽히며 접히면서 3차원(3D) 입체 구조를 형성한다. 단백질 구조를 빠르게 알아낼 수 있다면 인류가 아직 확인하지 못한 생명현상은 물론 새로운 화합물의 약물로서의 효능을 밝혀낼 수 있다.
딥마인드는 올해 총 1억 개 이상의 단백질 구조 해독 결과를 추가로 공개할 계획이다. 4월 기준 40만 명의 연구자가 알파폴드의 데이터베이스를 활용한 다양한 연구를 이어가며 생물학 연구의 판도를 바꾸고 있다.
토마스 보에센 덴마크 오르후스대 구조생물학 교수는 구름 속 얼음 형성을 촉진하는 박테리아의 단백질 구조를 모델링하는 데 알파폴드를 활용하고 있다. 크리스틴 오렝고 영국 유니버시티칼리지런던(UCL) 컴퓨터생물학 교수는 알파폴드를 이용해 플라스틱을 먹어 치우는 새로운 효소를 식별하기 위한 연구를 진행 중이다. 수천 개의 단백질 구조를 빠르게 추려내고 플라스틱을 분해하는 효소가 어떻게 진화했는지, 또 분해 능력을 높이기 위한 방안은 무엇인지 찾는 연구다.
보통 진화생물학은 유전자 염기서열을 비교해 특정 종의 친척과 진화 방향을 확인한다. 유전체 차이가 크면 연구 대상에서 제외된다. 하지만 유전체보다 느리게 변화하는 단백질 구조를 비교하면 확인하기 어려운 진화적 관계를 복원할 수 있다. 페드로 벨트라오 스위스 취리히연방공과대 컴퓨터생물학자 교수는 “알파폴드는 단백질의 진화와 생명의 기원을 연구할 수 있는 놀라운 기회를 열어주고 있다”고 말했다.
○ 돌연변이 단백질 해독은 어려워… 아직 한계도
알파폴드의 한계도 분명히 있다는 지적이 나온다. 단백질 구조 해독과 예측에 제 역할을 하기 어려운 분야가 있다는 것이다. 예를 들어 암 발생 초기에 단백질의 구조를 파괴하는 다양한 돌연변이를 해독하기는 쉽지 않다.
김민수 동아사이언스 기자 reborn@donga.com