작은 공간에 많은 데이터 저장 가능… DNA 1g에는 수백 PB의 정보 담겨
디지털 정보를 염기서열로 바꾸고… 순서에 맞게 조립하는 과정 필요
변질 우려 없고 상온에 보관 가능… 장기보관에 필요한 에너지도 절약
생물의 유전물질인 ‘디옥시리보핵산(DNA)’을 활용하면 같은 양의 정보를 다른 저장 장치보다 훨씬 작은 공간에, 더 오래 저장할 수 있습니다. DNA는 지구에 생명체가 등장한 이후 수십억 년 동안 쭉 정보를 저장하는 물질이었지요. 사람들이 DNA 저장 장치에 주목하는 이유는 무엇일까요?
● DNA 저장 장치, 제품으로 나오다
지난해 12월 프랑스 바이오 기업 바이오메모리는 DNA 저장 장치를 출시한다고 발표했어요. 누구나 홈페이지에서 예약 구매 신청을 할 수 있지요. 이 회사는 1000유로(약 140만 원)를 내면, 1KB(킬로바이트)를 저장할 수 있는 DNA 칩을 제공할 계획입니다. 1KB에는 띄어쓰기 없이 한글 341글자를 저장할 수 있어요. 최근 개인용 컴퓨터에 쓰이는 저장장치 용량의 단위가 1TB(테라바이트·1TB는 1024GB·기가바이트)인 것을 감안하면 아주 적은 양입니다. 에르판 아르와니 바이오메모리 대표는 “아직 용량은 작지만 기술의 가치를 보여주고 싶었다”고 밝혔어요.
DNA 저장 장치의 가장 큰 장점은 작은 공간에 많은 데이터를 저장할 수 있다는 점입니다. 이론상 DNA 1g에는 수백 PB(페타바이트)의 정보를 저장할 수 있어요. 1PB는 1TB보다 1024배 큰 용량입니다. 최영재 광주과학기술원 신소재공학부 교수는 “현재 가장 높은 수준의 반도체 회로 사이 간격은 2nm(나노미터)인데, DNA 정보 단위인 염기 사이 간격은 이보다 훨씬 짧은 0.34nm”라며 “DNA는 반도체보다 정보를 훨씬 촘촘하게 저장할 수 있다”고 설명했습니다.
DNA는 매우 안정적인 물질로 보존 기간이 길고 보관이 까다롭지 않아요. 최 교수는 “수백만 년 전 화석의 DNA를 해독할 수 있는 것처럼 수분을 제거한 DNA는 변질될 우려가 거의 없다”고 했어요. 현재 널리 쓰이는 저장 장치인 하드 디스크 드라이브(HDD)나, 솔리드 스테이트 드라이브(SSD)의 수명은 길어야 수십 년입니다. 또 전기 에너지를 계속 공급받지 않으면 정보가 사라지거나 변형될 위험이 있지요. 반면 DNA는 별다른 연결 없이 상온에서 보관하면 되기 때문에 에너지도 아낄 수 있답니다.
● 0과 1로 된 디지털 정보를 염기 서열로
우리가 컴퓨터에서 볼 수 있는 정보의 가장 작은 단위는 무엇일까요? 0(없음) 또는1(있음)의 두 가지 상태만을 나타내는 비트(Bit)입니다. 비트 8개가 모여 ‘10011010’과 같이 정보를 표현한 단위를 바이트(Byte)라고해요. 1바이트는 알파벳이나 숫자 1개를 표현하지요. 복잡한 정보도 컴퓨터에서는 모두 0과 1로 변환해 나타낼 수 있습니다.
반면 DNA에서 정보를 표현하는 단위는 A, C, G, T 등 4개예요. 그래서 디지털 정보를 DNA로 바꾸려면 먼저 규칙을 정해야 합니다. A와 T는 0으로, C와 G는 1로 정할 수도 있겠지요. 아니면 A는 00, C는 01, G는 10, T는 11과 같이 약속할 수도 있지요. 규칙에 따라 정보를 ‘GAACGTCT’처럼 염기 서열로 바꿨다면 순서에 맞게 DNA를 조립해야 합니다. G 다음에 A를 결합하고, 다음에 다시 A를 결합하는 식이지요.
유전자 합성 기술을 연구하는 기업인 ATG라이프텍 류태훈 대표는 “DNA를 정해진 서열대로 합성하는 과정이 가장 까다롭다”고 설명했어요. DNA를 합성하는 동안 서열 중간에 오류가 발생했는지 확인하는 데 시간이 오래 걸리기 때문이지요. 이후 DNA 조각은 건조 과정을 거칩니다. 류 대표는 “수분이 있으면 DNA가 파괴되거나 변질될 수 있다”고 설명합니다.
DNA에 저장된 정보를 읽어내는 과정은 저장하는 과정보다 쉬워요. 류 대표는 “빛을 쬐어 염기 서열을 읽는 광학장치를 사용하면 1조 쌍 정도의 염기 서열은 이틀이면 파악할 수 있다”고 했어요. 해독한 염기 서열을 처음 약속한 규칙에 따라 다시 0과 1로 된 디지털 정보로 변환하면 컴퓨터에서 사진이나 영상 등 원본 정보를 확인할 수 있지요.
● 폭발적으로 늘어나는 데이터, 보존 방법은
2018년 정보기술(IT) 분야 분석기관인 국제데이터코퍼레이션(IDC)은 인류가 만든 모든 정보의 용량이 2025년 기준으로 175ZB(제타바이트)에 달할 것으로 예상했어요. 1제타바이트는 1024엑사바이트이고, 1엑사바이트는 1024페타바이트입니다. 정보가 늘어나는 속도도 점점 빨라질 것으로 내다봤죠. 최 교수는 “모든 정보가 인공지능(AI) 학습에 쓰이는 등 사람에게 이득을 주기 때문에 정보를 지우기보다 가능한 한 저장하려고 할 것”이라고 분석했어요.
늘어나는 정보는 보관할 장소를 마련하기 어려울뿐더러 에너지 문제와도 연결됩니다. 국제에너지기구(IEA)는 2020년 기준으로 전 세계 데이터센터가 지구 전체 전력 소모의 1%를 차지했다고 발표했어요. 데이터가 늘어나면 이 비율도 증가하지요. 최 교수는 “데이터센터에 있는 저장 장치는 늘 전원이 연결된 상태로, 정보가 변형되거나 손실되지 않도록 항상 검사 프로그램이 작동 중”이라고 설명했습니다.
그런데 사람들이 저장된 모든 정보를 자주 꺼내 보는 건 아니에요. 최 교수는 “5년 이상 확인하지 않고 장기 보관하는 ‘콜드 데이터’의 비율이 전체의 20∼25% 정도일 것으로 추정된다”고 설명했습니다. 보관용 데이터를 DNA로 저장하면 공간도 적게 차지하고, 보관에 필요한 에너지도 줄일 수 있지요.
인류의 지식을 우주나 다른 행성으로 들고 가야 할 때도 DNA 저장 장치가 해결사 역할을 할 수 있어요. 류 대표는 “우주선의 무게를 줄이는 것이 중요하기 때문에 많은 정보를 들고 갈 때는 DNA 저장 장치가 유리할 것”이라며 “DNA는 안정적인 물질이어서 극지방이나 지구 밖의 극한 환경에서 정보를 보관하기에 적합하다”고 덧붙였답니다.
댓글 0