물리 노벨상이 만든 세상/나노

나노 과학이 만드는 세상(4) : DNA에 정보저장

Que sais 2020. 10. 30. 18:01

youtu.be/w3Hk0uJWMd0

<DNA에 내 파일 저장>

필름 없는 카메라디카’, 스마트폰 등이 출현한 이후 지구촌은 그야말로 정보의 홍수로 넘친다. 과거 필름비, 현상비, 인화비 등으로 사진은 물론 동영상 촬영은 특정인들의 전문 분야였으나 이제는 언제 어디서나 친구나 가족과 찍은 사진, 동영상 등등 개인용으로 저장할 데이터는 끊임없이 늘어난다.

4차 산업혁명 시대로 진입한 현재 전 세계에서 생기는 데이터와 저장용량은 상상을 초래한다. 페이스북과 인스타그램소셜네트워킹서비스(SNS)에는 매일 20억장 넘는 사진이 새로 올라오며 동영상 사이트 유튜브에는 1분마다 300시간 이상 분량의 영상이 올라온다. 현재 전 세계에서 한 해 동안 약 40조 기가바이트의 정보가 만들어진다고 한다. 이들 데이터는 갈수록 폭증(暴增)하는데 실리콘 반도체기술의 발전 속도가 데이터 용량증가를 따라가는 것에 한계가 있다.

데이터 저장장치 용량은 한계가 있으며 저장한 데이터가 언제까지 보존될 지 알 수가 없다. 외장하드나 USB 등에 저장한 나만의 자료가 내가 죽은 후에도 남아있을지 모르고 나의 10대 후손들이 내 저장장치를 적절하게 사용할 수 있을지도 의문이다.

데이터 저장의 현실적인 문제이다. 저장 매체의 덕목은 저장밀도, 수명, 가격, 안정성 등이다. USB는 길어야 10이고 CD, DVD 같은 광디스크는 수십 년, 잘해야 100을 넘지 못한다고 한다.

그러므로 수명으로만 따지면 그냥 종이에 적는 아날로그 방식이 오히려 더 나을 수도 있다. 박물관에 전시된 종이에 적힌 유명인들의 서체는 몇 백 년이 지났음에도 문제없이 읽을 수 있다. 특히 한국의 자랑 한지에 인쇄된 것은 1,000여 년의 세월이 지났음에도 우리들에게 선명하게 무슨 뜻인지 알려준다.

몇 백 권의 노트에 적힌 내용을 손톱만한 USB 하나에 모두 저장할 수 있지만 미래를 보장하는 것은 아니다. 하지만 인간은 위기가 닥칠수록 상상할 수 없는 아이디어를 창안하여 해결해왔는데 저장문제에도 획기적인 아이디어가 도출되었다. 생명정보를 담고 있는 DNA에 동영상을 비롯한 각종 정보를 저장할 수 있다.

어떤 정보를 저장하려면 하드디스크USB 같은 디지털저장 장치를 제일 먼저 떠올린다. 이런 장치들은 모든 정보를 이진법01로 바꿔서 저장한다. 예를 들어 우리 눈에는 말을 타고 달리는 사람의 동영상이 보이지만 디지털 저장장치는 이 동영상의 색깔, 크기, 명암 등 모든 것을 01로 코드화해서 00101101011100같은 아주 긴 숫자로 저장한다.

그런데 DNA4개의 염기로 되어 있어 ATTGCTTAATATAACGGGA, T, G, C 라는 염기로 데이터를 기록한다. 유전정보가 기록되는 것과 같은 원리를 활용하여 다른 데이터를 기록하는 것이다. 생물염기 3마다 하나의 코돈을 이루며 해독이 가능하므로 이를 자체적으로 암호해독키를 만들어 해석한다.

예를 들어 AAA = , TAA = , ATA = , AAT = , TTA = , TAT = , ATT = , TTT = , GGG = , GGC = , GCG = , CGG = , CCG = , GCC = 등이다.

이런 식으로 해독키를 만들어 기록을 저장하면, ‘AAA ATA GCG는 유전자 문제를 예리하게 분석한 영화의 제목인 가다카가 된다. 즉 어떤 패턴으로 어떤 단어나 숫자를 지정하여 그에 맞게 정보를 담는다.

영화 '가다카'

학자들이 주목한 것은 대장균이나 인간의 세포도 정보를 저장할 수 있다는 점이다. DNA를 저장장치로 이용할 수 있다는 것은 DNA아데닌(A), 구아닌(G), 티민(T), 사이토신(C) 네 가지 화학물질이 순서대로 저장돼 있다. DNA 두 가닥이 연결돼 이중나선을 이룰 때는 마치 지퍼의 이가 맞는 것처럼 AC, GT와만 각각 결합한다.

이후 DNA저장은 획기적으로 발전하여 2012년 미국 하버드대 연구진AC0으로, GT1로 설정하는 방식으로 책 한 권 분량의 정보를 DNA에 심는 데 성공했다. 그러나 정보를 DNA에 심는 데 성공했지만 원상태로 복구하는 과정에서 오류가 발생했다.

이 문제는 DNA에서 수분을 뽑아내는 방식이 개발되면서 해결됐다. 수분이 없는 상태에서 DNA최대 수만 년까지 보존되기도 한다. 멸종된 지 수 만 년이 지난 네안데르탈인뼈 화석에서도 DNA 정보를 뽑아내어 인류사가 획기적으로 발전한 것도 이 덕이다.

DNA 저장장치용량과 보존기한에서 실리콘 반도체와는 차원이 다르다. 현재의 실리콘 반도체5년에서 10이면 물리적 성질이 변한다. 하지만 DNA 저장장치적절한 온도만 보장되면 수백 년간 보관할 수 있다. 더불어 DNA의 크기가 분자 단위이기 때문에 모래알 크기200억 개의 DVD를 저장할 수 있다.

마이크로소프트워싱턴대 연구팀유전자 속에 사진을 저장하는데 성공했다고 발표했다. 디지털 데이터를 담은 DNA 조각들을 합성한 뒤 이를 일정한 크기의 조각으로 나눈 후 수분을 없에 저장했다가 나중에 어떤 염기들이 연결됐는지 해독해 사진을 다시 읽어낸 것이다.

조지 맥도날드 처치(1954~)

하버드대조지 처치 박사이미지를 이루는 각 점(픽셀)의 위치와 명암 정보숫자로 이뤄진 바코드로 만들었다. 이후 DNA를 이루는 염기 A(아데닌)1·0, T(티민)0·1, C(시토신)0·0, G(구아닌)1·1로 치환해 이미지 정보가 담긴 합성 DNA 조각을 만들었다. 예를 들어 바코드가 111101이면 이를 GGT로 변환한 것이다.

처치 박사가 저장한 동영상은 19세기에 인류최초로 만든 동영상 중 하나인 말을 타고 달리는 사람의 이미지로 가로, 세로가 56픽셀인 흑백의 손바닥이다. 그는 각 픽셀의 색과 위치 정보4가지 염기로 치환한 뒤 세균 면역체계의 일부크리스퍼(CR188ISPR)를 이용해 사진정보를 담은 합성 DNA대장균에 넣었다. 일주일 뒤 분열해 증식한 대장균을 모아 DNA 염기 서열을 차세대 시퀀싱(sequencing) 기법으로 해독한 결과 원본과 똑같은 손바닥 이미지를 얻을 수 있었다.

처치 박사는 이를 보다 업그레이드시켜 대장균의 유전자 속에 사진과 동영상 파일을 저장후 다시 재생하는 데에도 성공했다.

말을 타고 달리는 사람동영상사진 5으로 이뤄져 있는데 처치 박사10으로 구성된 동영상의 디지털 정보를 DNA 서열로 저장했다. 1·0A, 0·1T, 0·0C, 1·1G로 바꾸자 원래의 동영상은 1,000자가 넘는 DNA 서열로 바뀐다. 예를 들어 동영상 파일에서 10011101이라는 구간은 DNA 서열 ‘ATGT’로 바뀌는데 처치박사는 이 순서대로 DNA를 합성해 동영상 DNA염기 서열을 세균의 몸속에 주입하는데 성공했다.

 

DNA에 저장 성공한 말타기

이를 위해 세균의 면역 시스템을 이용했다. 세균바이러스가 침입할 때 바이러스의 DNA 일부를 염색체 내 '크리스퍼'라는 곳으로 끌어오는데, 대장균도 외부 DNA가 들어오자 크리스퍼 영역에 저장한 것이다. 크리스퍼(CRISPR)는 세균에 존재하는 반복된 염기서열을 의미하며 DNA의 염기서열이 역순으로 배치되는 구조로 앞으로 읽으나 뒤로 읽으나 염기 배열이 같다.

크리스퍼1987년 일본 오사카대 소우 이시노 박사대장균의 단백질 유전자를 연구하던 중 발견했다. 이후 덴마크의 요구르트 회사에서 바이러스로 유산균떼죽음을 당했을 때 살아남은 일부 유산균의 DNA를 분석한 결과 살아남은 유산균은 내성이 있었으며 회문구조(21)에서 바이러스 DNA를 발견했다. 이 유전자를 없애자 내성이 사라졌고 학자들은 이를 통해 크리스퍼면역체계에 관여한다는 것을 알아냈다.

세균바이러스가 침입하면 바이러스의 DNA 일부를 염색체 내 크리스퍼 영역으로 옮긴 뒤 가이드 RNA(gRNA)로 전사된다. gRNA바이러스의 DNA를 찾는 길잡이 역할을 하는데, 가위 역할을 하는 단백질 Cas9와 결합해 외부에서 침투한 바이러스의 DNA를 찾아 잘라낸다.

이때 단백질 Cas9에 결합하는 RNA를 바꾸면 다른 DNA 서열도 자를 수 있다는 것이 밝혀졌다. 이것이 바로 3세대 유전자가위로 주목받는 크리스퍼 유전자가위(gRNA, 크리스퍼, Cas9로 구성).

자신의 DNA에 자신을 한 번 공격했던 바이러스들의 DNA 서열을 저장해뒀다가 바이러스가 다시 침입하면 그 정보를 활용해 바이러스를 물리친다. 처치 박사는 이를 역이용하여 DNA로 바꾼 동영상을 세균에 위험이 되는 바이러스처럼 보이게 위장했다. 위협을 느낀 세균은 동영상 DNA바이러스로 오인하고 자기 몸속에 그 서열을 저장한 것이다.

크리스퍼 유전자가위를 발견한 에마뉘엘 샤르팡티독일 막스플랑크연구소 교수제니퍼 다우드나 UC버클리 교수2020년 노벨화학상을 수상했다.

2020년 노벨화학상 수상자로 선정된 프랑스 에마뉴엘 샤르팡티에 독일 막스플랑크연구소 교수와 제니퍼 다우드나는 UC버클리 교수. 노벨위원회는 두 사람이 개발한 ‘크리스퍼 유전자가위’ 기술을 혁명적이라고 평가했다. ⓒnobelprize.org

학자들이 가장 우려하는 것은 저장된 동영상이 완벽하게 재생되느냐이다. 대장균은 하루에 수십 세대가 번식하므로 수십 세대가 지난 대장균 안기존의 동영상 DNA가 그대로 저장될 수 있느냐이다. 처치박사는 동영상이 원본의 90% 가까운 상태로 보존돼 있다는 것을 발견했다. 대장균과 같은 생명체에 정보를 저장하고 재생하는 것이 가능하다는 것이 증명되었다.

DNA 저장매체 전기 없이 수만 또는 수천 년 동안 정보 저장이 가능하다. 몇 만 년 전 네안데르탈인이나 데니소바인DNA를 추출한 것이 그 실예로 DNA환상적일 정도로 견고하고 밀도 높은 저장매체로 활용할 수 있다. 특히 현재 상용화하드디스크는 전기가 있어야 작동하고 전기가 필요 없는 자기장 테이프수명이 10년 미만인 것을 보면 그 장점을 확연히 알 수 있다.

https://play.google.com/store/apps/details?id=com.geulmoe.quesais 

 

끄새 - Google Play 앱

과학으로 본 세계 불가사의한 이야기들(오디오북 무료)

play.google.com

<DNA 나노컴퓨터>

학자들이 주목하는 것은 DNA를 이용한 컴퓨터의 개발이다.

DNA 분자두께와 폭이 각각 0.34나노미터(1=10억분의 1m), 2에 불과하다. 지금까지 개발된 어떤 실리콘 반도체보다 얇고 가늘지만 훨씬 많은 정보를 담고 동시에 처리할 수 있다. 특히 기존의 실리콘 반도체전류를 흘리거나 끊으면서 10을 인식하는 식으로 순차적인 연산을 하기 때문에 속도가 빨라지는 데 한계가 있다.

레너드 애들먼 박사(1945~)

DNA 컴퓨터레너드 애들먼 박사1994 처음 제안한 개념으로 DNA를 이용해 정보를 저장하고 계산을 실행하는 분자 컴퓨터를 뜻한다. DNA 컴퓨터의 장점한 번에 여러 가지 계산을 할 수 있다. DNA를 이루는 네 가지 염기는 서로 자석을 당기듯 결합하는 성질이 있어 염기 중 AT, CG와 짝을 이룬다. 아무리 긴 DNA 서열이라고 해도 서로 짝이 맞으면 순식간에 결합을 하는데 DNA동영상을 저장했던 것처럼 어떤 정보를 저장하면 그에 맞는 짝을 아주 쉽게 찾을 수 있다.

인간 DNA

DNA 컴퓨터의 장점은 많은 정보를 쉽게 저장할 수 있다는데 있다. DNA 분자염기의 숫자가 늘어나는 만큼 동시에 반응하므로 정보 처리량이 획기적으로 늘어난다. 이를 초병렬성이라고 한다.

DNA 정보저장은 여러 가지 장점이 있는데 막대한 양을 저장할 수 있으므로 가장 경제적인 저장매체가 될 수 있다. DNA에 얼마나 고밀도로 데이터를 저장할 수 있을지는 간단하게 계산되는데 1그램의 DNA 속에 이론적으로 455 엑사바이트(EB)의 데이터를 저장할 수 있다. DNA를 구성하는 뉴클레오티드 하나의 평균 분자량327이므로 DNA 1그램에 해당하는 뉴클레오티드 숫자를 계산하여 이를 바이트로 환산하면 된다. 그런데 이 숫자가 어느 정도인가는 2GB 용량의 영화2,440억 편을 저장할 수 있는데 하루에 두 편씩 영화를 본다면 33천만 년이 걸린다는 것으로 알 수 있다.

물론 현 단계에서 DNA 컴퓨터를 실제의 전자기기에 사용하려면 세포 밖에서도 DNA를 유지하고 변형할 수 있는 방법이 마련되어야 한다. 더불어 DNA의 돌연변이 비율을 줄일 수 있는 방법도 필요하다. 우리 몸의 세포에서 DNA가 복제될 때 일반적으로 10억 번에 한 번씩 오류가 발생한다. 동영상 같은 정보는 90% 정확도로도 큰 문제가 없을 수 있지만, 아주 높은 정확도가 필요한 경우 작은 에러도 치명상이 될 수 있다.

다른 단점은 현재의 기술적인 문제로 DNA 합성과 시퀀싱비용이 많이 들고 접근 속도가 느리므로 현 단계로는 DNA를 저장목적으로 일상생활에서 사용하기는 힘들다는 견해다. 즉 아직은 DNA 저장장치가 수명과 저장 면에서 여러 가지 장점을 지닌 반면, 속도가 느리고 비용이 많이 드는 단점이 있다는 지적이다.

그러나 DNA에 정보를 저장할 수 있다는 아이디어가 워낙 매력적이므로 현재 세계 각지에서 이에 대한 연구가 이루어져 미국 컬럼비아대 등 연구진은 1그램의 DNA215PB(페타바이트)의 막대한 정보를 담을만한 집적도를 구현하는 기술을 개발했다고 발표했다.

학자들은 적어도 4차 산업혁명시대에는 DNA 정보저장에 따르는 문제들이 궁극적으로 해결될 수 있어 내 파일을 내 DNA에 저장할 수 있는 시대가 머지않아 다가올 것으로 생각한다.