[연재] 서울대 이공계인, 그들을 주목하다 ③

침 한 방울로 내 몸의 미래를 예측할 수 있는 세상이 다가오고 있다. ‘23앤드미(23andMe)’로 대표되는 유전자 검사 업체들은 의뢰인이 보낸 침에 있는 유전자를 분석해 미래에 걸릴 수 있는 질병을 예측해 알려준다. 의뢰인의 유전자에 병을 유발하는 유전자가 있는지 분석해 그 확률을 계산하는 것이다. 지난 5월에는 배우 안젤리나 졸리가 유방암에 걸릴 확률이 높다는 검사 결과를 받고 유방 절제술을 받으며 화제가 되기도 했다. 이런 유전자 검사의 바탕에는 생물학과 정보과학의 융합 학문인 ‘생물정보학’이 자리하고 있다. 『대학신문』은 선두주자의 하나로서 생물정보학을 이끌고 있는 윤성로 교수(전기정보공학부)를 만나봤다.

쏟아지는 생물 정보, 생물정보학 시대의 도래

생물학이 변하고 있다. 윤성로 교수는 “과거에는 실험과학이었던 생물학이 정보의 형태·전송·처리·축적에 관한 이론 또는 기술을 연구하는 분야인 정보과학과 결합되고 있다”고 설명했다. 이런 변화는 오늘날 개인의 유전자 지도 작성이 대중화된 데서 기인한다. 2000년 게놈프로젝트를 통해 최초의 인간 유전자 지도가 완성됐으며 이후 10여년 동안 유전자를 읽는 데 필요한 비용이 약 3천분의 1로 감소했고 시간이 약 700분의 1로 감소하면서 이제 보통 사람들도 자신의 유전자를 읽을 수 있는 세상이 됐다. 최근에는 침과 99달러(약 11만원), 일주일의 시간만 있으면 자신의 유전자 정보를 알 수 있게 됐다.

유전자 검사가 쉬워지면서 생물학계에는 방대한 양의 데이터가 쌓이기 시작했다. 사람의 유전자는 30억 개에 달하는 문자열로 구성돼있기 때문에 많은 이들이 유전자 검사를 하게 되면 상당한 양의 정보가 만들어진다. 이런 정보들을 처리하기 위해서는 빅데이터를 다루는 데이터 과학자들의 기술이 필요한데, 이 필요를 충족시키기 위해 만들어진 융합 학문이 생물정보학이다.

생물학과 융합한 정보과학은 어떤 역할을 할까. 생물의 모든 정보는 DNA에 담겨 있다. DNA는 RNA를 거쳐 단백질로 발현돼 특정 기능을 수행한다. 이를 분자생물학의 ‘중심 원리(central dogma)’라 하는데, 각 단계를 구성하는 DNA, RNA, 단백질은 생물체를 이해하는 핵심적인 요소다. 윤성로 교수는 “DNA와 RNA, 단백질은 모두 문자열”이라며 “문자열 데이터를 분석하고 RNA와 단백질의 상호작용을 연구하는 데 정보과학이 이용된다”고 설명했다. 정보과학은 단계적 방법을 이용해 컴퓨터가 문제를 해결하도록 하는 ‘알고리즘’과 처리 과정의 속도를 높이는 ‘병렬화’를 통해 많은 데이터를 빠른 시간에 처리한다.

이처럼 윤 교수는 알고리즘과 병렬화를 사용해 DNA의 문자열을 분석하고 RNA, 단백질의 구조와 기능을 예측하는 연구를 진행하고 있다. 현재 DNA 문자열을 읽는 기술은 약 0.1% 정도의 오차율을 갖고 있다. 오차율이 높기 때문에 검사를 통해 얻은 DNA 문자열이 실제 DNA 문자열과 일치한다고 신뢰하기 어렵다. 윤 교수는 전기학에서 무선 통신의 오차율을 줄이는 데 사용되는 기법 등을 응용해 DNA 문자열 읽기의 오차율을 줄이기 위해 노력하고 있다. 또 생물체 내에서 특정 기능을 수행하는 RNA와 단백질의 상호작용을 분석하는 연구도 함께 하고 있다. 하나의 RNA와 단백질은 다양한 역할을 갖고 서로 상호작용을 하기도 하기 때문에 RNA와 단백질의 기능을 분석하는 것은 방대한 데이터를 분석해야 하는 작업이다. 윤 교수는 알고리즘과 병렬화를 이용해 RNA와 단백질의 구조와 기능을 예측하고 있다.

99.9%에서 0.1%로의 초점 이동

이 같은 정보과학과 생물학의 융합으로 의학계는 개개인의 유전자 분석을 바탕으로 한 개인 ‘맞춤의학’이 더욱 활성화될 것으로 기대한다. 사람들은 99.9%의 유전자를 공유하며 대부분의 사람들은 같은 약을 먹고 같은 효과를 얻는다. 하지만 100% 같은 것은 아니기 때문에 특정 개인에게는 부작용이 나타나는 경우가 있다. 2010년 감기 증상을 보이던 40대 A씨는 약국에서 감기약을 구입해 복용한 후 피부에 반점과 가려움증이 생겼고 점차 악화돼 양쪽 눈을 실명했다. 의약품의 대표적인 부작용인 ‘스티븐스 존스 증후군’이다. 이런 부작용은 개인마다 다른 0.1%에 주의를 기울여야 할 필요성을 제기하며 이런 필요를 충족시키는 것이 바로 맞춤의학이다.

윤 교수는 개인 간의 차이에 대해 “30억 개인 문자열의 0.1%는 300만 개”라며 “매우 큰 차이기 때문에 신경 써야 한다”고 답했다. 개인 맞춤 치료는 공통적인 99.9%에 초점을 맞춰 발생하는 불필요한 고통과 시간을 줄이고 병을 예측해 예방하는 데 이용될 수 있다. 환자의 DNA와 RNA, 단백질을 생물정보학적 방법으로 분석하면 환자의 특이점을 파악할 수 있다. 이를 이용하면 환자 개개인에 맞춘 치료법을 제시하는 것이 가능하다. 또 유전자 정보를 바탕으로 하기 때문에 앞으로 생길 수 있는 질병을 예측하고 예방할 수 있다.

미국 시스템생물학연구소 소장 르로이 후드는 이렇게 변화하는 의학을 ‘P4 의학’이라 명명했다. P4 의학은 개인화된(personalized) 맞춤 유전 정보로 질병을 치료하기 전에 예측하고(predictive) 예방하는(preventive) 의학을 말한다. 이 과정에서 환자는 자신의 건강 정보를 제공 받고 스스로의 건강에 능동적으로 참여하게(participatory) 된다. 생물정보학이 인간의 생활에 큰 변화를 이끌고 있는 것이다.

생물정보학과 경제의 만남

한편 생물정보학의 기법은 생물학뿐만 아니라 다른 영역의 데이터를 성공적으로 분석해 주목받기도 했다. 윤 교수는 생물정보학의 기법을 경제 데이터에 적용해 국가 간 경제적 영향력을 분석했다. 기존의 경제적 영향력 연구는 ‘전이 엔트로피(transfer entropy)’와 같은 물리학적 기법만을 이용해 복합적인 국가의 경제적 영향력을 파악하는 데 한계가 있었다. 전이 엔트로피는 시간에 따라 변하는 두 개의 데이터 간 상호작용의 방향과 정도를 수치로 나타내는 물리학적 기법을 말한다. 윤 교수는 DNA, RNA, 단백질 사이의 다층적인 상호작용이 일어난다는 점이 다양한 경제지표 사이의 상호작용과 유사하다는 점에 착안해 미국, 일본, 중국, 한국을 비롯한 주요 18개국의 5가지 경제지표(산업생산지수, 주가지수, 소비자물가지수, 환율, 무역지수)간의 상호연관성을 분석했다. 분석결과 서방국가의 영향력이 아시아 국가보다 크며 일본의 영향력이 1990년대 아시아 외환위기 이후 급감한 것으로 확인됐다. 또 우리나라는 1997년 외환위기 시기에 외국의 영향을 크게 받았지만 경제위기를 극복하면서 국제적인 영향력이 점차 확대됐다는 사실도 연구팀의 분석결과로 재확인됐다. 경제학 데이터에 생물정보학적 기법을 적용하여 국가 간 경제적 영향력을 분석해낸 것이다. 윤 교수는 이 공로로 미국전기전자학회와 대한전자공학회가 공동 주관하는 ‘IT젊은공학자상’을 수상했다.

윤성로 교수는 자신이 하는 일을 “계속해서 변하는 30억 개의 퍼즐을 맞추는 일”이라 표현했다. 양손에 알고리즘과 병렬화를 들고 30억 개의 퍼즐을 맞추고 있는 윤 교수가 인간에 대한 이해를 한 단계 발전시키기를 기대해 본다. 

저작권자 © 대학신문 무단전재 및 재배포 금지