유전체학

 

Genomics
1. 개요
2. 상세
3. 목표
4. 연구방향
5. 한계
6. 유전체 전문회사
7. 외부링크


1. 개요


유전체(게놈)를 연구하는 학문. 생물학, 의학, 산업 등에서 제기된 문제의 해결을 위하여 특정 생물체의 개별 유전자들의 총합인 유전체 및 관련 정보를 체계적으로 연구하는 학문이다.

2. 상세


유전체란 동물의 핵 속에 들어있는 유전자 전체를 말하며[1], 게놈(genome)이라고도 하며 유전정보 전체를 말한다.
유전체학은 유전체, 생명체내의 모든 유전자들의 구조 및 기능을 밝히는 연구를 말한다. 주로 유전자 지도작성, 돌연변이동물(형질전환동물, 유전자제거동물, 화학적돌연변이동물, 자연돌연변이동물)의 생산 및 분석, 질병유전자 및 특수형질과 관련한 원인 유전자구명, 분자표지인자(DNA marker)개발연구 등을 포함한다.
게놈이란 한 개체가 지닌 유전자 세트를 말하며 이는 생명 현상의 유지 및 모든 형질의 발현에 필요한 하나의 단위이다. 인간의 게놈은 22쌍의 상염색체(像染色體)와 1쌍의 성염색체, 즉 23쌍의 서로 다른 염색체로 이루어진다. 인간세포 속의 세포핵에는 2중 나선형으로 꼬여 있는 23쌍, 46개의 염색체에 모든 유전정보가 담겨 있다. 유전정보를 담고 있는 물질은 DNA이고, DNA는 A(아데닌) ·G(구아닌) ·C(시토신) ·T(티민) 등 4가지 염기의 다양한 조합으로 이루어져 있다. 이 염기들은 게놈상에서 수백만, 수억 만 번이나 반복되어 있는데, 이들 염기의 결합 순서를 파악하게 되면 각 생물들이 가지고 있는 고유한 염기배열을 알 수 있다.

3. 목표


① 인간 유전자 2만개의 유전자 동정을 파악한다.
② 인간의 DNA를 이루고 있는 30억 개의 화학적 염기배열을 결정한다.
③ 데이터 베이스 정보를 기록한다.
④ 데이터 분석의 기술상의 문제를 개발·보완한다.
⑤ 프로젝트에 관한 도덕적·법률적·사회적인 쟁점에 대한 설명을 하는 것이다.
이 계획이 성공할 경우 새로운 유전자 검사방법 및 질병 치료법, 예방약제, 유전적 치료법의 개발이 가능해진다.

4. 연구방향


  • 기능 유전체학
유전자와 유전자 산물의 기능에 관한 연구를 하는 학문 분야이다. 유전자의 기능을 알아내는 방법으로는 생물학적 접근법과 생화학적 접근법이 있다. 생물학적 접근법은 실험실에서 사용되는 모델 동물로부터 특정 유전자를 제거하여 생리작용이 변화하는 상태를 관찰하는 방법이다. 이 방법은 어떤 유전자가 질병의 원인인지를 알아낼 때 주로 사용한다. 생화학적인 접근법은 이미 알고 있는 유전정보로부터 어떤 단백질이 만들어지는지를 추적하고 그 구조와 기능을 밝혀내는 방법이다.
  • 비교 유전체학
표준 염기서열 결과를 바탕으로 인종, 질병 발병, 의약품 등에 대한 개개인의 차이를 규명하는 학문 분야이다. 유전병과 관련되는 유전자를 찾는 방법은 두 가지로 기능적 클로닝(functional cloning)과 위치적 클로닝(positional cloning)이 있다. 기능적 클로닝은 질병 유전자의 기능을 예측하고 유전자를 발굴하는 방법이고, 위치적 클로닝은 질병 유전자에 관한 정보 없이 전 염색체에 존재한다.
개개인 모두의 유전체를 해석하여 연구, 비교하는 유전체학의 분야. 영어로는 Personal genomics라고 한다.
생물학, 의학, 산업 등에서 제기된 문제의 해결을 위하여 특정 생물체의 개별 유전자들의 총합인 유전체 및 관련 정보를 체계적으로 연구하는 학문생물학, 의학, 산업 등에서 제기된 문제의 해결을 위하여 특정 생물체의 개별 유전자들의 총합인 유전체 및 관련 정보를 체계적으로 연구하는 학문
멘델 유전학은 개개인의 구별이 가능한 다양성을 가진 지표를 이용하여 관련 유전자의 대략적인 위치를 찾아내고, 그 부위에 존재하는 여러 유전자를 각각 분리한 후 돌연변이의 여부를 분석·조사하여 질병 유전자를 찾는다. 현재까지 발굴한 유전병 유전자는 대부분 위치적 클로닝 방법을 이용하였기 때문에 유전자가 발굴되더라도 그 기능에 관한 정보가 없다는 단점이 있었다. 위치적 클로닝에 사용한 표지를 유전적인 표지라고 하고, 이들의 위치를 보여주는 지도를 유전적인 지도라고 하는데, 현재 가장 최근에 발표된 지도는 미세위성 지표이다. 그러나 미세위성 지표는 그 빈도 및 안정성에 대한 정보가 부족하다.
따라서 최근에는 유전자칩 기술이 개발되어 이를 이용한 돌연변이의 유전형을 분석하고 그 다형성을 발굴하는데, 인간 게놈에서 가장 많이 발견되는 다형성은 단일염기 변이이다. 유전적인 요소는 모든 인간의 질병과도 연관되며 질병에 대한 저항성, 민감성 및 질병의 정도가 다르다. 그러므로 DNA 서열을 통하여 밝혀진 염기의 차이를 통하여 질병의 진단, 처방 및 예방이 가능할 것으로 추정되고 있다.
  • 후기 유전체학
인간게놈프로젝트를 통하여 DNA 염기서열이 밝혀지면 이를 토대로 하여 게놈의 기능과 개개인의 염기서열을 타인의 것과 비교하고, 연구하는 후기 게놈 연구 분야이다. 인간게놈프로젝트는 단순하게 염기서열이라는 인체 설계도가 그려진 암호문을 확보하는 것이다.
따라서 지도화된 게놈의 기능을 밝히고, 개체간의 특성을 비교·분석하는 작업이 필요한데, 2가지 방법을 이용하여 개개인의 차이를 밝힐 수 있다. 하나는 기능유전체학(functional genomics)으로 유전자의 발굴 및 기능을 연구하는 방법이고, 또 하나는 비교유전체학(comparative genomics)으로 인간의 표준 염기서열 결과를 바탕으로 인종, 질병의 발병, 의약품에 대한 개개인의 차이를 규명하는 것이다.
이 두 가지 방법의 공통점은 유전자 발굴과 유전자의 발현 양상을 조사하는 것이다. 유전자 발굴의 목표는 정상조직과 암조직, 성인과 발달과정에 있는 뇌의 여러 부위에서 발현하는 모든 유전자의 목록을 만드는 것이다. 그 다음으로 유전자의 발현 양상을 결정하고 발생·전이 및 다른 병리 상태에서의 유전자 발현 윤곽의 변화를 추적한다.
학자들은 이러한 연구를 통하여 약 10만 개에 달하는 인간 유전자 각각의 기능을 상세히 알 수는 없어도 화학의 주기율표와 같이 인간 유전자의 분류가 가능할 것으로 예측하고 있다. 또한 이들 분류는 질병의 예후를 예측하거나 치료방법을 선택하는 데 유익한 정보를 제공할 것으로 추정되고 있다.

5. 한계


1980년대까지만 해도 인간의 유전체를 모두 매핑하면 이를 해독해 인간의 신진대사와 유전병 등에 대한 모든 것을 알아낼 수 있을 줄 알았다. 하지만 실질적으로 인간 대사 및 유전병에 가장 큰 역할을 하는 것은 단백질체(프로테옴, proteome)라는 것이 밝혀지면서, 유전체학만으로는 인간의 모든 것을 이해할 수 없음을 알게 되었다.
설명하자면, 1) 생물의 모든 기능을 담당하는 분자기계인 효소는 주성분이 단백질이고, 2) 단백질의 구성단위는 아미노산이며, 3) 이 아미노산 사슬의 설계도가 바로 유전체이므로 3-2-1의 단계를 밟으면 유전체를 안다 = 인체의 기능을 안다의 등식이 성립할 것을 기대했던 것인데, 실제로는 1과 2 사이에 “3차원 구조화”라는 큰 장벽이 있었던 것이다.
효소(단백질 거대분자)는 아미노산이 무수히 이어진 사슬로 이루어져있는 것은 맞으나, 효소의 기능은 이 사슬에 어떤 아미노산들이 어떤 순서로 배열되어 있는지보다는 이 사슬이 어떤 3차원적 형태로 접히고 뭉쳐있느냐에 좌우된다. 즉 어떤 효소를 구성하는 아미노산들이 뭔지를 전부 알더라도, 이 아미노산의 사슬이 어떤 입체를 이루느냐를 모르면 의외로 별 소용이 없는 것이다.
물론 아미노산 사슬에 있는 여러 아미노산끼리의 약한 결합력으로 인해 사슬이 접히고 입체를 형성하므로, 특정 효소의 아미노산을 코딩하는 (즉 그 효소의 설계도인) 유전자의 염기서열을 알면 이를 기반으로 컴퓨터 시뮬레이션 등을 통해 그 아미노산 사슬이 어떤 3차원 구조를 형성할 것인지를 유추할 수 있다. 하지만 유전자 염기서열이나 아미노산 서열 정보를 입력하면 단백질체(효소)의 입체구조를 정확히 예측해주는 컴퓨터 프로그램은 아직 없으며, 수많은 시도와 오류를 통해서만 입체구조를 파악하는 것이 가능하다.
게다가 후처리(post processing)라는 과정이 있는데, 리보소옴이 유전자(정확히는 RNA)를 설계도삼아 아미노산 사슬을 만들어낸 후 그 일부를 잘라내는 등의 처리를 해야만 비로소 완성품(단백질 효소)으로서 기능하는 경우도 많다. 이런 경우 유전자 염기서열만으로는 어떤 후처리가 행해지는지 알 수가 없다. 뿐만 아니라 DNA를 전사해 전령 RNA를 만드는 과정에서 DNA의 염기서열 중 일부(인트론)를 잘라내므로, DNA 염기서열만 알아서는 효소의 구조를 유추하는 것이 어렵다.
또한 아미노산 배열이 조금 틀리더라도 효소의 전체적인 형태는 올바르게 잡히도록 하는 프리온이란 물질이 존재하여, 유전자 = 효소의 3차원 구조의 등식이 성립하지 않는 데 일익하기도 한다.
아무튼 이런 것을 연구하는 학문을 단백질체학(프로테오믹스, proteomics)이라 부르는데, 유전체학이 건축학에서 설계도(평면도)를 연구하는 학문이라면 단백질체학은 설계도로 지어진 실제 건물을 연구 대상으로 삼는 학문이라 할 수 있을 것이다.
단백질체학은 3차원 모델링을 기본으로 하므로 유전체학에 비해 강력한 컴퓨팅 파워가 요구되며, 특히 병렬처리(패러렐 프로세싱)가 유용하게 활용되는 분야이다. 나중에 양자 컴퓨터가 실용화된다면 유전체학 연구에 큰 도움이 될 것으로 기대된다.
그러나 단백질체학의 기본은 일단 유전체학임은 말할 필요도 없을 것이다. 일단 아미노산 사슬이 어떻게 구성되어있는지를 알아야 모델을 만들 수 있으니...
2020년 말, 구글인공지능 프로젝트인 딥마인드가 단백질 3차원 구조를 파악하는 것이 가능해졌다는 발표를 했다(영문 기사). 단백질 입체구조 파악에 며칠밖에 걸리지 않는다고 하는데, 사실이라면 단백질체학 분야를 반세기 가량 진보시킨 놀라운 성과다.

6. 유전체 전문회사



7. 외부링크


http://genomics.org
http://personalgenome.net


[1] 포유동물의 경우 약 2만5천에서 3만개의 유전자로 구성됨