하플로그룹

 

Haplogroup
1. 개요
2. 하플로 그룹 분리에 사용되는 DNA
3. 하플로 그룹의 등장: 인류의 기원 찾기
3.1. 인류의 조상 찾기
3.2. 인류의 진출 경로 및 숫자 추적
3.3. Y염색체 하플로그룹의 특징
3.4. mt-DNA 하플로그룹의 특징
3.5. 하플로그룹의 명명
3.6. 하플로그룹의 활용
4. 하플로그룹에 대한 오해들
4.1. 하플로그룹으로 인종을 구분한다?
4.2. 인류를 우생학적으로 분류한다?
4.3. 연구자들이 하플로만을 맹목적으로 믿는다?


1. 개요


분자생물학 지식을 기반으로 측정된 DNA의 변형 정도에 따라 구분된 유전자 집단을 의미한다. 인간의 혈통을 거슬러 올라가면 DNA의 변형 정도, 즉 돌연변이에 따라 같은 조상을 지닌 집단 별로 분리가 가능하고 이를 트리 형태로 나타낼 수 있다. 이러한 방법은 과거 빅토리아 여왕혈우병 유전자를 추적할 때도 쓰인 것이지만 현재 유전학에서 쓰이는 하플로그룹은 족보 추적을 쉽게 하기 위해 부계 지표인 Y염색체와 모계 지표인 mt-DNA를 주로 쓴다는 점에서 과거의 연구와 차이를 보여준다.

2. 하플로 그룹 분리에 사용되는 DNA


Y염색체와 mt-DNA의 DNA 염기서열 중 복제 오류로 생겨난 염기서열 다양성을 알아내어 혈통을 추적한다.[1] 망가졌을 때 돌연변이가 발생하여 자연선택 압력을 받는 지역이면 돌연변이가 축적될 수 없으므로, 돌연변이가 축적될 수 있는 유전자 사이 지역(intergenic region)이나 인트론(intron) 지역의 염기 서열 차이, 혹은 염기서열이 바뀌어도 아미노산 서열이 바뀌지 않는 silent mutation의 발생 양상을 찾는 것이다. 이런 중립적인 돌연변이는 시간에 따라 누적될 것으로 예상할 수 있다. 인류가 이동, 교류, 확산에 따라 거주지를 바꾸게 될 때, 원 거주지 집단의 일부만 그 이동에 참여하게 되므로 떨어져 나간 집단이 원래의 집단보다 중립 돌연변이의 다양성이 적게 된다. 따라서 돌연변이 다양성을 거슬러 올라가는 방향으로 추적해서 인류의 이동, 교류, 확산 양상을 복원해 낼 수 있는 것이다.
  • Y염색체: 유전 방식상 아버지에게서 아들로만 전달될 수 있어 부계 혈통을 파악하는 데 사용된다. 상염색체나 여성의 X염색체는 감수분열 과정에서 유전자 교환이 일어나지만 Y염색체는 감수분열 시 X염색체와 결합하는 pseudoautosomal region을 제외하곤 유전자 교환이 일어날 수 없기 때문에 더욱 적합하다.
  • 미토콘드리아 DNA (mt-DNA): 미토콘드리아 DNA는 기본적으로 생명체가 진화 과정에서 흡수한 세포내 기관[2]의 DNA이다.[3] 유전 방식 상 어머니의 mt-DNA만 자식에게 물려줄 수 있으므로 결국 모계 혈통을 파악하는 데 사용할 수 있다. 더 나아가 세포 하나당 미토콘드리아가 1000개 이상 존재하므로 적은 샘플에서도 DNA 정보를 증폭해서 찾아내기 쉬운 장점이 있다.
일반적으로 일부다처제 양상과 전쟁 등을 이유로 부계의 단절 가능성이 높고 반면 족외혼 때문에 서로 다른 두 집단 간 모계 유전정보의 차이가 적어질 수 있기 때문에 Y 염색체의 하플로 패턴의 대립 양상이 mt-DNA 하플로 패턴보다 역사적인 사건을 설명하는 데 주로 사용된다.
연구의 편의를 위해서 일부러 수정 시에 섞이지 않은 유전자를 선택했으며, Y염색체와 mt-DNA를 제외한 다른 염색체들은 감수분열시에 교차를 함으로써 염색체가 서로 섞이는 과정을 겪으므로 짧게는 수대, 길게는 수백 대를 거슬러 올라가는 유전자를 이용한 족보추적에는 난점을 보여주기 때문에, 앞으로도 계속 사용될 예정이다. 심플하게 1/2을 각 대마다 거듭제곱을 하면 어떻게 될지 생각해보자. 10대만 거슬러 올라가도 10대조의 유전자는 이론상으로는 1/1024밖에 남아있지 않게 된다(...) 여기에 교차까지 생각하면 더더욱 카오스가 된다(...)[4]

3. 하플로 그룹의 등장: 인류의 기원 찾기



3.1. 인류의 조상 찾기


유전자를 통한 인류의 족보 추적은 생각보다 빨리 시작되었다. 일반인에게 널리 알려진 것이라면 미토콘드리아 이브(또는 '아프리카 이브')설. 이 설은 말 그대로 모계를 통해 인류의 족보를 추적한 것으로 mt-DNA를 이용했다. 그리고 나온 결론은 현생 인류는 20만여 년 전 아프리카의 한 여성의 후손이라는 점[5]. 당연히 이러한 방법은 Y염색체에도 쓰이며 Y염색체로 추적한 인류 공통의 조상은 아프리카 아담이다. 물론 네안데르탈인과 현생인류와의 관계문제로 여전히 다른 방법과 반론이 나오고 있지만 여기서 중요한 것은 아니니 자세한 점은 해당 항목 참조.

3.2. 인류의 진출 경로 및 숫자 추적


6~700만 년 전에 침팬지에서 갈라져 나온 인류는, 독자적 진화 시간을 고려하면 현재 2~3종의 아종을 가질 가능성이 매우 크다. 하지만 여러 민족의 유전적 차이[6]에도 불구하고, 현존하는 어떤 인류 집단에서 남녀를 뽑아 자손을 만들더라도 생식 능력에 문제가 없는 자손을 볼 수 있다. 이는 사실 현재 인류의 조상이 '크기 병목'[7]을 거쳤다는 것을 의미하는데 실제로 인류는 겉보기로 확인할 수 있는 여러 차이에도 불구하고 유전적 다양성이 굉장히 떨어지는 편으로 친척인 침팬지는 물론이고 멸종위기종인 고릴라보다도 유전적 다양성이 떨어진다.
유전자 분석을 통해 하플로 그룹을 정의하고, 인류의 공통된 조상을 추적할 수는 있었지만 하플로 그룹의 쓰임새는 그것으로 그치는 것이 아니다. 인류가 대를 이어서 퍼져나가고 그 과정에서 병목현상이나 창시자 효과 등으로 인간의 유전자는 상대적으로 극심한 변화를 보여주기도 하고, 역사시대에 접어들면 정복자와 피지배자 간 계층의 차이로 주된 혈통의 변화가 나타나기도 한다. 즉 각 민족의 혈통까지도 추적할 수 있다는 것이다. 실제로 현재 하플로그룹, 특히 부계유전인 Y염색체 하플로그룹은 비단 개인의 족보추적이 아닌 민족집단의 족보추적에 널리 활용되고 있다.

3.3. Y염색체 하플로그룹의 특징


Y염색체 하플로그룹은 위에서 설명한 대로 부계유전의 특징을 지니고 있다. 그 때문에 mt-DNA보다 상대적으로 역사시대에 걸맞는 특징을 보여준다. 물론 mt-DNA로 역사시대의 인류의 족보를 추적하지 않는 것이 아니다. 오히려 그것이 더 먼저 이루어졌다. 하지만 인류 역사에서 여자보다는 남자의 이주가 절대적이며, 어느 종족이 고위층이었는가도 동서고금 남계문화이기에 남성유전자가 두드러진다. 여기에 집단의 mt-dna는 y-dna 비교하면 상대적으로 오래 남기가 힘들기 때문에 선사시대에 쓰고 싶어도 제한적으로 쓰일 수밖에 없다.
그러한 결과 Y염색체 하플로그룹은 처음부터 미토콘드리아 이브로 유명한 mt-DNA에 비해서 인류의 이동 과정을 종족 단위 중심으로 추적하는데에 널리 사용되고 있다. 특히 역사시대의 어족이나 민족 단위의 이주에 그 흔적을 강하게 보일 때가 많기 때문에 각 집단의 이동의 파악에 매우 용이하다. 그러한 결과 역사시대의 민족 이동을 보는 데 쓰는 하플로그룹은 대부분 Y염색체 하플로그룹이다. mt-DNA는 따로 붙여서 표기할 때가 많지만, Y염색체는 그냥 하플로그룹이라고 칭하는 경우가 많을 정도.

3.4. mt-DNA 하플로그룹의 특징


위에서 적은 것처럼, mt-DNA 하플로그룹은 난자에서 오기 때문에 모계유전의 특징이 있다. 그리고 Y염색체 하플로그룹보다 일반적으로 유해에서 더 오래 남아 있기 때문에 고인골에서 검출이 쉬운 장점이 있다. 이는 상염색체와 성염색체(X,Y) DNA는 핵 내에만 존재하는 데 비해, 미토콘드리아는 세포 내에 대체로 복수로 - 세포에 따라서는 수백 개 이상 - 존재하기 때문에 절대량이 많기 때문이다. 따라서 Y염색체 하플로그룹은 주로 살아 있는 사람들에서 나온 자료가 절대다수인 데 비해, mt-DNA는 고인골에서도 높은 빈도로 검출된다.[8]
그리고 Y염색체보다 오래간다는 것도 mt-DNA를 활용하는 이유 중 하나가 된다. 선사시대의 인구이동이 역사시대보다 적었을 경우나, 이주민 집단이 여성까지 같이 움직인 것으로 보인 경우에는 mt-DNA를 통해 Y염색체를 추정할 수 있다. 정확하다고는 할 수 없지만 현대와 비교해 상대적으로 덜 섞였을 가능성이 높은 역사시대 초기, 혹은 선사시대에는 부족하지만 쓰일 수밖에 없는 방법이다.
다만, mt-DNA는 모계이다보니 y-dna와 부합되지 않거나 역사적 진행과 모순되는 등 정확한 민족 추적시 일치해야할 조건사항이 너무 까다롭기에 조건부 순위엔 절대적으로 Y-DNA 의 뒷 순위로 위치된다.

3.5. 하플로그룹의 명명


하플로그룹의 분류는 트리의 형태를 지닌다. 가장 기본이 되는 하플로들을 대문자 A, B, C 등으로 분류하고 그 하플로에서 나뉘는 서브클래스를 숫자, 소문자의 연속적인 배열로 붙인다. 지중해 원주민 하플로인 E1b1b를 예로 들어서 보면 이해하기 편할 것이다. 가장 큰 분류인 E, 그리고 그 밑의 트리를 1, b, 1, b의 순서로 나뉘는 것이다. 이 말은 즉 E2도 있고, E1a도 있다는 말이다. 한국인의 특징을 보여주는 하플로인 O2b도 마찬가지로 O-2-b의 순서. O2b의 상위는 O2이고 O2의 상위는 O가 된다. 서브클래스는 상세한 분류에서는 필요하지만 너무 번잡하므로 적절히 대표되는 상위클래스로 말한다.
또한 각 하플로마다 이명을 가지고 있다. O2b의 경우는 M176으로도 불리는 식. 위의 명명법으로 하면 하플로에 따라 이름이 지나치게 길어져 번잡해질 때가 있기 때문에 이렇게 따로 이명으로 부르기도 한다. 그 외에도 하플로그룹의 연구가 현재진행형이기 때문에 위의 트리가 바뀌기도 하고 그러면 차라리 M176 같은 이명으로 부르는 것이 더 나을 수도 있다.

3.6. 하플로그룹의 활용


이렇게 정의된 하플로는 통계분석의 형태로 연구된다. 현대의 특정 지역, 특정 민족의 하플로타입을 확인하고, 고대 인골의 하플로타입을 확인하고 이것을 가계도나 문화, 언어 등과 결부시켜 인류가 어이 이동했는가 확인하는 것이다. 여기서 중요한 것이 비율이다. 각 하플로의 대단위는 대부분 늦어도 1만 년 이전에 분화된 것이기 때문에[9] 역사시대의 인류 중 특정 하플로만으로 도배한 경우는 특수한 경우를 제외하고는 드물다.
그리고 지역에 따라서는 대단위로는 동질체라도 서브클래스를 나누면 완전히 다른 집단의 합일 경우도 많다. 예를 들어 서유럽의 하플로그룹은 대부분 R1b지만, 이 중에서 켈트계열도 있고, 게르만 계열도 있으며 각 서브클래스의 분포에 따라서 그것을 확인할 수 있다. 따라서 지역에 따라 서브클래스를 상세히 나눠서 조사하는 것은 곡 필요하다. 하지만 그것이 귀찮(...)기 때문에 보통은 높은 단위로 말할 뿐이다.
또한 하플로그룹의 연구는 기본적으로 통계분석을 통해 비율을 확인하는 것이기 때문에 특정 민족을 나타내는 하플로는 특정 민족에 절대다수인 하플로와 동의어가 아니다. 주변 지역이나 주변 민족에 비해 유달리 많이 나타나는 하플로를 뜻하는 것이다. 예를 들어 한국인의 Y염색체 하플로 중 가장 많은 비율을 차지하는 것 중에 충청도 지역의 30-40프로가 O3 계열로 나타난다는 결과도 있지만 이는 구석기 시대부터 동남아에서 동북아로 북상하면서 폭넓게 분포했던 하플로이다. O2b의 경우 한국인을 나타내는 하플로라는 주장도 있지만 이것 또한 O 하플로에서 분화된 한 종류의 하플로이며 일본인, 조선족, 만주족도 가지고 있는 하플로그룹이다. 중국의 경우에는 한족은 O-M122가 대부분을 차지하며, 티베트족은 D-M174, 위구르족은 P-P295가 주류를 차지하는 등 서로 천차만별이라 민족별로 따로 분류한다.
O2b와 O3에도 수많은 하위 하플로가 있으며 종류도 다르다. 중요한 건 O2b나 O3의 경우는 아프리카 북부에서 부터 이동하기 시작한 인류가 동남아에 정착하면서 농경을 시작하면서 생긴 Y 하플로이며 이것이 인류가 아직 동아시아에 없었을 당시에 이동하면서 북상을 하였다.

3.7. 하플로그룹의 집단



4. 하플로그룹에 대한 오해들



4.1. 하플로그룹으로 인종을 구분한다?


절대 불가능하다. 애초에 하플로그룹은 인종 구분의 목적이 아닌 고인류의 대륙이동 경로를 알아내기 위해서 쓰이는 방법이다.

4.2. 인류를 우생학적으로 분류한다?


어떤 현존 생물이건 서식 환경에 맞게 적응했다는 공통점이 있으며, 모두 공통 조상에서 같은 시간만큼 진화해 왔다. 따라서 현존 생물 사이에는 우열이 없다.[10] '고등' 또는 '하등' 생물이란 개념은 현재는 전혀 통용되지 않는다. 심지어 박테리아와 사람 사이에도 우열이 없는데 인류 내에서? 오히려 이것은 이 분야를 연구하는 학자들부터 더 잘 인식하고 있다.
더군다나 mt-DNA 항목에서 설명했듯이, 변화 파악에 요긴하게 쓰이는 영역은 변화가 있어도 기능에 거의 지장이 없는 부분이기 때문에 이런 차이가 '우생학적 우열'과는 무관하다는 점도 염두에 두어야 한다. 염색체유전 얘기만 나오면 조건반사적으로 우생학을 떠올리는 낡아빠진 생각은 이제 그만 접어둘 때가 됐다.
사실 오히려 흔하게 널린 하플로는 주변 지역에도 많으므로 우생학보다는 평등에 기여할 수도 있다.[11]

4.3. 연구자들이 하플로만을 맹목적으로 믿는다?


당연히 오해다. 과학기술의 힘으로 연구를 하는 것이긴 하지만 근본적으로 다른 고고학과 다를 것이 없다. 단 학문영역이 좀 다를 뿐이다. 하플로그룹은 형질인류학적인 방법으로 연구를 하는 것이고 나온 연구결과 자체는 심하게 말하면 통계 데이터에 그칠 뿐이다. 이렇게 나온 데이터를 역사적인 사건, 고고학적인 발굴 등과 연관시켜서 연구하는 것이다. 단지 연구방법에서 과학기술이 훨씬 더 많이 들어가는 것이 다를 뿐인데 왜 적대감을 가져야 할까?
과학자들은 매드 사이언티스트로 대표되는 것도 아니고, 이러한 연구가 과학자들만이 하는 것도 아니다. 하플로그룹 검출기술만 알면 고고학자들이 하는 데에 전혀 문제가 없다. 오히려 그러한 의심을 가지는 것이 문제다. 왜 다른 고고학적인 연구결과는 충분히 검토할 만한 근거로 쓰면서 단지 과학기술이 많이 들어갔다고 의심을 해야하는 것인가? 또한 고고학적인 연구에 이미 과학기술이 깊이 관여되어 있는 상황에서[12] 유전자를 통한 추적을 한단 이유로 편견을 가지는 것이 더 문제가 아닌가?

[1] DNA 복제의 오류 발생률은 초기 단계에서 십만분의 1이다. 교정장치를 거치면 오류 발생률은 100억분의 1로 줄어든다.[2] 엽록체나 미토콘드리아 같이 자체 DNA가 있는 세포 소기관은 원래 독립 생물이었다. 이것이 (아마도) 감염이나 포식 등으로 다른 세포에 들어갔다가 현재처럼 공생으로 진화한 것이다. 생물학자 린 마굴리스('코스모스'로 유명한 칼 세이건의 첫 아내였다)가 처음 주장했고 지금은 정설이다.[3] 단 현존하는 미토콘드리아 DNA는 원래 독립 생물일 때보다 훨씬 줄어들었다. 이는 대부분이 세포핵으로 자리를 옮겼기 때문이다.[4] 실제로는 그 정도로 완전히 랜덤하게 섞이지도 않고, 유전자가 그렇게 막 섞인 생식세포가 치명적인 돌연변이를 품고 수정, 출산을 거쳐 다시 자손을 볼 때까지 살기도 힘들지만.[5] 물론 이 여성에게 "궁극의 큰어머니(...)" 같은 거창한 타이틀을 붙일 필욘 없고, "실험의 모집단에서 추적 가능한 마지막 공통분모" 정도로 이해하는 것이 좋다. 미토콘드리아 이브 항목에서도 잘 나와 있지만, 단지 모계의 조상이라는 것뿐이다. 상염색체나 Y염색체 쪽은 아무런 상관이 없다.[6] 흑인은 비타민 D의 합성이 매우 부족하고, 백인은 피부암 발병 확률이 높다. 피그미족은 숲속의 생활에 적응하여 키가 작아졌고, 티벳 원주민은 고지 적응 특성이 여러모로 확연한 등 실례는 매우 많다.[7] 교배 때 문제가 생기지 않을 정도로 최소한의 유전적 동질성을 가져야만 종으로서 호모 사피엔스(homo sapiens)가 성립한다. 7만 년 전 추정 인구는 약 15,000명으로 멸종위기종이었다. 이것은 번식 않는 노인이나 어린이 등의 인구를 제외했기 때문에 '실제 인구'는 이 두 배 이상은 됐을 것이나 타 동물에 비해 소수였음에는 매한가지이다.[8] 고인골에서 DNA를 얻으려면 우선 묻혀 있던 지역의 온도가 낮아야 하며(그래야 DNA 파괴 속도가 느려진다) 토양이 산성이면 뼈가 아예 녹아 없어지기 때문에 곤란하다. 스반테 파보 팀이 최초로 박물관의 네안데르탈 인의 유해에서 DNA를 찾아냈을 때도 위 두 조건을 만족했기 때문에 가능했다고 한다. 우리나라는 대부분이 산성 토양이라서 이 점에서는 상당히 불리하다고 알려져 있다.[9] 물론 몇가지 예외가 있다. 게르만족의 I1a1은 3000년 전에, 한국인의 O2b는 6000년 전에 나타나서 각각 30%에 가까운 비율을 차지하고 있다. 하지만 이는 특수한 사례다.[10] 사람을 심해어가 서식하는 환경에 갖다 놓았다가는 당장 수압 때문에 짜부가 될 것이다. 지구상에서도 모든 환경 킹왕짱 생물 따위는 있을 수가 없다.[11] 사실 지배층들의 혈통 연구 등을 보면 알겠지만 우월한(시대에 따라 달라질 수는 있다.) 특성을 지닌 그룹은 일반적으로 숫자가 많지 않을 수도 있다. 까놓고 학자적 특성을 가진 그룹, 과학기술이 발달하기 전 짱 먹었던 전사적 특성을 가진 그룹은 숫자가 생각보다 많지 않다. 대부분은 농부와 같은 노동자 그룹인 경우가 많다. 현실 역시 우월한 사람들이 많지 않다는 것을 증명하는데, 일반적으로 역피라미드가 아니라 피라미드를 이루기 때문이다. [12] 방사성 동위원소를 이용한 연대 측정은 물론이고, 유물에 남은 생체 분자들의 흔적을 추적하는 방법은 요즘엔 오히려 유물 자체(토기 등)를 관찰하는 것보다 더 시간을 투자하기도 한다.

분류