하디-바인베르크 법칙
1. 개요
Hardy–Weinberg principle.
"'''개체군이 가지는 유전자풀 안에서 대립 유전자 빈도와 유전자형의 빈도는 세대를 거듭해도 그대로 유지된다.'''"라는 법칙이다. 유전학에서 물리학의 뉴턴의 운동법칙 수준의 지위를 가지는 법칙이다. '''"우성이 왜 열성보다 안 많아지는가?"'''[2] 라는 질문에 대한 '이론적으로는 100점짜리' 설명이다.[3]
영국의 수학자 고드프리 해럴드 하디(Godfrey Harold Hardy)와 독일의 유전학자 빌헬름 바인베르크(Wilhelm Weinberg)가 각자 독자적으로 발견한 법칙으로 영어식으로 읽어서 '하디-와인버그 법칙'이라고도 한다. 대개 줄여서 'H-W Rule'로 표기한다.
과거 우생학에 입각하여 시행된 단종법, 우생보호법, T4 작전이 왜 실패했는가에 대해서 입증 가능한 법칙이다.
2. 상세
1908년, 케임브리지 대학의 유전학 교수였던 퍼넷(Reginald Punnett)[4] 은 멘델의 유전 법칙에 대한 강의를 하던 중, 당시 저명한 통계학자였던 율(G. U. Yule)[5] 로부터 이런 질문을 받았다.
퍼넷은 경험상 이 말이 틀렸다는 걸 알았지만, 왜 그런지는 그 자리에서 설명하지 못했다.'''율''': 교수님, 단지증(短指症)은 우성형질이라고 알려져있지요. 그런데 열성과 우성 유전자를 다 가진 개체는 우성형질이 발현된다고 하면, 부모 세대보다 자식 세대에서 단지증이 늘어나는 것이 맞지요? 동일한 수의 단지증 환자와 일반인(1:1)끼리 무작위로 교배했을 때 다음 세대는 단지증 : 일반인의 비율이 3:1이 되겠지요?[6]
그렇게 다음 세대로 갈 때마다 단지증 환자가 늘면 나중에는 모든 사람의 손발가락이 다 짧아져야 하는 것 아닙니까?
'''퍼넷''': 어...
얼마 뒤 퍼넷은 친구인 수학자 고드프리 해럴드 하디와 저녁 식사를 함께 하게 되었다. 그때 이 이야기를 꺼내 봤는데 갑자기 하디가 냅킨 위에 다음과 같은 수식 몇 개를 적어주었다.
그러고 나선 "그건 이렇게 풀면 되잖냐. 중학생도 풀겠다."라고 하는 게 아닌가?(A+a)2 = A2+2Aa+a2 [7]
깜짝 놀란 퍼넷은 하디에게 당장 이것을 논문으로 발표하라고 했지만, 순수 수학자였던 하디는 자기 전공분야도 아닌 생물학의 ''''너무 쉬운 문제'''' 하나 푼 것 가지고 논문을 쓴다는 것에 거부감을 보였다. 수학으로서 위대한 발견을 하겠다고 거절했다.
실제로 고드프리 해럴드 하디는 정수론을 비롯한 순수 수학만 한 수학자로, 지금까지 순수한 수학만 한 게 자랑이라 여긴 사람이었다. 자신의 제자이자 공동연구자였던 리틀우드와 함께 Hardy-Littlewood circle method, first and second Hardy–Littlewood conjectures 등을 발표해 당대 영국 최고의 수학자로 이름을 날렸다. 남들이 다 무시했던 라마누잔 노트의 가치를 알아보고 스리니바사 라마누잔을 영국으로 초빙했던 것도 바로 이 사람.
그러나 결국 친구 등쌀에 못 이긴 하디는 '''A4 한장짜리 논문'''(...)[8] 을 작성하여 학술지에 실었다. 엄청난 압축과 요약 설명을 보여주고 있는데, 수학 분야의 논문에서 곧잘 보이는 특징 중 하나다. 하디 논문의 다른 특징이라면, 수식이 작성된 부분 빼고는 서술하는 뉘앙스가 대놓고 귀차니즘을 드러내며, 핀트를 잘못 짚은 율에 대한 적나라한 디스로 도배되어 있다. 사실 그리고리 페렐만이 밀레니엄 문제 푸앵카레 추측을 풀어낸 논문도 처음 등장했을 때는 3페이지 밖에 없었다. 오류를 피해서 간결한 압축논리만으로 결론을 도출하는 것은 엄청난 내공이 필요한 일이고 쉬운 일이 아니다.
그런데 이 'A4 한 장짜리 너무 쉬운 문제'를 정리한 논문은 훗날 '''유전학의 F=ma라고 불리게 되었다.'''
한편, 독일의 의사 빌헬름 바인베르크는 하디의 논문 발표보다 6개월 전인 1908년 1월 13일 독일의 학회에서 '''몇 년간의 자료 조사와 연구에 근거해''' 독자적으로 동일한 법칙을 발표했었지만, 그 사실은 1943년 독일인 과학자 쿠르트 슈테른(Curt Stern)[9] 이 미국의 학술지 사이언스에 기고한 기고문에서 지적할 때까지 35년 동안 묻혔었다. 바인베르크가 당시 유전학계의 주된 언어인 영어가 아니라 독일어로 논문을 냈기 때문에 묻혔다는 게 중론.
3. 전제조건
이를 만족하려면 그 집단이 멘델 집단이어야 한다.
이때 멘델 집단이란 하디-바인베르크 원리를 만족하는 표준적인 집단을 말한다. 조건은 다음과 같다.
- 무작위 교배가 이루어져야 한다.
- 집단이 매우 커야 한다.
- 돌연변이가 없다.
- 이주, 이입, 집단 간의 유전자 흐름이 없다.
- 자연선택이 작용하지 않는다.
이는 현실에 구현하는 것이 불가능한 조건이지만, 현실에서는 관찰 가능한 집단 크기의 한계에서 생기는 표본 오류가 더 크기 때문에 오차가 상쇄된다. 진화가 없다면 이 법칙에 따라 유전 정보의 비율이 유지되기 때문에 '''유전자풀의 조성 변화가 곧 진화의 증거가 된다'''[10] . 따라서 멘델 집단의 조건이 깨지는 경우가 곧 진화의 원인이라고 할 수 있다. 멘델 집단의 조건과 진화의 원인을 짝지어 보면 각각 순서대로 유전적 부동, 이주, 격리, 돌연변이, 자연선택이라고 할 수 있다.
이걸 역으로 말하면, 진화가 일어난 집단은 하디-바인베르크 법칙을 더 이상 따르지 않기 때문에, 이것은 진화 여부를 판단하는 기초적인 공식으로 이용된다.즉, 이 집단을 멘델 집단으로 가정하고 계산한 뒤 실제 결과와 비교를 했을 때 오차가 크면 진화가 많이 된 것이고, 오차가 적으면 진화가 상대적으로 덜 된 것으로 결론 내릴 수 있다.
4. 증명
4.1. 기본 증명
두 형질을 $$ W $$,$$ w $$라 하고, 그 형질의 발생 빈도를 $$ p $$, $$ q $$라 하자. 이때 형질은 W,w 두개 밖에 없으므로 $$ p+q=1 $$이다.
참고로 최초 개체에서의 형질 발생 빈도는 $$ W(0) $$,$$ w(0) $$와 같이 나타낼 수 있고 이때
$$ W(0)=p $$,
$$ w(0)=q $$ 가 된다.
하디-바인베르크 법칙을 수학적으로 나타내면 $$ W(0) = W(1) = ... = W(n) = p $$,$$ w(0) = w(1) = ... = w(n) = q $$ 이므로 이것을 증명하면 된다.
1) n = 1 일때
이제 이것을 한번 교배해보면
한 번 교배해보면 이렇게 나온다.
W의 유전자 빈도$$ W(1) $$= WW인 경우 + Ww인 경우 = $$p^2+1/2*(2pq)$$ = $$ p^2+pq $$= $$ p(p+q) $$ = $$ p $$
w의 유전자 빈도$$ w(1) $$= ww인 경우 + Ww인 경우 = $$ q^2+ 1/2*(2pq)$$ = $$q^2+pq $$ = $$ q(p+q) $$ = $$ q $$
즉, $$ W(0) = W(1) = p $$이며, $$ w(0) = w(1) = q $$이다.
따라서 $$ n = 1 $$일 때를 만족한다.
2) n = k 일때이제 $$ n = k $$가 만족한다고 가정하자, 이때 W,w의 유전자 빈도는 $$ W(k) = p $$,$$ w(k) = q $$
이제$$ k $$번 교배한 상태에서 한번 더 교배를 해보면
W의 유전자 빈도$$ W(k+1) $$= WW인 경우 + Ww인 경우 = $$p^2+1/2(2pq)$$ = $$ p^2+pq $$= $$ p(p+q) $$ = $$ p $$
w의 유전자 빈도$$ w(k+1) $$= ww인 경우 + Ww인 경우 = $$ q^2+ 1/2(2pq)$$ = $$q^2+pq $$ = $$ q(p+q) $$ = $$ q $$
따라서 $$ n = k+1 $$를 만족한다.
그렇기에 이 가설은 참이다.
사실 언뜻 보기엔 증명이 어려워 보이지만 차근차근 보면 [math( (A+a)^2 = A^2+2Aa+a^2 )]과 수학적 귀납법을 생물학에 적용시킨 것과 같다. 중학생도 할 수 있을 거라 믿는 것은 바로 이것 때문이다. 사실 위의 내용을 이해하기 위한 기본 컨셉인 곱셈 공식은 이미 중학생 수준에서 다 배운다. 그렇다고 중학생이 저걸 유도해낼 수 있는 건 아니지만 이해하는 데는 이론상 문제가 없으며, 잘 풀어서 설명해주면 선행학습하는 고1들이 문제없이 이해하는 걸 보면 중학생도 똘똘한 애들은 이해할 수 있을 것이다.
추가로 이것은 형질 X를 결정하는 유전자가 2개뿐(우성 1개, 열성 1개)이라는 가정 하에서 증명한 것이지만, 사실은 형질 X를 결정하는 유전자가 몇 개이든 상관 없이 이 법칙은 성립한다. 결국 상동염색체 상에서 발생하는 현상이니 n차 정사각행렬로 풀 수 있다.
4.2. 수학적 귀납법이 아닌 관점에서의 이해 및 증명[11]
유전자 : A와 a는 서로 대립 유전자 관계에 있다고 가정하자. (A는 우성, a는 열성)
집단 : 특정 집단 S는 외부와 차단되어 있으며 진화가 일어나지 않는다고 가정한다.
특정 집단 S의 N세대에서, A유전자와 a유전자가 (A유전자 : a유전자 = p : 1-p)의 비율로 존재하는 것으로 관찰되었다고 가정하고 N세대가 N+1세대의 자손을 남기는 경우를 계산하여 본다. - 집단S의 개체들은 매우 많이 자손을 남긴다고 가정하자.
N+1세대의 유전자형은 AA, Aa, aa가 있다. (전체를 1로 두고 계산한 결과값.)
1. AA 유전자형은 A유전자와 A유전자가 만나야 하므로 p * p = p^2
2. Aa 유전자형은 A유전자와 a유전자가 만나야 하므로 2 * p * (1-p) = 2p - 2 * p^2
3. aa 유전자 형은 a유전자와 a유전자가 만나야 하므로 1-p * 1-p = 1 - 2p + p^2
N+1세대에 있는 A유전자 수는 p^2 *2(AA) + 2p -2 * p^2 (Aa) = 2p , a유전자 수는 2p -2 * p^2 (Aa) + 2 * ( 1 - 2p + p^2 )(aa) = 2 - 2p이다.
N+1세대의 A유전자와 a유전자는 (A유전자 : a유전자 = 2p : 2-2p = p : 1-p)의 비율로 존재하며 , 이는 N세대의 유전자 비율이 N+1에서도 동일하게 유지된다는 것을 의미한다.
즉, 특정 집단 S에서 관찰된 유전자 비율(A유전자 : a유전자 = p : 1-p)은 세대를 거듭하여도 일정하게 유지됨을 의미한다.
하디의 계산법의 뛰어난 점은, [개체의 표현형 - 우성A, 열성a] 의 관점에서 계산하지 않고, [유전자 비율 A : a = p : 1-p]의 관점에서 계산하였다는 점이다. 다만, 유전자의 비율이 깨지지 않아야 하므로 폐쇄적인 집단 + 수없이 많은 자손 생성이 전제되어야 한다는 한계가 있다.
5. 초간단 요약
'''부모의 형질이 우성이라고 해서 자손에게 우성 유전자만 전달되지 않는다는 것'''이다. 잡종(Aa)인 부모한테 우성 형질이 발현되어도 열성 유전자는 그대로 남아 있고, 따라서 '''전체 유전자 비율은 변하지 않는다.''' 멘델의 유전법칙을 배우면 간단하게 알 수 있는 사실로, 우성 유전자 A와 열성 유전자 a를 둘 다 받은 자손 Aa에게서는 우성 형질 A가 발현되지만, 다음 세대에게 A를 물려줄 수도 있고, a를 물려줄 수도 있는 것이다. 즉, 유전자가 사라진 것이 아니므로 다음 세대에서도 유전자의 비율은 변하지 않고[12] , 결국 '''각 형질의 발현 비율도 역시 변하지 않는다'''라는 결론이 나온다.
우성은 발현에서만 우성인 것이지 유전에서는 우성이나 열성이나 동등하기 때문인 것이다
사실 퍼넷이 하디급이 아니라 그냥 지나가던 수학 교수 붙잡고 물어봐도 풀었을 거라는 썰도 있다.
다만 어디까지나 집단을 대상으로 한 통계적인 이야기다. 갑돌이네 첫째가 어떨지, 길동이네 4남매가 왜 모두 열성/우성인 것 같은지를 설명하는 데는 별로 도움이 안 된다. 자식을 100명쯤 가진다면 모를까.
6. 기타
고등학교 교육과정 내에서는 생명 과학Ⅱ에서 이 법칙에 대해 처음 배우게 된다. '''그리고 고등학교 생명과학2에선 거의 유일한 계산파트이므로 수능에 꼭 나온다.'''
2012학년도 홍익대학교 수시 1차 수리논술의 주제로 나왔다. 2013학년도 EBS 수능완성 언어영역 실전편에서 비문학 지문으로 다루었다.
7. 관련 문서
[1] 집단 관찰 - 계산을 통한 예측, 우성과 열성이 뚜렷하며 단일 대립 유전인 경우[2] 여기서 우성과 열성이라는 것은 단순히 유전적인 우성 열성을 말하는 것으로, 해당 유전형이 갖는 진화적 유불리에 관한 것이 아니다.[3] 이론적으로 100점인 이유는, 아래에도 기술하듯이 현실의 집단은 멘델 집단이 아니기 때문이다. 즉 혈우병, 선천성 연골 무형성증, PKU 관련 유전자처럼 생존과 생식에 상당히 불리한 유전자라도 집단에서 빈도가 유지되는 이유는 이 법칙만으로 설명할 수 없다. 돌연변이와 자연선택이 꾸준히 일어나는 유전자에서 유전자 빈도의 평형은 돌연변이가 일어날 확률과, 돌연변이 유전자가 불리한 선택을 받는 정도인 선택계수(1-상대적응도)로 정해진다.[4] Punnett Square의 그 퍼넷이다.[5] 일명 Undy Yule. 이후 Yule Process와 Yule Distribution으로 학계에서 이름이 남게 된다.[6] G. U. Yule, Proceedings of the Royal Society of Medicine, Epidemological Section, 1908, Vol. 1, p.165. [7] 곱셈 공식이다.[8] Hardy, G. H., 1908, ''Mendelian Proportions in a Mixed Population'', Science, N.S. Vol. 28, Jul. 1908, p. 49-50.[9] 유대계 독일인으로 이 때는 미국에 망명해 있었다.[10] 유전자풀의 조성변화=진화라고 정의하기도 한다. 이 경우 진화의 주체는 개체가 아닌 종집단으로 본다.[11] 집단 관찰 - 계산을 통한 예측, 우성과 열성이 뚜렷하며 단일 대립 유전인 경우[12] 물론 상술한 멘델 집단이라는 가정 하에.