뇌터 정리
1. 개요
Noether's Theorem
독일의 수학자이자 물리학자인 에미 뇌터가 증명한 정리.
뇌터 정리를 가장 알기 쉽게 풀어 쓴 것이 위의 문장이다.[1] 과학을 배우며 알게 되는 상당수의 보존법칙들(에너지 보존, 운동량 보존, 각운동량 보존 등)은 굳이 대칭성으로부터 출발하지 않고도 하나하나 유도할 수 있기 때문에 굳이 이러한 식으로 기술하는 게 큰 의미가 있는지 의문을 가질 수도 있다. 그러나 아래에서 볼 수 있듯이 뇌터 정리의 진정한 파워는 양자역학이나, 입자이론, 장이론 등에서 등장하는 대칭성에 이를 적용하였을 때 발휘된다.'''어떠한 계에 연속적인 대칭성이 있으면, 대응되는 보존되는 물리량이 존재한다.'''
다음은 고전적인 계가 가지는 각각의 대칭성에 따라 유도되는 보존법칙의 리스트이다.
이번에는 그 반대의 경우, 즉 대칭성이 있는지는 아직 모르지만 무언가 보존되는 것이 있다는 것은 아는 경우를 생각해 보자. 모든 보존량에 대해 그에 해당하는 대칭성이 존재할까? 전하 보존과 같은 법칙은 얼핏 생각해서는 관련된 특별한 대칭성이 바로 떠오르지 않을 수도 있다. 그러나 무언가의 대칭성이 있을 것이라고 생각하고 연구를 지속한 물리학자들은 전자기 퍼텐셜의 글로벌 게이지 대칭이 전하 보존을 이끌어낸다는 것을 밝혀 낼 수 있었다. 더 나아가서 전하를 가진 각 입자들의 양자장의 글로벌 게이지 대칭을 고려하면 각 입자별 전하 보존이라는 더 강한 보존 법칙도 생각할 수 있다.[4]
더 깊이 들어가다 보면, 아예 얼핏 봐선 존재하지 않는 것처럼 보이는 국소적 게이지 대칭이 존재해야 한다고 주장하는 것으로부터 자연계에 존재하는 힘의 근원인 게이지 장과 그것의 양자화된 형태인 게이지 입자의 존재를 예측하고, 그 힘이 어떤 형태로 작용해야만 하는지를 알아낼 수 있다.
2. 쉬운 설명
예를 들어 $$ m $$이라는 질량을 가지고 $$ v $$라는 속도로 움직이고 있는 물체가 있다고 하자. 정지해 있는 좌표계에 위치한 관찰자가 보았을 때 이 물체가 가지는 운동량은 얼마인가? 당연히 $$ p = mv $$이다. 그렇다면 이 관찰자가 좌표계에서 우측으로 5미터만큼 움직였다고 가정하자. 이 상태에서 관찰자가 측정할 수 있는 물체의 운동량은 아까와 동일한 $$ mv $$이다. 이것을 일반화시키면 관찰자가 이 좌표계에서 임의의 거리만큼 움직여도 이 물체의 운동량은 $$ mv $$로 불변함을 알 수 있다. 위에 서술한 '''공간 이동 대칭이 운동량을 보존한다'''는 말은 이 예시를 일반화시킨 말이다. 한 마디로 공간에서 이동하는 위치들이 동일할 때에는 그 운동량이 보존된다는 것. 공간 회전 대칭에 대해서도 비슷한 정리가 성립하는데, 같은 원리로 이 경우에는 선운동량이 아닌 각운동량이 보존된다.
3. 간단한 예
3.1. 운동량 보존
일반화 좌표 $$ q_{i} $$ 를 $$ q_{i} \rightarrow q_{i} + \delta q_{i} $$ 로 조금 변화 시켰을 때의 작용 $$ S $$의 변분은 다음과 같다.
$$ \displaystyle \delta S = \int_{t_{2}}^{t_{1}} \left( {{\partial \mathscr{L}} \over {\partial q_{i \delta q_{i} + \frac{\partial \mathscr{L}}{\partial \dot{q_{i}}} \delta \dot{q_{i}} \right) dt $$ }}
$$ \displaystyle = \int_{t_{2}}^{t_{1}} \left[ {{\partial \mathscr{L}} \over {\partial q_{i - \frac{d}{dt} \frac{\partial \mathscr{L}}{\partial \dot{q_{i}}} \right] \delta q_{i} dt + \left[ \frac{\partial \mathscr{L}}{\partial \dot{q_{i}}} \delta q_{i} \right]_{t_{2}}^{t_{1}} = 0 $$ }}
오일러-라그랑주 방정식 $$\displaystyle {{\partial \mathscr{L}} \over {\partial q_{i - \frac{d}{dt} \frac{\partial \mathscr{L}}{\partial \dot{q_{i}}}=0 $$}}} 이므로
마지막 항의 $$\displaystyle \left[ \frac{\partial \mathscr{L}}{\partial \dot{q_{i}}} \delta q_{i} \right]_{t_{2}}^{t_{1}} $$ 또한 자연스럽게 0인것을 알 수 있다. 이것을 뇌터 차지(noether charge)라고 부르고 이것을 이용해 다음과 같이 결론을 내릴 수 있다.
$$ p_{i}(t_{1}) \delta q_{i}(t_{1}) - p_{i}(t_{2}) \delta q_{i}(t_{2}) = 0$$ 이고,
경계조건이 $$ \delta q_{i}(t_{1})= \delta q_{i}(t_{2}) $$ 이므로,
$$ p_{i}(t_{1})=p_{i}(t_{2})$$
따라서, 운동량이 공간 병진 대칭에 의해 보존되는것을 알 수 있다.
3.2. 에너지 보존
다음과 같이 주어진 계의 시간을 뒤로 $$ \epsilon $$ 만큼 이동시킨다고 가정하자, 그렇다면 작용 $$ S $$ 는 다음과 같이 주어진다.
$$ \displaystyle S = \int_{t_{1}}^{t_{2}} \mathscr{L}(q_{i},\dot{q_{i}}) dt $$
$$ \displaystyle = \int_{t_{1}+\epsilon}^{t_{2}+\epsilon} \mathscr{L}(q_{i}(t-\epsilon),\dot{q_{i}}(t-\epsilon))dt $$
$$ \displaystyle = \int_{t_{1}+\epsilon}^{t_{2}+\epsilon} \mathscr{L}(q_{i}(t)-\epsilon \dot{q_{i}}(t),\dot{q_{i}}(t)-\epsilon \ddot{q_{i}}(t))dt$$
$$ \displaystyle = \int_{t_{1}+\epsilon}^{t_{2}+\epsilon} \left( \mathscr{L}(q_{i},\dot{q_{i}}) - {\left(\epsilon \dot{q_{i}}(t) {{\partial \mathscr{L}}\over{\partial q_{i+ \epsilon \ddot{q_{i}}(t) {\frac{\partial \mathscr{L}} {\partial \dot{q_{i}}}}\ \right) }\right) dt $$}}}
$$ \displaystyle \left( q_{i}(t-\epsilon) \simeq q_{i}(t)-\epsilon \dot{q_{i}} \ ,\ \ \delta q_{i}= -\epsilon \dot{q}_{i} \right) $$
$$ \displaystyle S = \int_{t_{1}+\epsilon}^{t_{2}+\epsilon} \left( \mathscr{L}(q_{i},\dot{q_{i}}) - {\left( {{\partial \mathscr{L}}\over{\partial q_{i \delta {q_{i}}+ {\frac{\partial \mathscr{L}} {\partial \dot{q_{i}}}\delta \dot{q_{i}}}\ \right) }\right) dt $$}}}
$$ \displaystyle = \int_{t_{1}+\epsilon}^{t_{2}+\epsilon} \left( \mathscr{L} + \delta\mathscr{L} \right)dt $$
$$ \displaystyle = \int_{t_{1}+\epsilon}^{t_{2}} \mathscr{L}dt + \int_{t_{1}}^{t_{2}}\mathscr{L}dt + \int_{t_{1}}^{t_{2}+\epsilon}\mathscr{L}dt + \int_{t_{1}+\epsilon}^{t_{2}+\epsilon}\delta \mathscr{L}dt $$
$$ \mathcal{K} $$ 를 다음과 같이 정의하자, 그러면
$$ \displaystyle \int \mathscr{L}dt \equiv \mathcal{K} \quad , \quad \frac {1}{\epsilon} \int_{t+\epsilon}^{t} \mathscr{L}dt = \frac{\mathcal{K}(t) - \mathcal{K}(t+\epsilon)}{\epsilon} = \mathscr{L}(t) $$
$$ \displaystyle \int_{t+\epsilon}^{t} \mathscr{L}dt = \epsilon \mathscr{L}(t) $$ 임을 알 수 있다.
그렇다면
$$ \displaystyle \int_{t_{1}}^{t_{2}} \mathscr{L}dt = \epsilon \mathscr{L}(t_{1}) - \epsilon \mathscr{L}(t_{2}) + \int_{t_{1}}^{t_{2}} \mathscr{L}dt + \int_{t_{1}+\epsilon}^{t_{2}+\epsilon} \delta\mathscr{L}dt $$ 이고,
우변의 $$ \int_{t_{1}}^{t_{2}} \mathscr{L}dt $$를 이항하면,
$$ \displaystyle {0} = \epsilon \mathscr{L}(t_{1}) - \epsilon \mathscr{L}(t_{2}) + \int_{t_{1}+\epsilon}^{t_{2}+\epsilon} \left( {{\partial \mathscr{L}}\over {\partial q_{i\delta {q_{i}}+{\frac{\partial \mathscr{L}} {\partial \dot{q_{i}}}}\dot\delta {q_{i}}\right) dt $$}}} 이다.
마지막항을 계산해주면,
$$ \displaystyle \int_{t_{1}+\epsilon}^{t_{2}+\epsilon} \left( {{\partial \mathscr{L}}\over {\partial q_{i\delta {q_{i}}+{\frac{\partial \mathscr{L}} {\partial \dot{q_{i}}}}\dot\delta {q_{i}}\right) dt= \left[ \frac{\partial \mathscr{L}}{\partial \dot{q_{i}}}\delta {q_{i}} \right] _{t_{1}+\epsilon}^{t_{2}+\epsilon} -\int_{t_{1}+\epsilon}^{t_{2}+\epsilon} \frac{d}{dt} \frac{\partial \mathscr{L}}{\partial \dot{q_{i}}}\delta {q_{i}} dt +\int_{t_{1}+\epsilon}^{t_{2}+\epsilon} \frac{\partial \mathscr{L}}{\partial {q_{i}}}\delta {q_{i}}dt $$}}}
$$ \displaystyle = \int_{t_{1}+\epsilon}^{t_{2}+\epsilon} \left(\frac{\partial \mathscr{L}}{\partial {q_{i - \frac{d}{dt} \frac{\partial \mathscr{L}}{\partial \dot{q_{i}}} \right) \delta q dt + \left[ \frac{\partial \mathscr{L}}{\partial \dot{q_{i}}}\delta {q_{i}} \right] _{t_{1}+\epsilon}^{t_{2}+\epsilon} $$}}}
$$ \displaystyle = \left[ \frac{\partial \mathscr{L}}{\partial \dot{q_{i\delta {q_{i}} \right] _{t_{1}+\epsilon}^{t_{2}+\epsilon} $$}}}
원래 식에 위항을 넣어주면,
$$ \displaystyle {0} = \epsilon \mathscr{L}(t_{1}) - \epsilon \mathscr{L}(t_{2}) + \left[ \frac{\partial \mathscr{L}}{\partial \dot{q_{i\delta {q_{i}} \right] _{t_{1}+\epsilon}^{t_{2}+\epsilon} $$}}}
$$ \displaystyle \mathscr{L}(t_{1}) - \frac{\partial \mathscr{L}}{\partial \dot{q_{i \dot{q_{i}}(t_1) = \mathscr{L}(t_{2}) - \frac{\partial \mathscr{L}}{\partial \dot{q_{i}}} \dot{q_{i}}(t_2) $$}}} 이다.
해밀토니언은 다음과 같이 정의 되므로,
$$ \mathscr{L} - \dfrac{\partial \mathscr{L}}{\partial \dot{q_{i \dot{q_{i}} = \mathcal{H} \displaystyle $$}}}
시간 대칭성에 의해 헤밀토니안, 즉 에너지는 보존된다.
4. 뇌터 정리의 일반화된 증명
어떠한 고전적인 계의 라그랑지언이 $$ \mathscr{L} = \mathscr{L} \left(q_1, q_2, \ldots, \dot{q}_1, \dot{q}_2, \ldots \right) $$ 와 같이 일반 좌표계의 함수로 씌여진다고 하고, 그 계의 라그랑지언이 아래 식과 같은 작은 수 $$ \epsilon $$ 의 1차 오더의 좌표 변환에 대해 불변이었다고 가정하자.
$$ \displaystyle q_i = q_i + \epsilon K_i \left(q_1, q_2, \ldots \right) $$
여기에서의 $$ K_i \left(q_1, q_2, \ldots \right) $$ 가 각 대칭성을 표현하는 함수이다. 라그랑지언이 $$ \epsilon $$ 의 1차 오더의 변환에 대해 불변이라는 것으로부터 다음과 같은 식을 쓸 수 있다.
$$ \displaystyle 0 = {d \mathscr{L} \over d\epsilon} = \sum_i \left( {\partial \mathscr{L} \over \partial q_i} \ {\partial q_i \over \partial \epsilon} + {\partial \mathscr{L} \over \partial \dot{q}_i} \ {\partial \dot{q}_i \over \partial \epsilon} \right) = \sum_i \left( {\partial \mathscr{L} \over \partial q_i} K_i + {\partial \mathscr{L} \over \partial \dot{q}_i} \ \dot{K}_i \right) $$
라그랑지언 운동방정식을 사용하면
$$ \displaystyle 0 = \sum_i \left( K_i {d \over dt} \left( {\partial \mathscr{L} \over \partial \dot{q}_i} \right)+ {\partial \mathscr{L} \over \partial \dot{q}_i} \ \dot{K}_i \right) = {d \over dt} \left( \sum_i {\partial \mathscr{L} \over \partial \dot{q}_i} K_i \right) $$
즉, 시간미분해서 0이 되는 다음의 물리량이 바로 보존되는 무언가이다.
$$ \displaystyle P \left(q_1, q_2, \ldots, \dot{q}_1, \dot{q}_2, \ldots \right) = \sum_i {\partial \mathscr{L} \over \partial \dot{q}_i} K_i = \sum_i \dot{p}_i K_i \left(q_1, q_2, \ldots, \dot{q}_1, \dot{q}_2, \ldots \right) $$
이렇게 일반화된 형태로 쓰면 끝까지 유도하고 나서도 이게 무엇을 의미하는지 이해하기 힘든데, 아주 간단한 경우로 $$ K_1 $$ 이 상수함수이고 $$ K_2, K_3 $$ 등등이 전부 0인 경우를 생각해 보면, $$ \dot{p}_1 $$, 즉 일반 좌표계 1번 방향의 일반화 운동량이 보존되는 양임을 알 수 있다.
5. 장이론에서의 뇌터 정리
자, 이제 장이론에 뇌터 정리가 어떻게 적용되는지 상대론적인 텐서 포말리즘을 동원하여 유도해 보자. 어떠한 장 $$ \phi \left( x \right) $$ 가 라그랑지언 밀도 $$ \mathscr{L} \left( \phi, \partial_\mu \phi \right) $$ 를 결정하는 경우를 생각해 보자. 이러한 장의 라그랑지언을 아래 식과 같은 작은 수 $$ \alpha $$ 의 1차 오더로 변환하여 보자.
$$ \displaystyle \phi \left( x \right) \rightarrow \phi^\prime \left( x \right) = \phi \left( x \right) + \alpha \Delta \phi \left( x \right) $$
여기에서의 $$ \alpha \Delta \phi \left( x \right) $$ 가 장의 변화량을 나타낸다. 이러한 장의 변화를 대칭성이라고 부르려면 운동방정식이 이 변화에 무관하게 일정하여야 하는데, 만약 액션이 불변이라면 액션으로부터 유도되는 운동방정식은 당연히 불변일 것이다. 더 일반적으로는 라그랑지언 밀도를 적분하는 부피의 표면항 만큼만 액션이 변화하는 것까지는 허용할 수 있다. 즉, 위에 주어진 장의 변화에 대해 어떠한 사차원 벡터(4-vector) $$ J^\mu \left( x \right) $$가 존재해서 다음과 같은 형태로 라그랑지언을 쓸 수 있다면 대칭성이 존재하는 것이다.
$$ \displaystyle S = \int d^4 x \mathscr{L} \left( \phi, \partial_\mu \phi \right) \ \ \ \ \ \ \mathscr{L} \rightarrow \mathscr{L} + \alpha \Delta \mathscr{L} = \mathscr{L} + \alpha \partial_\mu J^\mu $$
실제로 장의 변화에 수반되는 라그랑지언의 변화를 계산하여 보자.
$$ \displaystyle \alpha \delta \mathscr{L} = {\partial \mathscr{L} \over \partial \phi} \left( \alpha \Delta \phi \right) + {\partial \mathscr{L} \over \partial \left(\partial_\mu \phi \right)} \partial_\mu \left( \alpha \Delta \phi \right) = \alpha \partial_\mu \left( {\partial \mathscr{L} \over \partial \left(\partial_\mu \phi \right)} \Delta \phi \right) + \alpha \left( {\partial \mathscr{L} \over \partial \phi} - \partial_\mu {\partial \mathscr{L} \over \partial \left(\partial_\mu \phi \right)} \right) \Delta \phi $$
마지막 등식의 두번째 항은 오일러-라그랑주 방정식으로부터 0이 되고, 첫번째 항이 바로 위에서 언급한 액션의 표면항의 변화이다. 이 항이 $$\alpha \partial_\mu J^\mu \left( x \right) $$ 와 같아야 하므로,
$$ \displaystyle \alpha \partial_\mu \left({\partial \mathscr{L} \over \partial \left(\partial_\mu \phi \right)} \Delta \phi \right) - \alpha \partial_\mu J^\mu \left( x \right) = 0 $$
임을 알 수 있고, 다음과 같이 뇌터 전류를 정의할 수 있다.
$$ \displaystyle j^\mu \left( x \right) \equiv {\partial \mathscr{L} \over \partial \left(\partial_\mu \phi \right)} \Delta \phi - J^\mu \left( x \right) \ \ \ \ \ \ \partial_\mu j^\mu = 0 $$
보다 일반적으로 하나 이상의 필드가 이 대칭성에 관여하는 경우엔, 위 식의 첫번째 항을 각 필드 방향별로 합한 것으로 대체하여야 할 것이다. 오른쪽 등식은 사차원 벡터의 0번째 항을 전류밀도 $$ \rho $$ 로 표현했을 때, $$ \dfrac{\partial \rho}{\partial t} + \nabla \cdot \bold{j} = 0 $$ 과 같은 형태의 연속방정식이다. 이와 같이 라그랑지언의 연속적인 대칭성이 있을 때마다 하나의 보존법칙을 유도할 수 있다. 실제적으로는 위에서 정의한 $$ j^\mu $$ 에 적절한 상수를 곱해 우리가 잘 알고 있는 물리량이 되도록 적절히 맞춰주게 된다.
이 사차원 벡터의 0번째 항이 전하밀도의 역할을 하므로, 실제로 보존되는 전하는 다음과 같다.
$$ \displaystyle Q = \int_{\mathsf {all \ space}} j^0 d^3 \bold{x} $$
사차원 벡터의 남은 세 방향의 성분이 이러한 전하의 흐름을 표현하는 전류 벡터 $$ \bold{j} $$ 가 된다.
높은 레벨의 장이론에서는 디랙 장의 글로벌 게이지 대칭에 따른 뇌터 전류로 전하의 본질을 설명하며, 고전역학과 일반상대론 등에서 유용하게 쓰는 에너지-운동량 텐서가 바로 시공간의 대칭으로부터 얻어지는 뇌터 전류를 텐서 형태로 일반화한 결과이다.[5]
6. 여담
뇌터는 1918년에 괴팅겐 대학교에서 이 정리를 증명했다. 당시의 사회는 성차별이 심한 사회였기 때문에 다비트 힐베르트가 뇌터를 괴팅겐 대학교의 수학과 사강사[6] 로 초대하려고 했을 때 대학교의 남자 교수들이 "학생들이 전쟁에서 돌아왔을 때 여자 교수에게 강의를 들어야 한다는 사실을 알면 뭐라고 생각하겠냐?"고 항의했을 때에 힐베르트의 답변이 걸작이다.
결과적으로 1915년부터 모스크바 대학교에 초빙 받는 1928년까지 괴팅겐 대학교에서 일했다. 그런데 위의 에피소드에도 불구하고 아이러니하게도 괴팅겐 대학이었기 때문에 뇌터가 사강사로 임용된 것인데, 괴팅겐 대학교가 19세기 초반, 하노버 왕국의 국왕인 에른스트 아우구스트 1세에 대항에 자유주의 제도의 존치를 옹호하던 교수 7명이 파면되는 괴팅겐 7인 사건 등이 일어났을 정도로 다른 대학들보다 덜 보수적이었기 때문이다. 이 시기 괴팅겐 대학교에는 펠릭스 클라인, 막스 보른, 폴 디락, 베르너 하이젠베르크 등의 세계적 석학들이 몸 담고 있을 시기이다.[7]나는 그녀의 성별이 강사 임용에 왜 문제가 되는지 이해할 수 없다. '''이곳은 대학교지 목욕탕이 아니지 않은가?'''
물리학 전체에서 굉장히 중요한 정리이기 때문에 더 오래 살았다면 노벨상을 받았을지도 모르는 안타까움 뿐이다. 참고로 뇌터가 교직생활을 하던 수학과 건물은 지금도 괴팅겐 대학교 수학과 건물로 쓰이고 있다.
[1] 연속적이라는 제한이 있는 이유는 반사대칭과 같이 불연속적인 대칭도 존재하고, 그 경우 아래에서 설명하는 뇌터 전류가 존재하지 않기 때문이다.[2] 정확히 말하자면, explicit한 시간 변화에 대해 불변이다.[3] 위와 같이 explicit한 위치 변화에 대해 불변이다.[4] 단, 그 양자장이 어떠한 상호작용을 하느냐에 따라 그러한 부분적인 전하 보존 법칙은 깨질 수 있다.[5] 한 방향의 대칭으로부터 4개의 성분이 있는 4차원 벡터가 나오는 것을 위에서 봤는데, 시공간 네 방향의 대칭을 동시에 인정하면 $$ 4 \times 4 = 16 $$ 개의 성분을 가진 랭크 2의 텐서가 나온다.[6] privatdozent, 한국식으로 하면 시간강사 정도쯤 되는 위치인데, 당시 독일은 교수진 거의 대부분을 사강사로 채웠어서 사실상 지금의 조교수~정교수 정도의 위치이다.[7] 참고로 이들은 1933년 나치의 억압정책으로 인하여 대부분 미국 등으로 이민을 떠났다.