연산자
1. 개요
'''Operator · 演算子'''
수학 전반에서 연산자의 넓은 의미는 자기 자신으로의(즉, 정의역과 공역이 동일한) 함수를 말한다. 거듭제곱이나 제곱근, 팩토리얼, 가우스 함수 등 웬만한 함수는 수의 연산의 예시가 될 수 있다. 연산이라는 관점에서 보면 단항 연산(unary operation)이라는 표현이 사용되기도 하고, 프로그래밍#s-1이나 이산수학#s-4에서는 연산자라고 하면 이런 단항 연산으로서의 연산자를 의미한다. 논리 연산자처럼 이항 연산도 포함하는 경우가 있다.
다만, 이런 특수한 경우를 제외하면 보편적으로 연산자라 하면 특히 선형 연산자, 즉 벡터 공간 위의 선형 변환을 의미한다. 유한 차원 위의 연산자는 선형대수학에서 충분히 다루었으니만큼, 연산자를 주로 다루는 해석학 계열에서는 무한 차원 벡터 공간 위에서의 연산자를 주로 연구한다. 이 연산자 연구의 실제 목적 중 하나는 복합적인 미분들로 이루어진 미분 연산자/미분 작용소(differential operator)를 일반화시켜 연구하는 것이라 볼 수 있다. 함수들의 벡터 공간 위에서 미분은 선형 연산이므로, 미분으로 이루어진 식은 연산자로 볼 수 있다. 미분 자체를 보는 대신 이 연산자에 대한 성질을 탐구함으로서 미분방정식을 푸는 것이 현대 편미분방정식 이론의 보편화된 패러다임 중 하나이다. 물론, 무한 차원 연산자의 개념은 함수공간에만 국한되어 쓰이는 것은 아니고 다양한 곳에 활용될 수 있다. 이러한 맥락의 연산자는 순수수학에서는 '''작용소'''라는 이름으로 더 자주 불린다.
물리학, 특히 양자역학에서 연산자의 개념은 단순히 함수 정도가 아니라, 양자역학이라는 학문 자체가 연산자에 대한 독특한 물리적 이해를 바탕으로 엮어진 학문이라 보아도 무방할 정도로 중요한 지위를 가지고 있다. 이 물리학에서의 연산자도 수학에서의 연산자의 일종으로 간주될 수 있지만, 수학 연산자의 서술법과는 약간 차이를 보일 수 있다.
2. 물리학에서의 연산자
물리학, 특히 양자역학에서 연산자란 다음과 같은 고윳값 문제에서 $$\hat{A}$$에 해당하는 선형 연산자(ex. 정사각행렬)이다.
그런데 선형대수학에서 등장하는 고윳값 문제가 어쩌다 양자역학에서 쓰이게 된 것일까? 이는 양자역학에서 위 식을 다음과 같이 해석할 수 있기 때문이다.
- 연산자 $$\hat{A} $$: 물리량 $$A$$를 관측(측정)하는 행위.
- 임의의 벡터[2] $$|\psi\rangle$$: 파동함수 또는 양자 상태.
- 고윳값 $$a$$: 물리량 $$A$$의 관측(측정) 결과.
- 고유벡터 $$|a\rangle$$ : $$A$$를 관측(측정)하면 항상 $$A$$가 나오는 상태.
$$\hat{S} \,| \!\uparrow \rangle = \dfrac{\hbar}2 \,| \!\uparrow \rangle, \quad \hat{S} \,| \!\downarrow\rangle = -\dfrac{\hbar}2 \,| \!\downarrow\rangle $$
$$|\psi\rangle = \dfrac1{\sqrt2} \,|\!\uparrow\rangle + \dfrac1{\sqrt2} \,|\!\downarrow\rangle $$
위 예시에서 볼 수 있듯이, 연산자는 물리학의 시각으로 바라봤을 때 '''관측'''이라는 개념을 의미한다. 특히 스핀의 경우 고유벡터(고유켓)가 두 개뿐이기 때문에, 연산자를 $$2\times2$$ 정사각행렬로 쓰고 양자 상태(켓벡터)는 $$2\times1$$ 행렬(열벡터)로 쓰면 그만이다. 그런데 다른 상황에서는 열벡터의 성분을 무한 개, 그것도 비가산 무한만큼 써야 하는 상황이 발생할 수 있다. 예를 들어 전자의 위치가 어떤 실수 $$x$$에 있는 상태를 나타내는 고유벡터가 임의의 $$x$$마다 다 존재한다면, 고유벡터뿐만 아니라 연산자를 표현하는 데에도 무한한 성분이 있는 행렬이 필요할 것이다. 그 뿐만 아니라, 물리계에 따라서 정사각행렬로 표현된 연산자의 요소 또한 바뀌기 때문에 무작정 행렬요소를 나타내는 것은 자세한 기술을 할 수 없다는 문제가 생긴다. 따라서 열벡터의 요소가 무한 개인 상황이라면 슈뢰딩거 묘사를 사용하는 것이 이러한 기술적 문제를 해결할 수 있을 뿐만 아니라 일관되게 표현할 수 있어서, 학부의 양자역학은 슈뢰딩거 방정식을 가장 먼저 배우게 된다. 이 경우, 고유벡터는 힐베르트 공간의 복소함수로 표현하고, 연산자는 미분 연산자 등을 포함하게 된다. (물론 미분 연산자도 선형 변환의 일종이다.)
2.1. 성질
연산자가 어떤 특징을 지니고 있는가에 따라 그 연산자가 실제 물리량을 나타내는지, 불확정성이 성립하는지를 알 수 있으며, 이 물리량이 나타내는 물리계의 변환이 무엇인가에 대해서도 판가름할 수 있다.
2.1.1. 에르미트 연산자(Hermitian Operator)
연산자가 물리량의 관측을 의미하는 것이라면, 그 고윳값은 실수가 되어야 할 것이다. 물리적으로 운동량을 측정했는데 $$(3-2i)\,{\rm kg\,m/s}$$가 나온다던가 하는 일은 당연히 없을 것이기 때문이다.[4] 이렇게 관측 가능한 연산자가 나타내는 물리량을 관측 가능량(observable)이라고 한다. 선형대수학에 따르면, 고윳값이 실수이고 정규직교대각화가 가능하기 위해서 연산자는 수반 연산자(복소켤레 전치)가 자기 자신과 같은 연사자가 되어야 한다. 즉, 에르미트 연산자(Hermitian operator) 혹은 자가수반 연산자(self-adjoint operator)가 되어야 한다.
반면, 양자역학에서는 에르미트 연산자가 아닌 연산자도 존재한다. 이러한 연산자는 관측 가능한 물리량을 나타내지는 않지만, 양자 상태의 분석에 유용하게 사용될 수 있다. 유명한 예시로는 양자 조화 진동자를 풀어나갈 때 도입하는 사다리 연산자(ladder operator) 등이 있다.
2.1.2. 교환자
연산자의 '''교환자(commutator)'''라고 하는 것은 다음과 같이 정의된다.
$$[\hat A,\,\hat B] \equiv \hat A\hat B-\hat B\hat A $$
[4] 실수량(예: $$3$$)을 관측한 값이라고 하였을 때, 복소수 값(예: $$3-2i$$)을 얻는다는 뜻은 허수(예: $$-2i$$) 크기만큼 관측을 하지 못한다는 뜻과 같다. 물론 확률론의 시각으로 바라봤을 때 고윳값이 복소수인 양자 상태도 충분히 구현할 수 있을 뿐만 아니라 만들 수도 있으므로(대표적으로 레이저의 양자 상태인 coherent state), 이 논의는 어디까지나 평면파라는 잘 정의된 양자 상태를 기반으로 하고 있음을 기억하자.
교환자에 대한 자세한 내용은 교환자 문서를 참고하라.
2.1.3. 기댓값의 시간 미분
어떤 연산자 $$\hat A$$의 기댓값 $$\langle A \rangle$$은 하이젠베르크 묘사와 슈뢰딩거 묘사에 대해, 순차적으로 다음과 같이 정의한다.
[math(\displaystyle \begin{aligned}
\langle A \rangle &\equiv \langle \psi | \hat A^H(t) | \psi \rangle \\
&= \int \psi^{\ast}(x,\,t) \hat A \,\psi(x,\,t) \,{\rm d}x
\end{aligned} )]
[5] 교환자는 얼마나 불확정적으로 측정될지를 나타내는 두 물리량의 표준편차 곱과 연결되어 있다. 따라서 연산자들의 교환자를 확인하는 것으로, 연산자와 연결된 두 물리량이 동시 측정 가능한 물리량인지 아닌지를 바로 판가름할 수 있다.
$$\hat A^H(t) = \exp\biggl( i\dfrac{\hat\mathcal H}{\hbar}t \biggr) \hat A \exp\biggl( -i\dfrac{\hat\mathcal H}{\hbar}t \biggr) $$
$$\displaystyle \langle A \rangle = \int \psi^{\ast}(x,\,0) \exp\biggl( i\dfrac{\hat\mathcal H}{\hbar}t \biggr) \hat A \exp\biggl( -i\dfrac{\hat\mathcal H}{\hbar}t \biggr) \psi(x,\,0) \,{\rm d}x $$
$$\dfrac{{\rm d}\langle A \rangle}{{\rm d}t} = \biggl\langle \dfrac{\partial \hat A}{\partial t} \biggr\rangle + \dfrac i{\hbar} \bigl\langle[ \hat\mathcal H,\,\hat A ]\bigr\rangle $$
$$\dfrac{{\rm d}\langle A \rangle}{{\rm d}t} = \dfrac i{\hbar} \bigl\langle[ \hat\mathcal H,\,\hat A ]\bigr\rangle $$
그리고 시간에 대한 평행이동을 나타내는 $$e^{-i\hat\mathcal Ht} $$의 $$\hat\mathcal H$$이 해밀토니안일 수밖에 없다는 것을 오히려 위의 하이젠베르크 운동방정식으로 시험해볼 수 있다. 양자역학에서 나타내는 물리계는 고립계[7] 이며, 고립계에서 총에너지만큼은 시간에 관계없이 항상 불변하다. 따라서 고립계의 총에너지를 나타내는 연산자는 $$\hat\mathcal H$$과 교환 가능해야 하고, $$\hat\mathcal H$$의 물리량의 단위는 에너지 단위인 [math(\rm{J} )]이므로, $$\hat\mathcal H$$은 총에너지를 고윳값으로 제공하는 연산자라는 것을 알 수 있다.
2.2. 예시
위치 표현을 따르냐 아니면 운동량 표현을 따르냐에 따라 슈뢰딩거 묘사에서의 연산자 표기가 달라진다. 학부 기준 양자역학 교재는 보통 위치 표현으로 파동함수를 나타내나, 때에 따라서는 운동량 공간상의 파동함수로 표현하는 것이 더욱 물리적 해석에 용이할 때도 있기 때문이다. 위치 표현은 다름이 아니라 파동함수를 '위치와 시간을 변수로 가지는 함수'로 나타내는 것을 의미하고, 운동량 표현은 파동함수를 '에너지와 운동량을 변수로 가지는 함수'로 나타내는 것을 의미한다. 운동량 표현의 파동함수 $$k({\bf p}) $$와 위치 표현의 파동함수 $$\psi({\bf r},\,0) $$는 다음과 같이 Plancherel의 정리로 나타낼 수 있다.[8] 여기서 $${\bf r} $$은 위치 벡터, $${\bf p} $$는 운동량 벡터이다.
[math(\displaystyle \begin{aligned}
\psi({\bf r},\,0) &= \frac1{(2\pi)^{3/2}} \int k({\bf p}) \exp \biggl( \frac i{\hbar} {\bf r \cdot p} \biggr) {\rm d}^3 {\bf p} \\
k({\bf p}) &= \frac1{(2\pi)^{3/2}} \int \psi({\bf r},\,0) \exp \biggl( -\frac i{\hbar} {\bf r \cdot p} \biggr) {\rm d}^3 {\bf r}
\end{aligned} )]
2.2.1. 위치
위치 표현(position representation)에서 위치 연산자는 위치 변수와 동등하다. 따라서 $$i$$번째 성분에 대해
$$\hat x_i = x_i $$
운동량 표현(momentum representation)에서 위치 연산자는 성분별로 다음과 같다.
$$\hat x_i \equiv i\hbar \dfrac{\partial}{\partial p_i} $$
2.2.2. 운동량
위치 표현에서 운동량 연산자는 $$i$$번째 성분에 대해 아래와 같다.
$$\hat p_i \equiv - i\hbar \dfrac{\partial}{\partial x_i} $$
$$\hat p_i = p_i $$
2.2.3. 해밀토니안
해밀토니안 연산자는 다음과 같이 슈뢰딩거 방정식을 만족하며
$${\hat\mathcal H} |\psi\rangle = E |\psi\rangle $$
[math(\begin{aligned}
{\hat\mathcal H} &= \dfrac{\hat p^2}{2m} + \hat V \\
&= -\dfrac{\hbar^2}{2m} \nabla^2 + V
\end{aligned} )]
$$(\hat\mathcal H^2-\hat p^2) |\psi\rangle = m^2 |\psi\rangle $$
$$\biggl( \dfrac{\partial^2}{\partial t^2} - \nabla^2 + m^2 \biggr) \psi({\bf r},\,t) = 0 $$
2.2.4. 사다리 연산자
서문에 쓴 대로 Hermitian이 아닌 연산자도 존재하며, 사다리 연산자는 Hermitian이 아닌 연산자의 대표적인 예시이다.(즉, 사다리 연산자의 고윳값은 실수가 아니다.) 이 연산자는 조화 진동자 운동을 나타내는 양자 상태(파동함수)를 바꾸는 연산자이기도 하다. 사다리 연산자는 에너지 고윳값을 $$\hbar w$$만큼 올린 양자 상태나 내린 양자 상태로 바꿔준다.
[math(\begin{aligned} \hat a &\equiv \dfrac{\beta}{\sqrt2} \biggl( \hat x + i\dfrac{\hat p}{m\omega} \biggr) \\
\hat a^{\dagger} &= \dfrac{\beta}{\sqrt2} \biggl( \hat x - i\dfrac{\hat p}{m\omega} \biggr)
\end{aligned} )]
$$\beta^2 \equiv \dfrac{m\omega}{\hbar} $$
자세한 내용은 양자 조화 진동자 문서를 참고하라.
2.2.5. 각운동량
각운동량 연산자는 코펜하겐 해석에 따라 다음과 같이 정의한다. 단, 아래의 수식에서 아인슈타인 합 규약이 쓰였음에 유의하고, $$\hat\mathbf V$$와 같이 서컴플렉스 기호로 표현된 것은 단위 벡터 표기가 아닌 연산자 표기임에 유의하라.
[math(\begin{aligned}
\hat\mathbf L &= \hat\mathbf x \times \hat\mathbf p \\
&= \epsilon_{ijk} x_i p_j \hat e_k
\end{aligned} )]
[9] 조화 진동자 운동을 사다리 연산자를 쓰지 않고 함수를 만들어 찾는 방법도 존재한다. 그러나, 사다리 연산자를 사용하면 풀이가 간결해진다는 것을 하이젠베르크가 제시하기 전까지는 푸는데 무려 20년 넘게 걸린 문제이므로, 사다리 연산자를 사용하지 않고 푸는 것은 별로 추천하는 바가 아니다.
각운동량 연산자의 특징은 크게 세 가지이다. 첫째는 각운동량의 특정 방향 성분의 크기는 그 방향 성분의 운동량(또는 위치) 연산자와 교환 가능하다는 점이고, 둘째는 각운동량의 방향 성분은 다른 방향 성분의 각운동량과의 교환자가 [math(0)]이 아니라는 점, 그리고 셋째는 방향 성분별 각운동량 연산자는 각운동량 크기의 제곱을 나타내는 연산자와 교환 가능하다는 점이다. 이를 수식으로 나타내면 아래와 같다.
[math(\begin{aligned}
[\hat L_i,\,\hat p_i] &= 0 \\
[\hat L_i,\,\hat L_j] &= i \hbar \epsilon_{ijk} L_k \\
[L^2,\,\hat L_i] &= 0
\end{aligned} )]
이뿐만 아니라, 각운동량에 대해서도 사다리 연산자를 구성할 수 있는데,
[math(\begin{aligned}
\hat L_+ &\equiv \hat L_1+i\hat L_2 \\
\hat L_- &\equiv \hat L_1-i\hat L_2
\end{aligned} )]
$$\hat L^2 |lm\rangle = l(l+1) \hbar^2 |lm\rangle $$
궤도 각운동량에 관계없이 양자 상태가 갖는 각운동량을 스핀#s-4이라고 구분하여 명명하며, 스핀은 반자연수배도 허용된다.[12][13]
2.3. 연산자와 좌표 변환
연산자는 대응하는 좌표 변환의 generator로 등장한다. 이 문단에서는 평행이동 변환과 회전 변환을 예시로 들어 각각의 변환과 연산자가 어떻게 연결되어 있는지를 보일 것이다.
2.3.1. 평행이동 변환과 운동량 연산자
1차원 공간에서 슈뢰딩거 묘사(중에서 위치 묘사)의 파동함수와 하이젠베르크 묘사의 양자 상태는 다음의 관계를 만족한다.[14]
[math(\begin{aligned}
\psi(x) &= \langle x | \psi(0) \rangle \\
k(p) &= \langle p | \psi(0)\rangle
\end{aligned} )]
[10] '궤도 각운동량'과 '각운동량'은 별개의 물리량[11] 간단하게 요약하자면 양자역학의 원점, 행렬로 양자 상태를 표현해야(하이젠베르크 묘사를 써야) 한다는 것을 안 것이다. 스핀#s-4 $$1/2$$에 대한 열(행)행렬이 바로 스피너(spinor)이다.[12] 반정수배 각운동량 방향 성분을 갖는 양자 상태는 공간 상 회전운동으로 나타낼 수 있는 방법이 없다. 이뿐만 아니라, 양자역학에서 다루는 입자들은 모두 점입자로 치부하기 때문에 마찬가지로 공간상 회전운동으로 나타낼 수 없다. 그래서 스핀을 (궤도 각운동량과 독립적인) 고유한 각운동량(intrinsic angular momentum)이라고 부르기도 한다.[13] 그렇다고 궤도 운동을 표현할 수 있다는 뜻은 아니다. 앞서 쓴 것처럼, 어느 축을 기준으로 회전하는지 알 수 없기 때문에, 엄연히 말해 '회전한다'는 말을 쓰는 것조차 애매모호해지기 때문이다. 다만, 확실한 것은 '회전한다'라는 고전역학적 개념을 바탕으로 연산자를 구축한 것이기 때문에 분명 '회전은 하고 있다'고 주장을 할 수는 있을 것이다.[14] 계산을 줄이기 위해서 stationary state(정상 상태)를 선택하여 나타냈다.
이를 바탕으로 $$x+{\rm d}x$$로 좌표이동한 파동함수는 다음과 같이 표현할 수 있다.
여기서 양자 상태에 가하는 변환, 즉 양자 상태 $$|x\rangle$$를 $$|x+{\rm d}x\rangle$$로 바꿔주는 변환 $$U({\rm d}x) $$를 정의할 수 있다고 예상할 수 있고, 위치에 대한 평행 이동의 변환을 원소(element)로 가지는 집합은 리 군(Lie group)일 것을 쉽게 짐작할 수 있다. 리 군의 원소는 다음과 같은 generator $$k$$[16] 와 변수 $$a$$로 표현이 가능하다.
$$a={\rm d}x$$인 경우, 리 군의 원소 $$U({\rm d}x) $$는 다음과 같이 1차 근사식으로 표현이 가능하다.
$$U({\rm d}x) = I + k \,{\rm d}x $$
앞서 표현한 하이젠베르크 묘사의 양자 상태와 슈뢰딩거 묘사의 파동함수간의 관계에 위 식을 대입하면 다음의 관계를 얻는다.
[math(\begin{aligned}
\psi(x+{\rm d}x) &= \langle x+{\rm d}x | \psi(0) \rangle \\
&= \langle x | U^\dag ({\rm d}x) | \psi(0) \rangle \\
&= \langle x | (I + k^\dag {\rm d}x) | \psi(0) \rangle \\
&= \psi(x) + {\rm d}x \langle x | k^\dag | \psi(0) \rangle
\end{aligned} )]
[math(\displaystyle \begin{aligned}
\psi(x+{\rm d}x) &= \frac1{\sqrt{2\pi}} \int k(p) \exp \biggl[ \frac i{\hbar} p(x+{\rm d}x) \biggr] {\rm d}p \\
&= \frac1{\sqrt{2\pi}} \int k(p) \exp \biggl( \frac i{\hbar} px \biggr) \exp \biggl( \frac i{\hbar} p\,{\rm d}x \biggr) {\rm d}p \\
&= \frac1{\sqrt{2\pi}} \int k(p) \exp \biggl( \frac i{\hbar} px \biggr) \biggl[ 1+\frac i{\hbar} p\,{\rm d}x \biggr] {\rm d}p \\
&= \psi(x) + \frac i{\hbar} \frac1{\sqrt{2\pi}} \,{\rm d}x \int k(p) p \exp \biggl( \frac i{\hbar} px \biggr) {\rm d}p \\
&= \psi(x) + \frac i{\hbar} \frac1{\sqrt{2\pi}} \,{\rm d}x \int \langle p | \psi(0) \rangle p \exp \biggl( \frac i{\hbar} px \biggr) {\rm d}p \\
&= \psi(x) + \frac i{\hbar} \frac1{\sqrt{2\pi}} \,{\rm d}x \int \langle p | \hat p | \psi(0) \rangle \exp \biggl( \frac i{\hbar} px \biggr) {\rm d}p \\
&= \psi(x) + \frac i{\hbar} {\rm d}x \langle x | \hat p | \psi(0) \rangle
\end{aligned} )]
$$\langle x | k^\dag | \psi(0) \rangle = \dfrac i{\hbar} \langle x | \hat p | \psi(0) \rangle $$
$$k=-\dfrac i{\hbar} \hat p $$
$$U({\bf a}) = \exp \biggl( -\dfrac i{\hbar} \hat{\bf p} \cdot {\bf a} \biggr) $$
2.3.2. 회전 변환과 각운동량 연산자
양자 상태의 회전 변환과 각운동량 연산자가 어떻게 얽허있는가를 파악하는 것은 앞선 평행이동 변환과 운동량 연산자의 관계를 활용해 확인할 수 있다. 물론 회전 변환을 기술하기 위해서는 3차원 공간에서의 파동함수를 도입하는 것이 필요하다. 양자 상태의 $$z$$축 미소량 회전 변환을 다음과 같이 위치에 대한 양자 상태로 나타낼 수 있다.
$$\langle R_z({\rm d}\theta){\bf x} | \psi(0) \rangle = \langle x-y\,{\rm d}\theta, \,y+x\,{\rm d}\theta, \,z | \psi(0) \rangle $$
$$| R_z({\rm d}\theta){\bf x} \rangle = U_z^r({\rm d}\theta) | x \rangle = (I+r_z\,{\rm d}\theta) | x \rangle $$
$$U_z^r(\theta) = e^{r_z\theta} $$
$$r_z = -\dfrac i{\hbar} \hat J_z $$
따라서 3차원 공간상에서 양자 상태의 임의의 회전 변환은 다음의 $$n \times n$$ 행렬을 곱하는 것으로 수행할 수 있음을 알 수 있다.
$$U^r(\boldsymbol\theta) = \exp \biggl( -\dfrac i{\hbar} \hat{\bf J} \cdot \boldsymbol\theta \biggr) $$
3. 수학에서의 작용소
해석학에서 무한 차원 벡터 공간과 그 위에서의 작용소를 연구하는 분야를 '''함수해석학'''(functional analysis)이라 한다. 작용소의 성질을 주로 연구하는 작용소 해석(operator analysis)이나 작용소 대수(operator algebra) 등의 분야가 있지만 넓게 보면 이 함수해석학에 포함시킬 수도 있다. 사실상 작용소의 정의만 놓고 보면 어찌 보면 선형대수학에 더 가까운 대수적인 내용이지만, 분야의 명칭이 함수'해석학'인 이유는 현실(?) 해석학과의 관련성에 있다. 함수해석학에서 나오는 여러 가지 종류의 무한 차원 벡터 공간들은 다양한 형태의 함수들의 벡터 공간을 일반화한 것이고, 그 위에서의 작용소는 함수들에 작용하는 미분작용소 등이 가능하다.
3.1. 양자역학과의 관계
상기한 대로의 물리학에서 처음 등장한 연산자의 접근은 수학적으로 엄밀하지 않았다. 일단 물리학에서 연산자의 '기본적인' 정의도 선형 변환, 즉 벡터 공간 $$V$$에 주어진 선형성을 보존하는 함수 $$T: V \rightarrow V$$와 크게 다를 바 없다. 상단에 나온 고윳값 문제의 묘사도, 결국에는 유한 차원에서의 선형대수학에서 그랬던 것처럼, $$T$$를 행렬로 묘사한 게 연산자 $$\hat A$$이고 $$V$$의 원소들을 열벡터로 본 것이 켓 벡터 $$|\psi\rangle$$인 것이다. 세로 방향 행벡터는 브라 벡터에 대응될 것이다. 하지만 과연 무한 차원일 때도 그렇게 할 수 있을까? 유클리드 공간에서만 해도 위 개념을 적용하려면 일단 저기서 $$V$$가 도대체 뭔지, 저 연산자가 함수로 잘 정의되기는 하는지 등 이런 부분에서부터 문제가 생긴다. 이것만 해도 문제인데, 도대체 행렬이란 걸 정의는 할 수 있는 것인지 등 수학자들은 상당히 의심스러웠을 것이다.
다행히도 수학자들은 물리학자들이 떠올린 내용을 어떻게든 엄밀하게 만들어 해석학에 편입시킬 수 있었다. 근현대의 함수해석학이 등장한 계기가 바로 양자역학을 엄밀하게 설명하려는 시도에서 나온 것으로, 함수해석학의 수많은 개념들인 힐베르트 공간, 스펙트럼 등이 여기서 처음 등장하게 된 것. 기존 선형대수학의 상당수의 정의를 수정하고[17] 측도론 등 당대의 최신 이론들을 쑤셔 넣은 결과로, 수학자들은 무한 차원을 다루는 양자역학에서도 행렬의 사고방식을 빈틈없이 엄밀하게 적용하는 것이 (비록 상당히 수정된 형태이긴 해도) 결국에는 가능하다는 것을 보여주었다. 여기서는 상술한 하이젠베르크 묘사의 '기술적 문제'를 해결하는 이러한 프레임워크의 여러 요소들을 비교적 간단하게 소개해보기로 한다. 엄밀한 내용은 수학과 대학원 수준의 함수해석학이 필요함을 감안하여 [18] 생략하였고, 대신 의문점 및 호기심을 풀어보는 데에 중점을 두었다.
3.1.1. 힐베르트 공간
'''힐베르트 공간'''(Hilbert space)은 간단히 얘기하면 에르미트 내적을 가진 벡터 공간 중 완비성(completeness)을 지닌 것이다. 에르미트 내적은 단순히 복소수 위에서의 쌍선형(sesquilinear) 내적으로, 보통의 좌표로 설명되는 내적을 포함하지만 굳이 좌표에 국한될 필요는 없고 내적의 공리만을 만족시키면 된다. 자세한 것은 에르미트 내적 문서를 참고하자. 완비성의 경우 임의의 코시 수열이 수렴한다는 수학적 정의인데, 모든 극한을 포함한다고 직관적으로 생각할 수 있다.
양자역학에서 얘기하는 연산자의 정의역인 벡터 공간은 이 힐베르트 공간이 되어야 한다는 조건이 붙는다. 슈뢰딩거 묘사에서의 에르미트 내적은 보통의 함수의 내적이고, 이 때문에 여기서 생각하는 함수들은 크기의 제곱의 적분이 유한한, 즉 $$L^2$$ 공간에 있어야 한다는 한다는 조건이 붙는다. 일반적인 하이젠베르크 묘사의 경우 어떤 힐베르트 공간이 되어도 상관은 없다.
추상적으로 보이지만, 어찌 보면 파동함수가 만족해야 할 나름 당연한 성질들로, 어떻게 보면 내적이 유한해야 한다는 성질은 파동함수의 성질 중 확률 $$1$$에 대한 성질을 옮겨왔다고 볼 수 있다.[19] 파동함수들의 직교성과 중첩에 대한 얘기는 벡터 공간에 대한 것이다. 다만, 파동함수가 굳이 공간에서의 실제 '함수', 즉 $$L^2$$ 공간으로 제약될 필요가 없다는 사실은 (즉, 슈뢰딩거 묘사로는 불충분하다는 것은) 위에도 설명한 바가 있으므로, 하이젠베르크 묘사에서는 임의의 힐베르트 공간으로 제약을 풀어주게 된다.
3.1.2. 비유계 작용소
물리에서의 연산자를 단순히 힐베르트 공간의 선형변환으로만 정의하기에는 한계가 있다. 당장에 비교적 간명한 슈뢰딩거 묘사에서의 파동함수 위치 표현법을 쓴다고 할 때도, 위에 소개된 위치 연산자, 운동량 연산자부터가 $$L^2$$ 위에서는 잘 정의된 함수가 아니다. 운동량 연산자는 사실상 미분인데, $$L^2$$ 공간에는 널리고 널린 게 미분불가능한, 심지어 불연속인 함수들이다. 위치 연산자 $$\hat{x}_i = x_i$$도 겉으로는 $$x_i$$를 곱하는 무해해 보이는 조작이지만, 공간이 제한되어 있지 않다면 $$L^2$$ 위에서는 닫혀 있는 조작이 아니다. [* 예시로 $$f(x) = x^{-1}$$은 [math([1,\infty))]에서 제곱의 적분이 유한하지만, [math(xf(x) =1)]은 그렇지 않다.] 전체 공간을 매끄러운 함수들의 공간 $$C^{\infty}$$으로 정하면 미분은 잘 정의된 작용소가 되긴 하지만, 여기까지 와서 공간의 정의를 바꾸는 것은 파동함수의 근본적인 전제 자체를 부정해버리는 일이다.
이를 피하기 위해서 수학자들은 '''비유계 작용소'''(unbounded operator)라는 개념을 도입한다. 간단히 말하면 비유계 작용소는 $$T : V \rightarrow V$$의 선형변환 뿐만이 아니라, $$V$$의 조밀한(dense) 부분공간 $$D$$에 대해 $$T : D \rightarrow V$$의 작용소로 보는 것이다. [20] 조밀함의 정의는 위상수학에서의 그것으로, 여기서는 임의의 $$V$$의 원소를 $$D$$의 원소로 에르미트 내적에 대해 근사할 수 있다는 성질로 번역된다[21] . 보통의 작용소도 ($$D=V$$인 경우이므로) 비유계 작용소에 포함된다. 위의 위치 연산자와 운동량 연산자의 경우 이 모두 비유계 작용소로 해석할 수 있는데, 미분의 경우 매끄러운 함수들의 공간은 $$L^2$$ 위에서 조밀하다는 것을 보일 수 있고 [22] , 위치 연산자의 경우는 유한한 구간을 제외하면 0인 (엄밀하게 표현하면 compact support를 지니는) 연속함수들의 공간 $$C_c^0$$을 정의역으로 잡으면 된다.
이 비유계 작용소의 의미는 작용소가 굳이 공간 전체에서 정의될 필요는 없고, 웬만한 곳에서 정의되기만 해도 충분하다는 것이다. 무한 차원 위에서 조밀한 부분공간은 '웬만한'이라는 표현을 쓰기에는 매우 작아질 수도 있긴 하지만, 적어도 그 위에서의 작용소 묘사가 전체 작용소를 결정하기는 충분하다. 이것이 비유계 작용소의 정의에서 정확한 정의역 $$V_0$$의 정의가 그다지 중요하지 않은 이유이기도 하다. [23] 이는 어찌 보면 선형 변환의 함수로서의 정의를 근본부터 뒤튼 것처럼 보일 수도 있겠지만, 애초에 물리에선 연산자에 대해 함수로서의 의미를 거의 고려하지 않았기 때문에 큰 상관은 없다. 위의 경우에도 운동량을 '미분'으로 생각하긴 하지만, 파동함수를 미분해서 나온 함수가 도대체 무엇인지에 대한 의미는 전혀 묻지 않는 것처럼. 즉 정의 자체는 불편함을 해결하는 도구 정도로서의 역할밖에 하지 않는다. 중요한 것은 일반적 작용소의 다양한 성질들이 (특히 다음에 서술할 스펙트럼) 이 비유계 작용소에 대해서도 일반화가 가능하다는 것이다.
3.1.3. 스펙트럼
작용소의 '''스펙트럼'''(spectrum)이라는 개념은 고윳값 문제의 고윳값의 일반화로 생각될 수 있다. 스펙트럼의 일반적인 정의는 작용소 $$T - \lambda I$$가 가역인 복소수들의 여집합이다. 선형대수학을 배웠다면 들어 봤을 스펙트럼 정리에 나온 그 스펙트럼이 이 개념으로, 유한 차원 벡터 공간이면 스펙트럼은 고윳값과 동일하다. 무한 차원의 경우, 고윳값이 스펙트럼이 되긴 하지만, 그 역은 성립하지 않는다. 비유계 작용소의 경우 저 '가역'이라는 부분이 상당히 섬세해져야 하고, 이는 매우 기술적인 부분이다. [24]
사실 위에서 서술한 고윳값과 고윳값에 대한 내용은 기존의(즉, 유한 차원에서의) 고윳값/고유벡터 정의대로 딱딱하게 생각하면 전혀 맞지 않는다. 비교적 단순한 예시인 위치 연산자에서도 위치 연산자는 어떤 고윳값도 갖지 않는다. 1차원 슈뢰딩거 묘사에서 $$\hat{x} | \psi \rangle = \lambda | \psi \rangle$$의 문제를 위치에 대한 파동함수로 보면, 그 파동함수는 모든 $$x$$에 대해 $$x\psi(x) = \lambda \psi(x)$$를 만족해야 하는데, 즉 $$x=\lambda$$를 제외하면 함수값이 0이어야 하고 이게 되는 함수는 ($$L^2$$에서는) $$\psi(x) = 0$$ 밖에 없다. '물리학적'으로는 디랙 델타 함수 $$\psi(x) = \delta(x - \lambda)$$가 맞다고 하고 싶지만, 함수도 아닌 디랙 델타가 $$L^2$$일 리는 없다. 비슷하게도 운동량 연산자 $$\hat{p} = -i \hbar \partial_x$$에 대해서도 고윳값 $$\lambda$$에 대한 고유벡터라고 우기고 싶은 $$\exp( i \lambda x / \hbar)$$도 수학적으로는 힐베르트 공간의 원소는 될 수 없다.
하지만 스펙트럼의 개념을 동원하면 물리학적 직관이 요구하는 답을 수학에서도 맞게 해줄 수 있다. (1차원) 위치 연산자의 스펙트럼을 살펴보면, 만약 $$\lambda$$가 실수가 아닌 복소수라면 $$x - \lambda$$는 항상 0이 아니므로, 연산자 $$(\hat{x} - \lambda)^{-1}$$, 즉 $$\psi(x) \mapsto (x-\lambda)^{-1} \psi(x)$$는 잘 정의된 연산자이다. 즉 스펙트럼은 실수집합의 부분집합이 된다. 역으로 임의의 실수 $$\lambda$$에 대해 $$\hat{x} - \lambda$$는 가역이 될 수 없는데, 만약 저 연산자의 역 $$S$$가 존재한다고 하면 $$(\hat{x} - \lambda)S =I $$이므로 $$S$$는 $$\psi(\lambda) \neq 0$$인 함수에 대해서는 정의될 수 없어서 모순이 된다. 따라서 위치 연산자의 스펙트럼은 실수 전체가 된다. 비슷하게도 운동량 연산자의 스펙트럼도 실수 전체가 됨을 증명할 수 있다.
그럼 이 스펙트럼에 대응하는 고유벡터 비슷한 무언가의 정체도 설명할 수 있을까? 물론 가능하다. 하지만 여기서부터는 엄밀한 내용을 서술하려면 매우 어려워진다. 선형대수학의 (유한 차원) 에르미트 연산자에 대한 스펙트럼 정리는 모든 에르미트 연산자는 유니타리 대각화가 가능하다는, 즉 고윳값과 각각의 고윳값에 대응하는 정규직교기저를 찾을 수 있다는 내용이다. 힐베르트 공간 위에서의 에르미트 연산자, 즉 물리량을 서술하는 연산자의 경우는, 이 스펙트럼 정리가 일반화되어 성립한다. 다만 고윳값은 스펙트럼으로 바뀌어야 하고, 정규직교기저는... 이 일반화된 직교대각화를 설명하는 resolution of identity가 측도 정도는 기본으로 깔고 가야 하는 해석학의 고급 개념이다.
대신 역으로 저 위치 연산자에서 디랙 델타 $$\delta(x-\lambda)$$가 실제로 $$\lambda$$에 대한 기저 역할을 한다고 믿고(!), 일반적인 정규직교기저도 저렇게 생겼다고 생각하는 방법은 있다. 다른 예를 들면 운동량 연산자의 경우는 디랙 델타 대신에 $$\exp( i \lambda x / \hbar)$$들이 같은 역할을 한다. 슈뢰딩거 묘사에서 운동량 좌표를 쓰면 위치 연산자랑 서술이 거의 동일해진다. 한편 저 스펙트럼 정리의 행렬 상사 형태 $$A = PDP^{-1}$$ 느낌을 생각한다면, 이 위치-운동량의 동일성은 푸리에 변환이 힐베르트 공간의 동형사상(isomorphism)으로서 저 직교행렬 $$P$$에 대응된다고 비유할 수 있다. 즉 스펙트럼 정리의 일반 버전은 하이젠베르크 묘사에서는 '''임의의 물리량에 대해서도 그 물리량을 기준으로 한 '정규직교기저'가 존재한다'''라는 사실을 말하고 있다고 나름대로 해석될 수 있다. 단순히 위치 물리량에 대한 정규직교기저 표현이 위치 표현일 뿐이고, 운동량 물리량에 대해서도 비슷한 것이지, 굳이 위치나 운동량이 특별할 필요는 없고 어떤 물리량을 가져와도 스펙트럼 정리의 덕택으로 저렇게 표현하는 것이 가능하다는 것이다. 물론 저 해석이 전부는 아닌 게, 대각행렬 $$D$$의 '중복도'에 대한 개념이 아직 빠져 있기 때문이다. 각각의 정규직교기저가 얼마나 '세어지는지'는 연속적인 스펙트럼의 경우 측도의 개념을 가져와야 엄밀하게 할 수 있다. 정규직교기저의 집합에 일종의 '적분' 방식을 주고, 이 적분에 따라서 관측에 따른 파동함수의 붕괴에 대한 확률분포가 결정된다고 말할 수 있다.
물리학자들에게는 다음의 수식이 좀더 익숙할 수도 있을 것이다. 예로 위치 연산자의 '정규직교기저'
$$\displaystyle \hat{x} | x \rangle = x | x \rangle $$
[17] 아래를 보면 알겠지만, 심지어 연산자가 함수라는 정의도 경우에 따라서는 수정된다.[18] 예를 들어서, 비유계 연산자는 Rudin 3종 세트 중 함수해석학 책 맨 뒷부분에 등장한다.[19] 일단 크기의 제곱의 합이 유한해야 정규화를 할 수 있기 때문에...[20] 정의역의 조밀성 가정이 없는 관습도 빈번하게 사용되고, 이럴 때는 본문의 경우를 조밀하게 정의된(densely defined) 연산자라고 칭한다.[21] 엡실론-델타 식으로 옮기면 "어떤 $$\epsilon>0$$과 $$x \in V$$에 대해서도, $$y \in D$$가 존재해 $$||x - y|| < \epsilon$$을 만족시킬 수 있는"[22] 사실 $$L^2$$ 공간이 뭔지 정확히 배우려면 측도론이 필요해서, 이걸 배우지 않는 곳에선 이에 대한 증명은 넘어가는 경우가 많다.[23] 물론 이 문장은 조밀하게 정의된 경우에 한해서이다.[24] $$S$$는 (비유계가 아닌) 일반 작용소로 정의되어야 하고, 치역이 $$T$$의 정의역에 포함되어야 한다. 즉 $$(T- \lambda I)S = I_V$$, $$S(T-\lambda I) = I_D$$.
$$\displaystyle \hat{1} = \int |x \rangle \langle x| {\rm d}x, \quad \hat{x} =\int x |x \rangle \langle x| {\rm d}x $$
$$\displaystyle | \psi \rangle = \int \langle x| \psi \rangle |x \rangle {\rm d}x = \int \psi(x) |x \rangle {\rm d}x $$