선형대수학의 기본정리
1. 개요
2. 설명
3. 선형대수학의 기본정리
4. 증명
4.1. 선형성
4.1.1. $$\displaystyle \mathsf{\Psi}_{\mathfrak{C}}^{\mathfrak{B}} $$는 선형변환
4.1.2. $$ \mathsf{\Phi}_{\mathfrak{C}}^{\mathfrak{B}} $$는 선형변환
4.2. 전단사
4.2.1. $$ \mathsf{\Psi}_{\mathfrak{C}}^{\mathfrak{B}} $$는 전단사
4.2.2. $$ \mathsf{\Phi}_{\mathfrak{C}}^{\mathfrak{B}} $$는 전단사
4.3. 두 대응 간의 역함수 관계
4.4. 합성과 곱의 관계
5. 기저의 변환
6. 같이 보기
1. 개요
선형대수학의 기본정리란, 두 유한차원 벡터공간 사이에 정의된 선형변환의 집합과 $$m\times n$$ 행렬의 집합에 덧셈과 스칼라배, 그리고 (잘 정의된) 합성을 보존하는 일대일 대응 함수[1] 가 존재한다는 것이다. 이 정리에 "기본정리"라는 이름까지 붙은 이유는, 선형변환을 마치 행렬처럼, 행렬을 마치 선형변환처럼 다룰 수 있다는 것을 이 정리가 보장해주기 때문이다.
행렬과 선형사상의 동치성은 선형대수학의 핵심 주제이긴 하지만, 이것을 '선형대수학의 기본정리'라는 이름으로 부르는 것은 의외로 일부 문헌에 한정되어 있다. 이 문서의 서술은 주로 이인석 저 "학부 대수학 강의 1: 선형대수와 군"을 따르고 있지만, 이를 제외한 대부분의 교재에서는 이 동치성에 별도의 이름을 붙이지 않는다. 외서의 경우에는 Strang의 교재[2] 처럼 선형대수학의 기본정리를 차원 정리에 연결하는 경우가 훨씬 빈번하다. 나무위키 내의 다른 선형대수학 문서들도 비슷하게 "선형대수와 군"에 영향을 많이 받았기 때문에 이 '선형대수학의 기본정리'라는 이름이 많이 쓰이긴 하지만, '''범용적인 명칭은 아니므로''' 주의하자. 이 문서의 표기법도 "선형대수와 군"을 따르기 때문에 다른 곳에선 얼마든지 대체될 수 있다.
2. 설명
2.1. 특수한 경우
이 정리의 아이디어를 이해하기 위해서 우선 가장 간단한 경우를 살펴보자. 즉, 체 $$ F $$가 주어져 있을 때, $$ F^n $$ 에서 $$ F^m $$로 가는 선형 변환 $$ L $$을 생각하자. 이 선형 변환이 대응될 행렬을 $$ A $$라 했을 때, 모든 벡터에 대해 $$ L(v) = Av $$가 성립해야 한다. 그런데 $$ v $$의 좌표를 $$ \left( v_1, \cdots, v_n\right)^t $$[3] 라고 하면 $$ Av = [A]^{1} v_{1} + \cdots + [A]^{n} v_{n} $$ (단, $$ [A]^i $$들은 A의 i번째 열이다)가 성립한다. 이 때 $$ F^n $$의 표준 기저를 $$ \mathcal{E} = \left\{ e_1, \cdots, e_n \right\} $$라고 하면, $$ L(e_i) = Ae_i $$는 $$i$$번째 열 $$ [A]^i $$와 같을 수밖에 없다.[4] 즉, $$ L $$에 대응되는 행렬 $$ A $$는 '''사실 $$ i $$번째 열이 $$ L(e_i) $$인 행렬이다!'''
아래의 내용도 표현이 좀 복잡할 뿐이지 본질적인 아이디어는 이 특수한 경우에서 벗어나지 않는다. 다만, 현재 상황에서는 주어진 선형 변환의 정의역과 공역이 $$ F^n $$과 $$ F^m $$라는 가장 기본적인 벡터 공간이고, 행렬을 대응시키기 위해 사용하는 기저도 가장 다루기 편한 표준 기저로 주어져 있다. 아래에서 선형 변환과 행렬을 대응시키기 위해 사용하는 복잡한 함수들은 일반적인 상황을 가장 특수하고 다루기 쉬운 현재 상황으로 바꾸기 위한 것들이다.
2.2. 일반적인 경우
체 $$ F $$ 위의 벡터 공간 $$ V, W $$와 선형 변환 $$ L:V\rightarrow W$$가 주어져 있다고 하자. 이 일반적인 경우에도 우리는 $$ A $$를 위와 같이 정의할 것이다. 하지만 그러기 위해서는 위 문단에서의 표준 기저 $$ \mathcal{E} $$에 대응하는 것이 있어야 하므로, $$ V $$의 기저 $$ \mathfrak{B} = \left\{ v_1, \cdots, v_n\right\} $$와 $$ W $$의 기저 $$\mathfrak{C} = \left\{ w_1, \cdots, w_m \right\} $$가 주어져 있다고 하자[5] .
그런데 $$ L(v_i) $$가 열벡터라는 보장은 없으므로 $$ A = (L(v_1), \cdots, L(v_n) )$$이라고 정의하는 것은 애초에 말이 되지 않는다. 이 문제를 해결하기 위해서는 $$ L(v_i) $$ 대신 $$ L(v_i) $$의 $$ \mathfrak{C} $$에 대한 좌표를 사용해야 한다. 좌표의 정의를 모르는 독자는 아래 내용을 참고하자. 어찌 됐든, 이제 우리는 $$ L $$에 대응되는 $$ A $$를 $$ ( [L(v_1)]_{\mathfrak{C}}, \cdots, [L(v_n)]_{\mathfrak{C}} ) $$ 로 정의하고, $$ [L]_{\mathfrak{C}}^{\mathfrak{B}} $$라고 표기하며[6] 이를 선형 변환 $$ L $$의 행렬 표현이라 부른다.
【좌표의 정의】
【기저의 순서에 관한 문제】
그러면 이 행렬 $$ A $$가 선형 변환 $$ L $$에 대응한다는 것은 무엇을 의미할까? 위와 똑같이 $$ L(v) = A v $$라고 할 수는 없다. $$ v $$는 열 벡터가 아니기 때문이다. 물론 해결법은 위와 마찬가지로 기저에 대한 좌표를 사용하는 것이다. 즉 $$ L $$이 $$ A $$에 대응된다는 것은 $$ L(v) $$의 $$ \mathfrak{C} $$에 대한 좌표가 $$ A [v]_{\mathfrak{B}} $$로 표현된다는 것이다. 이 사실이 참이라는 것은 $$ [L(v)]_{\mathfrak{C}} = [L(c_1 v_1 + \cdots + c_n v_n)]_{\mathfrak{C}} =$$ $$ c_1 [L(v_1)]_{\mathfrak{C}} + \cdots + c_n [L(v_n)]_{\mathfrak{C}} = $$ $$c_1 [A]^1 + \cdots + c_n [A]^n = A [v]_{\mathfrak{B}} $$[8] 라는 계산을 통해 알 수 있다. 결론을 깔끔한 수식으로 나타내면 아래와 같다.
$$ \displaystyle [L(v)]_{\mathfrak{C}} = [L]_{\mathfrak{C}}^{\mathfrak{B}} [v]_{\mathfrak{B}} $$
3. 선형대수학의 기본정리
3.1. 설명
이제 기본적인 아이디어에 대한 설명은 끝났으니 선형대수학의 기본정리의 내용에 대해 설명한다. 선형 변환 $$ L:V \to W $$는 $$ V $$에서 $$ W $$로 가는 선형 변환들의 집합 $$ \mathfrak{L}(V, W) $$의 원소이고, 그에 대응되는 행렬 $$ [L]_{\mathfrak{C}}^{\mathfrak{B}} $$는 $$ F $$ 위의 $$ m \times n $$ 행렬들의 집합 $$ \mathfrak{M}_{m, n}(F) $$의 원소이다. 그렇다면, 선형 변환 $$ L $$를 $$ [L]_{\mathfrak{C}}^{\mathfrak{B}} $$에 대응시키는 것은 $$ \mathfrak{L}(V, W) $$에서 $$ \mathfrak{M}_{m, n}(F) $$로 가는 함수라고 할 수 있다. 선형대수학의 기본정리는 이 대응이 사실은 두 벡터 공간 사이의 '''동형 사상'''이라고 주장한다. 즉, 각각의 선형 변환 $$ L $$를 그 행렬 표현 $$ [L]_{\mathfrak{C}}^{\mathfrak{B}} $$와 같은 대상으로 보면 두 벡터 공간은 본질적으로 동일한 벡터 공간이란 뜻이다.
이 대응이 동형 사상이라는 것은 우선 선형 변환 $$ L + M $$이 행렬 $$ [L]_{\mathfrak{C}}^{\mathfrak{B}} + [M]_{\mathfrak{C}}^{\mathfrak{B}} $$에 대응되고, $$ c L $$은 행렬 $$ c [L]_{\mathfrak{C}}^{\mathfrak{B}} $$에 대응된다는 뜻이다. 또한, 이 대응이 역함수가 존재하는 일대일 대응이란 뜻이기도 하다. 그렇다면 이 대응의 역함수는 무엇일까? 위에서의 논의를 생각해보면 역함수는 행렬 $$ A $$를 $$ [L_{A} (v)]_{\mathfrak{C}} = A [v]_{\mathfrak{B}} $$로 정의되는 선형 변환 $$ L_A $$에 대응시켜야 함을 알 수 있다.
추가적으로, 이 정리는 두 선형 변환의 합성 $$ M \circ L $$에 대응되는 행렬이 무엇인지도 알려준다. 선형 변환 $$ L $$와 $$ M $$가 각각 행렬 $$ A $$, $$ B $$에 대응된다고 할 때, $$ BAx = B(Ax) $$란 사실을 생각하면 $$ L_B $$와 $$ L_A $$의 합성은 $$ L_{BA} $$에 해당할 것임을 예측할 수 있으며, 따라서 $$ M \circ L $$는 $$ BA $$에 대응될 것이다.
3.2. 진술
체 $$ F $$ 위의 유한 차원 벡터 공간 $$ V, W $$과 그 기저 $$ \mathfrak{B} = \left\{ v_1, \cdots, v_n\right\} $$, $$\mathfrak{C} = \left\{ w_1, \cdots, w_m \right\} $$가 주어져 있다고 하자.
그리고 함수 $$ \mathsf{\Phi}_{\mathfrak{C}}^{\mathfrak{B}} : \mathfrak{M}_{m, n}(F) \rightarrow \mathfrak{L}(V, W) $$와 $$ \mathsf{\Psi}_{\mathfrak{C}}^{\mathfrak{B}} : \mathfrak{L}(V, W) \rightarrow \mathfrak{M}_{m, n}(F) $$를 다음과 같이 정의한다.
- $$ \mathsf{\Phi}_{\mathfrak{C}}^{\mathfrak{B}} (A) = L_{A}$$, 여기서 $$L_A$$는 $$[L_{A}(v)]_\mathfrak{C} = A[v]_\mathfrak{B} $$를 만족하는 $$ \mathfrak{L}(V, W) $$의 원소
- $$ \mathsf{\Psi}_{\mathfrak{C}}^{\mathfrak{B}} (L) = [L]_{\mathfrak{C}}^{\mathfrak{B}} $$
또한, 유한 차원 벡터 공간 $$ U $$와 그 기저 $$ \mathfrak{D} = \left\{ u_1, \cdots, u_r\right\} $$를 추가로 생각하면 임의의 $$ A \in \mathfrak{M}_{m, n}(F) $$, $$ B \in \mathfrak{M}_{r, m}(F) $$에 대해 $$ L_{BA} = L_B \circ L_A$$[9] 가 성립하고, 임의의 $$ L \in \mathfrak{L}(V, W) $$와 $$ M \in L(W, U) $$에 대해 $$ [M \circ L]_{\mathfrak{D}}^{\mathfrak{B}} = [M]_{\mathfrak{D}}^{\mathcal{C}} [L]_{\mathfrak{C}}^{\mathfrak{B}} $$가 성립한다.
4. 증명
아래 증명은 수식이 많아서 복잡하게 보일 수는 있으나, 사실상 선형변환과 행렬의 성질을 반복적으로 적용할 뿐인 기계적인 증명임을 생각하고 보면 크게 어렵지는 않을 것으로 생각된다.
4.1. 선형성
4.1.1. $$\displaystyle \mathsf{\Psi}_{\mathfrak{C}}^{\mathfrak{B}} $$는 선형변환
임의의 $$\displaystyle i \in \left\{ 1, \cdots, n \right\} $$와 $$ L, M \in \mathfrak{L}(V, W) $$에 대해
$$\displaystyle (L+M)(v_i) = L(v_i) + M(v_i) $$
이므로,$$ [(L+M)(v_i)]_\mathfrak{C} = [L(v_i)]_\mathfrak{C} + [M(v_i)]_\mathfrak{C}$$
이다. 이로부터 행렬 $$\displaystyle [L+M]_{\mathfrak{C}}^{\mathfrak{B}} $$의 $$ i $$번째 열은 $$[L]_{\mathfrak{C}}^{\mathfrak{B}} $$의 $$ i $$번째 열과 $$[M]_{\mathfrak{C}}^{\mathfrak{B}} $$의 $$ i $$번째 열의 합임을 알 수 있다.그러면 $$\displaystyle [L+M]_{\mathfrak{C}}^{\mathfrak{B}} = [L]_{\mathfrak{C}}^{\mathfrak{B}} + [M]_{\mathfrak{C}}^{\mathfrak{B}} $$가 되어
$$\displaystyle \mathsf{\Psi}_{\mathfrak{C}}^{\mathfrak{B}} (L+M) = \mathsf{\Psi}_{\mathfrak{C}}^{\mathfrak{B}} (L) + \mathsf{\Psi}_{\mathfrak{C}}^{\mathfrak{B}} (M) $$
이다.또한, 임의의 $$ c \in F $$에 대해
$$\displaystyle [(cL)(v_i)]_\mathfrak{C} = c[L(v_i)]_\mathfrak{C} $$
이므로 $$ [cL]_{\mathfrak{C}}^{\mathfrak{B}} = c[L]_{\mathfrak{C}}^{\mathfrak{B}} $$가 되어$$\displaystyle \mathsf{\Psi}_{\mathfrak{C}}^{\mathfrak{B}} (cL) = c \mathsf{\Psi}_{\mathfrak{C}}^{\mathfrak{B}} (L) $$
이다. 따라서 $$\displaystyle \mathsf{\Psi}_{\mathfrak{C}}^{\mathfrak{B}} $$는 선형 변환이다.4.1.2. $$ \mathsf{\Phi}_{\mathfrak{C}}^{\mathfrak{B}} $$는 선형변환
임의의 $$ A, B \in \mathfrak{M}_{m, n}(F) $$와 $$ v \in V $$에 대해
$$\displaystyle [L_{A+B} (v)]_\mathfrak{C} = (A+B)[v]_\mathfrak{B} = A[v]_\mathfrak{B} + B[v]_\mathfrak{B} = [L_{A} (v)]_\mathfrak{C} + [L_{B} (v)]_\mathfrak{C} $$
이므로 $$L_{A+B}(v) = L_{A}(v) + L_{B}(v) $$가 되어 $$ L_{A+B} = L_{A} + L_{B}$$이다. 즉,$$\displaystyle \mathsf{\Phi}_{\mathfrak{C}}^{\mathfrak{B}} (A+B) = \mathsf{\Phi}_{\mathfrak{C}}^{\mathfrak{B}} (A) + \mathsf{\Phi}_{\mathfrak{C}}^{\mathfrak{B}} (B) $$
이다.그리고 임의의 $$ c \in F $$에 대해
$$ [L_{cA} (v)]_\mathfrak{C} = (cA)[v]_\mathfrak{B} = c[L_{A}(v)]_\mathfrak{C} $$
이므로 $$ L_{cA} (v) = cL_{A}(v) $$가 되어 $$ L_{cA} = cL_A $$이다. 즉,$$ \mathsf{\Phi}_{\mathfrak{C}}^{\mathfrak{B}} (cA) = c \mathsf{\Phi}_{\mathfrak{C}}^{\mathfrak{B}} (A)$$
이다. 따라서 $$ \mathsf{\Phi}_{\mathfrak{C}}^{\mathfrak{B}} $$는 선형 변환이다.4.2. 전단사
4.2.1. $$ \mathsf{\Psi}_{\mathfrak{C}}^{\mathfrak{B}} $$는 전단사
우선 $$ \mathsf{\Psi}_{\mathfrak{C}}^{\mathfrak{B}} $$가 전단사임을 확인하자. 먼저 단사임을 보이기 위해 $$\displaystyle \mathsf{\Psi}_{\mathfrak{C}}^{\mathfrak{B}}(L)=\mathsf{\Psi}_{\mathfrak{C}}^{\mathfrak{B}}(M) $$인 $$ L, M \in \mathfrak{L}(V, W) $$가 있다고 가정하자. 그러면 임의의 $$ i \in \left\{1, \cdots, n\right\} $$에 대해 $$ [L]_{\mathfrak{C}}^{\mathfrak{B}}$$과 $$ [M]_{\mathfrak{C}}^{\mathfrak{B}} $$의 $$ i $$번째 열이 같으므로 $$ [L(v_i)]_{\mathfrak{C}} = [M(v_i)]_{\mathfrak{C}} $$이고, 따라서 $$ L(v_i) = M(v_i) $$이다. 그런데 임의의 $$ v \in V $$를 택하면 $$ \mathfrak{B} $$가 $$ V $$의 기저이므로 $$ v = \sum_{i=1}^{n} {c_i v_i} $$인 $$ c_1, \cdots, c_n \in F$$가 존재한다. 따라서
$$\displaystyle L(v) = L\left(\sum_{i=1}^{n} { c_i v_i} \right) = \sum_{i=1}^{n} {c_i L(v_i)} = \sum_{i=1}^{n} {c_i M(v_i)} = M\left(\sum_{i=1}^{n} {c_i v_i} \right) = M(v) $$
이다. 즉, $$ L = M $$이 되므로 $$ \mathsf{\Psi}_{\mathfrak{C}}^{\mathfrak{B}} $$는 단사이다.이제 $$ \mathsf{\Psi}_{\mathfrak{C}}^{\mathfrak{B}} $$가 전사임을 보이기 위해서 임의의 $$ A \in \mathfrak{M}_{m, n}(F)$$를 택하자. $$ A $$의 $$ i $$번째 열을 $$ [A]^i $$로 표기하고 선형 변환 $$ L \in \mathfrak{L}(V, W) $$를 $$ [L(v_i)]_\mathfrak{C} = [A]^i $$로 주면[10] , $$ [L]_{\mathfrak{C}}^{\mathfrak{B}} $$는 $$ i $$번째 열이 $$ [A]^i $$인 행렬이므로 $$ [L]_{\mathfrak{C}}^{\mathfrak{B}} = A $$이다. 따라서 $$ \mathsf{\Psi}_{\mathfrak{C}}^{\mathfrak{B}} $$는 전사이다.
4.2.2. $$ \mathsf{\Phi}_{\mathfrak{C}}^{\mathfrak{B}} $$는 전단사
이제 $$ \mathsf{\Phi}_{\mathfrak{C}}^{\mathfrak{B}} $$가 전단사임을 보이자. 먼저 단사임을 보이기 위해 $$\displaystyle \mathsf{\Phi}_{\mathfrak{C}}^{\mathfrak{B}} (A) = \mathsf{\Phi}_{\mathfrak{C}}^{\mathfrak{B}} (B) $$인 $$ A, B \in \mathfrak{M}_{m, n}(F)$$가 있다고 가정하자. 그러면 임의의 $$ i \in \left\{ 1, \cdots, n \right\} $$에 대해 $$ [L_{A} (v_i)]_\mathfrak{C} = A[v_i]_\mathfrak{B} = A e_i = [A]^i $$이고 마찬가지로 $$ [L_{B} (v_i)]_\mathfrak{C} = [B]^i $$이므로 $$ A $$와 $$ B $$는 각각의 열이 같은 행렬이다. 즉, $$ A=B $$이다. 따라서 $$ \mathsf{\Phi}_{\mathfrak{C}}^{\mathfrak{B}} $$는 단사이다.
이제 $$ \mathsf{\Phi}_{\mathfrak{C}}^{\mathfrak{B}} $$가 전사임을 보이기 위해 임의의 $$ L \in L (V, W) $$를 택하자. 그리고 행렬 $$ A $$를 $$ A = \begin{bmatrix} [L(v_1)]_\mathfrak{C} & \cdots & [L(v_n)]_\mathfrak{C} \end{bmatrix} $$로 주면 $$ [L_{A} (v_i)]_\mathfrak{C} = A[v_i]_\mathfrak{B} = A e_i = [A]^i = [L(v_i)]_\mathfrak{C} $$이므로 $$ L_{A} (v_i) = L (v_i) $$이다. 따라서 위에서 보인 것과 마찬가지의 방법으로 $$ L_A = L $$임을 보일 수 있다. 그러므로 $$ \mathsf{\Phi}_{\mathfrak{C}}^{\mathfrak{B}} $$는 전사이다.
4.3. 두 대응 간의 역함수 관계
임의의 $$ L \in L (V, W) $$와 $$ v \in V $$를 택하자. 그러면
$$\displaystyle [\mathsf{\Phi}_{\mathfrak{C}}^{\mathfrak{B}} \circ \mathsf{\Psi}_{\mathfrak{C}}^{\mathfrak{B}} (L) (v)]_\mathfrak{C} = [\mathsf{\Phi}_{\mathfrak{C}}^{\mathfrak{B}} ([L]_{\mathfrak{C}}^{\mathfrak{B}} ) (v)]_\mathfrak{C} = [L]_{\mathfrak{C}}^{\mathfrak{B}} [v]_\mathfrak{B} = [L(v)]_\mathfrak{C} $$
이므로 $$ \mathsf{\Phi}_{\mathfrak{C}}^{\mathfrak{B}} \circ \mathsf{\Psi}_{\mathfrak{C}}^{\mathfrak{B}} (L) = L $$이다. 따라서$$\displaystyle \mathsf{\Phi}_{\mathfrak{C}}^{\mathfrak{B}} \circ \mathsf{\Psi}_{\mathfrak{C}}^{\mathfrak{B}} = \mathrm{id}_{L (V, W)} $$
이다.반대 방향을 보이기 위해 임의의 $$ A \in \mathfrak{M}_{m, n}(F) $$를 택하자. 그러면 $$ \mathsf{\Psi}_{\mathfrak{C}}^{\mathfrak{B}} \circ \mathsf{\Phi}_{\mathfrak{C}}^{\mathfrak{B}} (A) $$의 $$ i $$번째 열은 $$ [ \mathsf{\Phi}_{\mathfrak{C}}^{\mathfrak{B}} (A) (v_i) ]_\mathfrak{C} = A[v_i]_\mathfrak{B} = A e_i = [A]^i $$이다. 즉, $$ \mathsf{\Psi}_{\mathfrak{C}}^{\mathfrak{B}} \circ \mathsf{\Phi}_{\mathfrak{C}}^{\mathfrak{B}} (A) $$와 $$ A $$는 각각의 열이 같은 행렬이므로 같은 행렬이다. 따라서
$$ \mathsf{\Psi}_{\mathfrak{C}}^{\mathfrak{B}} \circ \mathsf{\Phi}_{\mathfrak{C}}^{\mathfrak{B}} = \mathrm{id}_{\mathfrak{M}_{m, n}(F)} $$
이다.4.4. 합성과 곱의 관계
임의의 $$ L \in \mathfrak{L}(V, W) $$와 $$ M \in \mathfrak{L}(W, U) $$를 택하고 $$ P = [L]_{\mathfrak{C}}^{\mathfrak{B}} $$, $$ Q = [M]_{\mathcal{D}}^{\mathfrak{C}} $$라고 하자. $$ P = \left(a_{ij} \right)_{m\times n} $$라고 하면, 임의의 $$ k \in \left\{1, \cdots, n\right\} $$에 대해
$$\displaystyle Q[P]^k = \sum_{i=1}^{m} {a_{ik} [Q]^i} = \sum_{i=1}^{m} {a_{ik} [M(w_i)]_\mathcal{D} } = \left[ \sum_{i=1}^{m} {a_{ik} M(w_i)} \right]_\mathcal{D} = \left[ M \left( \sum_{i=1}^{m} { a_{ik} w_i } \right) \right]_{\mathcal{D}} = \left[M(L(v_k)) \right]_{\mathcal{D}}$$
이다. 따라서 $$ QP $$의 $$ k $$번째 열은 $$ [(M \circ L) (v_k)]_\mathcal{D} $$이다. 즉, $$ QP $$와 $$ [M \circ L]_{\mathcal{D}}^{\mathfrak{B}} $$는 모든 열이 같으므로 같은 행렬이다. 결국$$ [M \circ L]_{\mathcal{D}}^{\mathfrak{B}} = [M]_{\mathcal{D}}^{\mathfrak{C}} [L]_{\mathfrak{C}}^{\mathfrak{B}} $$
이다.이제 후자를 증명하기 위해서 임의의 $$ A \in \mathfrak{M}_{m, n}(F) $$와 $$ B \in \mathfrak{M}_{r, m}(F) $$, $$ v \in V $$를 택하자. 그러면 $$ [L_{BA} (v)]_\mathcal{D} = BA[v]_\mathfrak{B} =B[L_{A} (v)]_\mathfrak{C} = [L_B ( L_A (v) ) ]_\mathcal{D} $$이므로 $$ L_{BA}(v) = (L_{B} \circ L_{A}) (v) $$가 성립해
$$ L_{BA} = L_{B} \circ L_{A} $$
이다.5. 기저의 변환
선형 변환의 행렬 표현은 어떤 기저를 택했냐에 따라 바뀔 수 있음을 유의해야 한다. 예를 들어, $$ L : \mathbb{R}^2 \rightarrow \mathbb{R}^3 $$가 $$ L(x, y) = (x+2y, x-y, 2x-y)$$로 정의될 때, 표준 기저 $$ \mathcal{E} = \left\{(1, 0), (0, 1)\right\},$$ $$\mathcal{F} = \left\{(1, 0, 0), (0, 1, 0), (0, 0, 1)\right\} $$에 대해서는 $$ [L]_{\mathcal{F}}^{\mathcal{E}} = $$ $$ \begin{bmatrix} 1 & 2 \\ 1 & -1 \\ 2 & -1 \end{bmatrix} $$이지만 $$ \mathcal{E}^* = \left\{ (1, 1) , (1, -1) \right\},$$ $$\mathcal{F}^* = \left\{ (1, 0, 0), (1, 1, 0), (1, 1, 1) \right\} $$에 대해서는 $$ [L]_{\mathcal{F}^*}^{\mathcal{E}^*} = $$ $$ \begin{bmatrix} 3 & -3 \\ -1 & -1 \\ 1 & 3 \end{bmatrix} $$이다.
그렇다면 다른 기저가 사용되었을 때 행렬 표현은 어떻게 바뀔까? 체 $$ F $$ 위의 벡터 공간 $$ V $$와 $$ W $$가 있고 이 두 벡터 공간이 각각 기저 $$ \mathfrak{B}, \mathfrak{B}^* $$와 $$ \mathfrak{C}, \mathfrak{C}^* $$를 가지며 선형 변환 $$ L : V \rightarrow W $$이 주어져 있다고 하자. 그러면 $$ L = I_{W} \circ L \circ I_{V} $$ [11] 이므로
$$ [L]_{\mathfrak{C}^*}^{\mathfrak{B}^*} = [I_W]_{\mathfrak{C}^*}^{\mathfrak{C}} [L]_{\mathfrak{C}}^{\mathfrak{B}} [I_V]_{\mathfrak{B}}^{\mathfrak{B}^*} $$
임을 알 수 있다. 이때, $$ [I_V]_{\mathfrak{B}^*}^{\mathfrak{B}} $$와 같은 형태의 행렬을 ($$\mathfrak{B}$$에서 $$\mathfrak{B}^*$$로의) 추이 행렬(transition matrix)이라 부르며, $$ [I_V]_{\mathfrak{B}}^{\mathfrak{B}^*} [I_V]_{\mathfrak{B}^*}^{\mathfrak{B}} = [I_V]_{\mathfrak{B}}^{\mathfrak{B}} = I $$이므로 $$[I_V]_{\mathfrak{B}}^{\mathfrak{B}^*} = ([I_V]_{\mathfrak{B}^*}^{\mathfrak{B}})^{-1} $$가 되어 가역 행렬임을 알 수 있다.이때, 만약 $$ V $$와 $$ W $$가 같고 $$ \mathfrak{B} = \mathfrak{C} $$, $$ \mathfrak{B}^* = \mathfrak{C}^* $$이면 특히 $$ [L]_{\mathfrak{B}^*}^{\mathfrak{B}^*} = [I_V]_{\mathfrak{B}^*}^{\mathfrak{B}} [L]_{\mathfrak{B}}^{\mathfrak{B}} [I_V]_{\mathfrak{B}}^{\mathfrak{B}^*} $$ $$ = [I_V]_{\mathfrak{B}^*}^{\mathfrak{B}} [L]_{\mathfrak{B}}^{\mathfrak{B}} ( [I_V]_{\mathfrak{B}^*}^{\mathfrak{B}}) ^ {-1} $$가 되어 두 행렬 $$ [L]_{\mathfrak{B}^*}^{\mathfrak{B}^*} $$ 와 $$ [L]_{\mathfrak{B}}^{\mathfrak{B}} $$가 상사 관계에 있음을 알 수 있다. 이 때문에 정의역과 공역이 같은 선형 변환의 대각합이나 행렬식 등을 정의할 수 있다. 대각합이나 행렬식을 행렬 표현의 대각합이나 행렬식으로 정의하면 되고, 이 값들은 상사 관계에 있는 행렬끼리는 항상 같기 때문에 행렬 표현이 달라진다고 선형 변환의 대각합이나 행렬식 값이 달라지진 않기 때문이다.
6. 같이 보기
[1] 이런 일대일 대응 함수를 가군 동형 사상이라고 한다. 물론 고작 동형사상 정도일 뿐만이 아니라 동형인 함자(functor)로 보는 게 더 자연스럽긴 하지만, 이를 정확히 얘기하는 것은 본 문서 수준 외의 내용이다.[2] Gilbert Strang, Linear Algebra and Its Applications, Brooks[3] 관습적으로 $$ F^n $$의 원소들은 모두 열 벡터로 취급하기 때문에 전치(transpose) 연산자 $$t $$를 붙였다[4] $$e_i$$는 i번째 좌표만 1이고 나머지 좌표는 모두 0인 벡터이므로[5] 무한 차원 행렬이 정의되지 않았으므로 무한 차원인 경우는 생각하지 않는다[6] 이 문서의 표기는 이인석의 선형대수와 군을 따른다. Friedberg의 교재에는 이 문서와는 정 반대로 정의역의 기저 쪽이 아래로 내려가도록 표기하고 있으니 주의.[7] 기저의 성질을 생각해보면 각각의 계수들은 유일하게 결정되므로 같은 기저에 대해 한 벡터가 여러 좌표를 가질 수는 없다[8] 벡터를 그 좌표 표현에 대응하는 변환은 당연히 선형 변환이다[9] 엄밀히 말하자면 $$ L_A $$, $$ L_B $$, $$ L_{AB} $$ 대신 $$ \mathsf{\Phi}_{\mathfrak{C}}^{\mathfrak{B}} (A) $$, $$ \mathsf{\Phi}_{\mathcal{D}}^{\mathfrak{C}}(B)$$, $$ \mathsf{\Phi}_{\mathcal{D}}^{\mathfrak{B}} (BA) $$를 써야한다. 세 함수는 모두 정의역, 공역이 전혀 다르기 때문이다. 혼동의 여지는 전혀 없으므로 큰 문제는 아니다.[10] 선형 변환의 선형성에 의해 선형 변환을 정의하는 것은 기저에서의 값을 정의하는 것만으로도 충분하다. 또한 벡터와 그 좌표를 대응하는 것은 당연하게 일대일 대응일 것이므로(기저의 정의에 의해) 선형 변환 값을 좌표 값으로 대신 주더라도 잘 정의될 것이다.[11] 단, $$I_V $$와 $$I_W $$는 각각 $$ V $$와 $$ W $$ 위에서의 항등 사상을 의미한다