연쇄 법칙
- 영어 : Chain rule
1. 개요
합성함수를 미분하는 공식이다. 합성함수의 미분법이라고도 한다. 연쇄 법칙을 반대로 적용한 것이 치환적분법이다.
2. 1변수함수
우리가 '합성함수의 미분'이라고 많이 접한 내용이다.
$$ f $$와 $$ g $$가 미분가능한 함수라고 하자. $$ y=f(u) $$이고 $$ u=g(x) $$일 때, $$ y $$는 $$ x $$로 미분가능하고 다음이 성립한다.
$$\displaystyle \frac{\mathrm{d}y}{\mathrm{d}x} = \frac{\mathrm{d}y}{\mathrm{d}u} \frac{\mathrm{d}u}{\mathrm{d}x} $$
이때 $$\displaystyle \frac{\mathrm{d}u}{\mathrm{d}x}$$를 보통 속미분이라고 부른다.3. 다변수함수
$$ u $$가 $$ x_1, x_2, \cdots , x_n $$에 대한 미분가능한 $$ n $$변수 함수이고, $$ x_j $$가 각각 $$ t_1, t_2, \cdots , t_m $$에 대한 미분가능한 $$ m $$변수 함수이면, $$ u $$는 $$ t_1, t_2, \cdots, t_m $$에 대한 미분가능한 함수이고, 각 $$ i = 1,2, \cdots , m $$에 대하여 다음이 성립한다.
$$\displaystyle \frac{\partial u}{\partial t_i} = \frac{\partial u}{\partial x_1} \frac{\partial x_1}{\partial t_i} + \frac{\partial u}{\partial x_2} \frac{\partial x_2}{\partial t_i} + \cdots + \frac{\partial u}{\partial x_n} \frac{\partial x_n}{\partial t_i}$$
다변수의 미분을 선형 변환 혹은 행렬로 이해했다면 다음의 버전이 가장 일반적이다.유클리드 공간의 열린 집합 $$X, Y, Z$$에 대해 $$g : X \rightarrow Y$$, $$ f : Y \rightarrow Z$$가 각각 점 $$x_0 \in X$$, $$y_0 = g(x_0)$$에서 미분가능할 때, $$ h = f \circ g : X \rightarrow Z$$도 $$x_0$$에서 미분가능하고, 그 도함수는 다음을 만족시킨다.
$$ \displaystyle Dh = Df \circ Dg $$
여기서 $$Df, Dg$$를 야코비 행렬로 보고 행렬곱을 계산하면 위의 버전을 얻을 수 있다.4. 증명과 관련된 여담
흔히 고등학교 과정에서 나와있는 1변수 연쇄법칙의 증명은 엄밀하지 않은 경우가 대부분이다. 주로 다음의 극한식을 사용하는데
$$\displaystyle \lim_{x_1 \rightarrow x} \frac{f(g(x_1)) - f(g(x))}{x_1 - x} = \lim_{x_1 \rightarrow x} \frac{f(g(x_1)) - f(g(x))}{g(x_1) - g(x)} \frac{g(x_1) - g(x)}{x_1 - x} $$
언뜻 보면 완벽해 보이지만 이건 $$g(x_1) -g(x)$$가 도중에 0이 되는 경우는 우변의 분수식을 설명할 수 없다. 이것을 해결하기 위한 별도의 트릭을 사용하거나, 아니면 그냥 미분계수에 분수를 사용하지 않는 엡실론-델타 버전에 기대는 (즉 $$ |f(x+h) - f(x) - hf'(x)| < \epsilon h$$ 이런 느낌으로) 방법이 있지만 첫번째는 번거롭고, 두번째는 고교과정 외이므로 보통 생략된다.첫 번째 방식을 이용한 일변수 연쇄법칙의 증명(접기/펼치기)
만약 $$g(x_1) \neq g(x)$$이면 $$F$$의 정의를 대입하면 성립하고, $$g(x_1)=g(x)$$라면 양변은 모두 0이니까 성립한다. 즉 위 식은 항상 맞으면서도, 이제는 모든 함수들이 연속이기 때문에 $$x_1 \rightarrow x$$로 극한을 보낼 수 있다. 그러면 우변은 $$F(g(x))g'(x) = f'(g(x))g'(x)$$가 되어 증명 끝.}}}
두 번째 방식을 이용한 다변수 연쇄법칙의 증명(접기/펼치기)
을 얻는다. 이제 주어진 $$\epsilon>0$$에 대해 $$\epsilon_1,\epsilon_2 >0$$을 적절히 잡으면, 선형사상 $$ Df(y) Dg(x) $$가 $$h$$의 미분계수의 조건을 만족한다는 것을 증명할 수 있다.}}}