다변수함수

 



1. 개념
2. 다변수함수가 되기 위한 조건
3.1. 구하는 법
4. 이차편도함수
5. 교차편도함수 · 혼합편도함수
6.1. 상대적 극대
6.2. 상대적 극소
6.5. 그 외
6.6. 총정리
6.7. 이계도함수 판정법
6.8. 이변수 함수에서의 이계도함수 판정법
7. 목록
8. 관련 문서


1. 개념


multivariate function ·
변수가 세 개 이상인 함수.
가장 기본적인 꼴의 함수는 $$y=f(x)$$ 꼴로서, 변수가 두 개이다. 이런 함수는 변수 $$x$$와 변수 $$y$$가 직접적인 영향을 주고받으며, $$y$$가 종속변수가 되는 가운데 독립변수는 $$x$$ 단 하나이다. 그런데 함수의 변수가 꼭 두 개여야 할 필요는 없고, 세 개 이상으로 늘어나도 무방하다. 하나의 종속변수를 제외한 나머지 변수가 독립변수가 되므로 이 경우 독립변수가 두 개 이상이 된다.
$$z=f(x, y)$$ 꼴이 되는 변수가 세 개인 다변수함수는, 좌표평면에 $$x$$축과 $$y$$축에 동시에 수직이 되고 원점을 지나는 $$z$$축을 도입하여 '''3차원 좌표공간'''에 그래프로 나타낼 수 있다. 정다포체처럼 차원이 4 이상인 도형은 실재하므로 변수가 4개 이상인 다변수함수는 3차원 좌표공간 축에다가 축을 하나 이상 더해서 그래프로 나타낼 수 있다.
또한, 초기하함수처럼 집합을 변수로 하는 함수는 해당 변수를 좌표축으로 둘 수 없다.
다변수함수는 다변수 실함수와 다변수 복소함수로 나뉜다.
이 문서에서는 '''편의상 변수가 세 개인 다변수함수로 여러 정보를 설명'''하며, 임계점, 상대적 극대·극소, 변곡점, 안장점과 같은 개념들은 그 다변수함수를 그래프로 나타낼 수 있음을 전제하며, 따라서 함수의 변수도 세 개임을 전제하는 셈임을 기억하라.

2. 다변수함수가 되기 위한 조건


식 $$y=f(x)$$가 함수가 되려면, $$f$$의 정의역에 속하는 $$x$$에 값에 대해 오직 하나의 $$y$$값이 $$f$$의 치역에 존재해야 한다.
이와 마찬가지로, 식 $$z=f(x,y)$$가 함수가 되려면, $$f$$의 정의역에 속하는 $$(x,y)$$로 이루어진 '''순서쌍 각각에 대해''' 오직 하나의 $$z$$값만이 $$f$$의 치역에 존재해야 한다. 이 경우 $$x$$와 $$y$$는 독립변수, $$z$$는 종속변수가 된다. $$x$$라는 독립변수의 값이 달라지지 않았는데 $$z$$의 값이 달라졌다고 해서 함수가 아니라고 단정할 수 없다. $$y$$의 값이 달라졌다면 순서쌍 $$(x,y)$$가 결국 달라진 것이므로, 함수가 될 수 있다. 함수가 아닌 경우는 $$x$$와 $$y$$의 값이 모두 달라지지 않았는데 $$z$$의 값이 달라질 수 있는 경우이다. 이 경우는 순서쌍 $$(x,y)$$가 달라지지 않기 때문이다.

3. 편도함수


partial derivative ·
다변수함수 $$z=f(x,y)$$에서 어느 한 독립변수($$x$$ 또는 $$y$$)가 종속변수 $$z$$에 미치는 영향을 알기 위해서는 다변수함수의 편도함수를 구해야 한다.
$$x$$에 대한 $$z$$의 편도함수란, '''다른 모든 독립변수는 변화 없이 일정하게 고정한 상태에서''' $$x$$의 변화가 $$z$$에 끼치는 직접적인 영향, 즉 $$x$$의 변화에 대한 $$z$$의 순간변화율을 나타낸다. $$f_x$$, $$z_x$$, $$f_x(x,y)$$, $$\frac{\partial z}{\partial x}$$, $$\frac{\partial f}{\partial x}$$로 표기한다. $$y$$에 대한 $$z$$의 편도함수 역시 모든 것이 마찬가지이다. 이를 수학적으로 나타내면
$$\displaystyle\frac{\partial z}{\partial x}=\lim_{\Delta{x}\to 0}\frac{f(x+\Delta{x},y)-f(x,y)}{\Delta{x}}$$
$$\displaystyle\frac{\partial z}{\partial y}=\lim_{\Delta{y}\to 0}\frac{f(x,y+\Delta{y})-f(x,y)}{\Delta{x}}$$
가 된다.

3.1. 구하는 법


도함수를 구하는 것을 '미분'이라고 하듯이, 편도함수를 구하는 것은 '편미분'이라고 한다. 편미분 참고.

3.2. 편미분방정식


편도함수로 이뤄진 방정식으로, 이 방정식의 해는 다변수함수가 된다. 자세한 내용은 문서 참조.

4. 이차편도함수


/ quadratic partial derivative
어느 한 독립변수에 대하여 두 번을 편미분하여 나오는 함수. 함수 $$z=f(x,y)$$에 대해, $$x$$에 대한 이차편도함수는 $$f_{xx}$$, $$(f_x)_x$$, $$\dfrac{\partial }{\partial x}\left(\dfrac{\partial z}{\partial x} \right)$$, $$\dfrac{\partial ^2z}{\partial y^2}$$로 표기한다. $$y$$에 대한 이차편도함수 역시 모든 것이 마찬가지이다. $$f_{xx}$$는 두 독립변수 $$x$$와 $$y$$ 중 $$y$$가 고정된 상태에서의 $$f_x$$의 변화율을 나타낸다. 마찬가지로 $$f_{yy}$$는 두 독립변수 $$x$$와 $$y$$ 중 $$x$$가 고정된 상태에서의 $$f_y$$의 변화율을 나타낸다.
예를 들어 $$f(x,y)=3x^2+4xy+2y^3$$을 $$x$$에 대해 한 번 편미분하면 $$f_x=6x+4y$$, 두 번 편미분하면 $$f_{xx}=6$$이다.

5. 교차편도함수 · 혼합편도함수


cross partial derivative ·
mixed partial derivative ·
원시함수를 하나의 독립변수에 대해 편미분한 후 이를 다시 또 다른 독립변수에 대해 편미분하여 나오는 함수. 함수 $$z=f(x,y)$$에 대해, 먼저 $$x$$에 대해 편미분한 후 $$y$$에 대해 편미분한 교차편도함수는 $$f_{xy}$$로 쓴다. 마찬가지로, 함수 $$z=f(x,y)$$에 대해, 먼저 $$y$$에 대해 편미분한 후 $$x$$에 대해 편미분한 교차편도함수는 $$f_{yx}$$로 쓴다. 다시 말해 편미분한 변수의 순서에 맞추어 표기하는 것이다.
교차편도함수는 1차편도함수를 구할 때 고정했던 독립변수[1] 중 어느 하나에 대한 1차편도함수의 변화율을 나타낸다.
한편, 언제 $$\boldsymbol{f_{xy}=f_{yx}}$$가 성립하는지는 큰 떡밥인데 충분조건은 많은 수학자들이 찾아냈지만 필요충분조건은 아직 요원하다. 일상적 수준에선 이계 편미분이 연속이라는 충분조건 정도에서 넘어간다.

6. 임계점


critical point ·
점 $$p$$에서 함수가 미분가능하지 않거나, 혹은 그래디언트의 값이 0이 되는 점을 '''임계점'''(critical point)이라 부른다.
임계점 $$p$$의 근방 $$U$$가 있어 $$f(p)$$가 $$U$$ 위에서 $$f$$의 최대값/최소값이 될 때, $$p$$를 각각 '''극대점'''(local maximum) 및 '''극소점'''(local minimum)이라 부른다. 극대점도 극소점도 아닌 임계점을 '''안장점'''(saddle point)이라 부른다.
모든 극대점과 극소점은 임계점이 되므로, 미분가능한 함수의 경우 가능한 임계점을 모두 조사해 극소점과 극대점들을 찾아낼 수 있다.

6.1. 상대적 극대


/ relative maximum
어떤 임계점에서 두 2차편도함수의 값의 곱이 두 교차편도함수의 곱[2]보다 '''크고''' 두 2차편도함수의 부호가 모두 '''음'''이면, 그 임계점은 '''상대적 극대'''가 된다. 곧,
$$\displaystyle{1.}$$ $$\displaystyle{f_x=f_y=0}$$
$$\displaystyle{2.}$$ $$\displaystyle{f_{xx}·f_{yy}>(f_{xy})^2}$$[3]
$$\displaystyle{3.}$$ $$\displaystyle{f_{xx}<0, f_{yy}<0}$$
를 만족시키는 점 $$(a,b)$$는 상대적 극대이다.
1번 조건은 점 $$(a,b)$$가 임계점이 되도록 하며, 2번 조건은 그 임계점이 상대적 극대 혹은 상대적 극소가 되도록 범위를 좁히며, 3번 조건은 그 임계점이 상대적 극대로 최종적으로 결정되도록 한다.

6.2. 상대적 극소


/ relative minimum
어떤 임계점에서 두 2차편도함수의 곱이 두 교차편도함수의 곱보다 '''크고''' 두 2차편도함수의 부호가 모두 '''양'''이면, 그 임계점은 '''상대적 극소'''가 된다. 곧,
$$\displaystyle{1.}$$ $$\displaystyle{f_x=f_y=0}$$
$$\displaystyle{2.}$$ $$\displaystyle{f_{xx}·f_{yy}>(f_{xy})^2}$$
$$\displaystyle{3.}$$ $$\displaystyle{f_{xx}>0, f_{yy}>0}$$
를 만족시키는 점 $$(a,b)$$는 상대적 극소이다.
1번 조건은 점 $$(a,b)$$가 임계점이 되도록 하며, 2번 조건은 그 임계점이 상대적 극대 혹은 상대적 극소가 되도록 범위를 좁히며, 3번 조건은 그 임계점이 상대적 극소로 최종적으로 결정되도록 한다.

6.3. 변곡점


/ inflection point
어떤 임계점에서 두 2차편도함수의 곱이 두 교차편도함수의 곱보다 '''작고''' 두 2차편도함수의 부호가 서로 '''같으면''', 그 임계점은 '''변곡점'''이 된다.
곧,
$$\displaystyle{1.}$$ $$\displaystyle{f_x=f_y=0}$$
$$\displaystyle{2.}$$ $$\displaystyle{f_{xx}·f_{yy}<(f_{xy})^2}$$
$$\displaystyle{3.}$$ $$\displaystyle{f_{xx}·f_{yy}>0}$$
를 만족시키는 점 $$(a,b)$$는 변곡점이다.
1번 조건은 점 $$(a,b)$$가 임계점이 되도록 하며, 2번 조건은 그 임계점이 변곡점 혹은 안장점이 되도록 범위를 좁히며, 3번 조건은 그 임계점이 변곡점으로 최종적으로 결정되도록 한다.

6.4. 안장점/안점


, / saddle point
어떤 임계점에서 두 2차편도함수의 곱이 두 교차편도함수의 곱보다 '''작고''' 두 2차편도함수의 부호가 서로 '''다르면''', 그 임계점은 '''안장점(안점)'''이 된다. 곧,
$$\displaystyle{1.}$$ $$\displaystyle{f_x=f_y=0}$$
$$\displaystyle{2.}$$ $$\displaystyle{f_{xx}·f_{yy}<(f_{xy})^2}$$
$$\displaystyle{3.}$$ $$\displaystyle{f_{xx}·f_{yy}<0}$$
를 만족시키는 점 $$(a,b)$$는 안장점이다.
1번 조건은 점 $$(a,b)$$가 임계점이 되도록 하며, 2번 조건은 그 임계점이 변곡점 혹은 안장점이 되도록 범위를 좁히며, 3번 조건은 그 임계점이 안장점으로 최종적으로 결정되도록 한다.

6.5. 그 외


어떤 임계점에서 두 2차편도함수의 곱이 두 교차편도함수의 곱과 '''같으면''', 어떤 특수한 결론도 내릴 수 없다. 엄밀히 말하면, '''상대적 극대도, 상대적 극소도, 변곡점도, 안장점도 아닌 임계점'''이 된다. 곧,
$$\displaystyle{1.}$$ $$\displaystyle{f_x=f_y=0}$$
$$\displaystyle{2.}$$ $$\displaystyle{f_{xx}·f_{yy}=(f_{xy})^2}$$
를 만족시키는 점 $$(a,b)$$는 상대적 극대도, 상대적 극소도, 변곡점도, 안장점도 아닌 임계점이다.
1번 조건은 점 $$(a,b)$$가 임계점이 되도록 하며, 2번 조건은 그 임계점이 상대적 극대도, 상대적 극소도, 변곡점도, 안장점도 아닌 임계점으로 최종적으로 결정되도록 한다.

6.6. 총정리


총정리하여 표로 나타내면 다음과 같다.
'''함수''' $$\displaystyle\boldsymbol{z=f(x,y)}$$ '''위의 점''' $$\displaystyle\boldsymbol{(a,b)}$$'''는 어떤 점인가?'''
$$\displaystyle\boldsymbol{x=a, y=b}$$'''를 대입하여 판단한다.'''
$$\displaystyle{f_x=0, f_y=0}$$
'''(임계점)'''
$$\displaystyle{f_{xx}·f_{yy}>(f_{xy})^2}$$
'''(상대적 극대 or 상대적 극소)'''
$$\displaystyle{f_{xx}·f_{yy}<(f_{xy})^2}$$
'''(변곡점 or 안장점)'''
$$\displaystyle{f_{xx}·f_{yy}=(f_{xy})^2}$$
'''(상대적 극대도, 상대적 극소도,
변곡점도, 안장점도 아닌 임계점)'''
$$\displaystyle{f_{xx}<0, f_{yy}<0}$$
'''(상대적 극대)'''
$$\displaystyle{f_{xx}>0, f_{yy}>0}$$
'''(상대적 극소)'''
$$\displaystyle{f_{xx}·f_{yy}>0}$$
'''(변곡점)'''
$$\displaystyle{f_{xx}·f_{yy}<0}$$
'''(안장점)'''

6.7. 이계도함수 판정법


함수가 임계점 $$p$$ 근방에서 이계 미분이 존재할 경우, '''헤세 행렬''' 혹은 '''헤시안'''(Hessian matrix/Hessian)은 이계도함수들을 모아놓은 다음의 대칭행렬로 정의된다.
$$\displaystyle \mathrm{Hess}(f) = \left(\frac{\partial^2 f} {\partial x_i \partial x_j} \right)_{i,j=1,\cdots, n}$$
대칭행렬에 대한 스펙트럼 정리에 의해, n변수 다변수함수의 헤세 행렬은 항상 대각화가 가능하며 n개의 고윳값을 갖는다. 이들 고윳값의 부호가 특정 조건을 만족할 경우 임계점의 특성을 다음처럼 판정할 수 있다.
'''이계도함수 판정법/헤세 판정법'''(Second derivative test)
다변수함수가 임계점 $$p$$ 근방에서 모든 이계도함수가 존재하고 연속일 때($$C^2$$),
1. 헤세 행렬의 고윳값이 모두 양수이면(즉 양정치(positive definite)이면) $$p$$는 극대점이다.
1. 헤세 행렬의 고윳값이 모두 음수이면(즉 음정치(negative definite)이면) $$p$$는 극소점이다.
1. 헤세 행렬이 양수 고윳값과 음수 고윳값을 모두 갖고 있으면, $$p$$는 안장점이다.
이상의 경우에 해당하지 않으면 이계도함수 판정법을 사용할 수 없다.
고유값이 반정치(semidefinite)인 경우에는 안장점 및 극점이 되는 것이 모두 가능하다. 예로 $$f(x,y) = x^2 + ky^4$$ 같은 경우 헤세 행렬은 항상 양반정치(positive semidefinite)이지만, 점 $$(0,0)$$은 $$k<0$$이면 안장점이 되고, $$k \ge 0$$이면 극대점이 된다. 다만 양수 고유값이 있으면 적어도 극소점이 될 수는 없다는 것은 증명할 수 있다.
이계도함수 판정법의 증명은 다변수 테일러 정리를 2차항까지 전개하여 진행된다.

6.8. 이변수 함수에서의 이계도함수 판정법


이변수 함수의 이계도함수 판정법
다변수함수 $$f(x,y)$$가 가 임계점 $$p$$ 근방에서 모든 이계도함수가 존재하고 연속일 때($$C^2$$),
1. $$f_{xx} f_{yy} > f_{xy}^2$$이며 $$f_{xx}, f_{yy}>0$$이면 $$p$$는 극대점이다.
1. $$f_{xx} f_{yy} > f_{xy}^2$$이며 $$f_{xx}, f_{yy}<0$$이면 $$p$$는 극소점이다.
1. $$f_{xx} f_{yy} < f_{xy}^2$$이면 $$p$$는 안장점이다.
만약 $$f_{xx} f_{yy} = f_{xy}^2$$이면 이계도함수 판정법을 사용할 수 없다.
식 $$f_{xx} f_{yy} > f_{xy}^2$$은 헤세 행렬의 행렬식이며, 이변수 함수의 경우에는 이 행렬식은 고윳값 $$\lambda_1, \lambda_2$$의 곱이 된다. 따라서 만약 행렬식이 0보다 작다면 두 고윳값의 부호는 달라진다. 만약 행렬식이 양수이고 $$f_{xx}>0$$이면, 실베스터 판정법(Sylvester's criterion)에 의해 좌상단 $$k \times k$$의 주 소행렬식(principal minors)이 모두 0보다 크므로 헤세 행렬이 양정치가 됨을 알 수 있다. 음정치인 경우에는 $$-f$$에 1번 조건을 적용하면 된다.

7. 목록



8. 관련 문서


[1] 곧, 첫째 편미분의 대상이 되지 않은 독립변수[2] 앞서 언급한 '''영의 정리'''에 의해, '''두 교차편도함수의 곱'''이란 결국 '''어느 한 교차편도함수의 제곱'''과 같다. 곧, $$\boldsymbol{f_{xy}=f_{yx}}$$'''이므로''' $$\boldsymbol{(f_{xy})^2=(f_{yx})^2=f_{xy}·f_{yx}}$$'''이다.'''[3] 이 역시 마찬가지. '''영의 정리'''에 의해, $$\displaystyle{f_{xx}·f_{yy}>f_{xy}·f_{yx}}$$이기 때문에, 어느 쪽을 써도 상관없다.