도함수
1. 개요
derivative · 導函數
도함수는 미분 계수를 일반화한 개념이다. 미분계수를 구하는 과정(특정한 $$x$$ 값에서의 평균변화율의 극한값)을 하나의 연산으로 보았을 때, 다음과 같이 도함수를 정의할 수 있다.
함수 $$y=f(x)$$의 도함수를 기호 $$y'$$, $$f'(x)$$[1] , $$\displaystyle \frac {\mathrm{d}y} {\mathrm{d}x}$$[2] , $$\displaystyle \frac{\mathrm{d}}{\mathrm{d}x} f(x)$$, $$\dot{x}$$[3] 등으로 나타낸다. 또한 도함수를 구하는 과정을 '''미분한다(differentiate)'''고 한다. 어떤 함수의 도함수가 미분 가능할 때 이 도함수를 한 번 더 미분한 함수를 '이계도함수'라고 부르고, 어떤 함수가 $$n$$번 미분이 가능할 때 $$n$$번 미분하면 '$$n$$계도함수'라고 부른다. (단, $$n$$은 자연수) '이계도함수' 이상부터 통틀어서 '고계도함수'라고 부른다.극한값 $$\displaystyle m_x=\lim_{\Delta x\to 0}\frac{f(x+\Delta x)-f(x)}{\Delta x}$$가 존재하는 함수 $$f$$의 정의역의 원소 $$x$$를 $$m_x$$로 대응시키는 함수를 $$f$$의 '''도함수'''라 한다.
2. 미분법
여기서는 도함수를 미분연산자 $$D$$를 이용하여 표현할 것이다. 즉, 함수 $$\displaystyle y=f(x)$$의 도함수 $$\displaystyle y'=f'(x)=\frac {\mathrm{d}y} {\mathrm{d}x}=Dy=Df(x)$$이다.
합성함수의 도함수, 매개변수로 나타내어진 함수의 도함수, 음함수 꼴의 도함수 등이 있다.
- 합성함수의 미분
- 매개변수의 미분법
- 일반적인 함수에 대해서는 다음과 같다.
- $$\dfrac{\mathrm{d}}{\mathrm{d}x}|f(x)| = (\mathrm{sgn} \circ f)(x)\cdot f'(x)$$
- $$\dfrac{\mathrm{d}^2}{\mathrm{d}x^2}|f(x)| = (\mathrm{sgn} \circ f'')(x) + 2(\delta \circ f)(x)\cdot [ f'(x) ]^2$$[4]
2.1. 기본 공식
각 함수의 도함수가 존재함(각 함수가 미분가능함)을 전제로 한다.
여기서 미분연산자 $$D$$가 (3)과 (4)를 만족시키므로, $$D$$는 '''선형연산자'''이다.(1) $$y=c$$이면 $$Dy=0$$ ($$c$$는 상수)
(2) $$y=x^n$$이면 $$Dy=nx^{n-1}$$ ($$n$$은 실수)
(3) 상수 $$k$$에 대해 $$D[ kf(x) ]=kDf(x)$$
(4) $$D[ f(x) \pm g(x) ]=Df(x) \pm Dg(x)$$
(5) $$y=f(x)\cdot g(x)$$이면 $$Dy=f'(x)g(x)+f(x)g'(x)$$
(6) $$\displaystyle y={f(x) \over g(x)}$$(단, $$g(x)\ne 0$$)이면 $$Dy$$=$$\displaystyle \frac{f'(x)g(x)-f(x)g'(x)}{\{g(x)\}^2} $$
2.1.1. (2) 증명
$$f(x)=x^n$$이라 하면
$$f'(x)=\displaystyle\lim_{h\to 0}\dfrac{f(x+h)-f(x)}h=\lim_{h\to 0}\dfrac{(x+h)^n-x^n}h$$
$$(x+h)^n$$을 이항정리로 전개하면
$$\displaystyle\lim_{h\to 0}\dfrac{(\cancel{x^n}+{}_n\mathrm C_1x^{n-1}h+{}_n\mathrm C_2x^{n-2}h^2+\cdots+{}_n\mathrm C_{n-1}xh^{n-1}+{}_n\mathrm C_nh^n)-\cancel{x^n}}h$$
$$x^n$$을 소거하고 $$h$$로 약분하면
$$\displaystyle\lim_{h\to 0}({}_n\mathrm C_1x^{n-1}+{}_n\mathrm C_2x^{n-2}h+\cdots+{}_n\mathrm C_{n-1}xh^{n-2}+{}_n\mathrm C_nh^{n-1})={}_n\mathrm C_1x^{n-1}=nx^{n-1}$$
2.2. 연쇄 법칙
미분연산자 $$D$$의 다른 표기법은 다음과 같다. $$y$$가 $$x$$에 대한 함수이면, $$y$$의 도함수를 '''$$D_{x}y$$'''로 나타낸다. 예를 들어, $$y=u^{10}, u=2x^2+10$$이면 $$D_{u}y=10u^9$$, $$D_{x}u=4x$$이다. 그런데, $$u=2x^2+10$$을 $$y=u^{10}$$에 대입하면 $$y=(2x^2+10)^{10}$$이다. 이를 미분하면 $$y'=D_{x}y=10(2x^2+10)^9\cdot 4x$$로, 이 값은 $$D_{u}y$$에 $$D_{x}u$$를 곱한 값과 같다. 즉, 미분가능한 두 함수 $$y=f(u)$$, $$u=g(x)$$에 의해 결정된 합성합수 $$y=f(g(x))$$에서, $$y$$는 $$u$$보다 $$D_{u}y$$배 만큼 변하고, $$u$$는 $$x$$보다 $$D_{x}u$$배 만큼 변한다. 따라서 $$y$$는 $$x$$보다 $$D_{u}y\cdot D_{x}u$$배 만큼 변한다. 이를 '''연쇄법칙(chain rule)'''이라고 한다.
이러한 연쇄법칙은 다변수함수의 미분에서도 성립한다. 두 미분가능한 다변수 함수 $$F : \mathbb{R}^n \rightarrow \mathbb{R}^m$$와 $$G : \mathbb{R}^m \rightarrow \mathbb{R}^k$$에 대해서 둘의 합성함수 $$G \circ F$$ 또한 미분가능하며 그 도함수값(미분계수)은 $$D(G\circ F)(a)=DF(G(a))DG(a)$$ 로 나타난다. 일반적으로 다변수의 도함수값은 행렬이므로 뒤의 곱은 행렬의 곱이다.$$y$$가 $$u$$에 대한 함수이고, $$u$$가 $$x$$에 대한 함수이며, 함수 $$y$$, $$u$$가 각각 $$u$$, $$x$$에서 미분가능하면 $$y$$와 $$u$$의 합성함수는 $$x$$에서 미분가능하고 $$D_{x}y=D_{u}y\cdot D_{x}u$$이다.
2.2.1. 역함수의 도함수
2.3. 곱미분
2.4. 몫미분
2.5. 정적분으로 정의된 함수의 미분
$$\displaystyle \frac{\mathrm{d}}{\mathrm{d}x} \int_{g(x)}^{h(x)}f(x,\,t)\,\mathrm{d}t = f(x,\,h(x))\cdot h'(x) - f(x,\,g(x))\cdot g'(x) + \int_{g(x)}^{h(x)}\frac{\partial}{\partial x}f(x,\,t)\,\mathrm{d}t $$
이 미분법은 따로 라이프니츠 미분법이라는 이름이 붙어 있다. 정적분으로 정의된 특수함수[5] 등을 미분할 때 유용하게 사용된다. $$f(x,\,t)$$, $$g(x)$$, $$h(x)$$가 특수한 꼴인 경우 아래와 같은 식들을 얻을 수 있다.
- $$f$$는 $$t$$만의 함수이고, $$g(x)=a$$, $$h(x)=x$$인 경우 (단, $$a$$는 상수)
- $$f$$는 $$t$$만의 함수이고, $$g(x)=x$$, $$h(x)=a$$인 경우
- $$f$$는 $$t$$만의 함수이고, $$g(x)=a$$인 경우
- $$f$$는 $$t$$만의 함수이고, $$h(x)=a$$인 경우
위의 네 식에서 볼 수 있듯이, $$a$$는 정적분 함수 미분에서 그냥 장식이다(...).
- $$f$$가 $$t$$만의 함수인 경우
여기까지의 다섯 개 식은 고교 교육과정에서 배우는 내용이므로 위 식들이 익숙할 것이다.
- $$g(x)=a$$이고 $$h(x)=b$$인 경우 (단, $$a$$, $$b$$는 상수)
적분의 위끝과 아래끝이 상수이고 피적분함수가 $$x$$와 $$t$$에 대한 함수인 경우이다. 이런 꼴의 정적분을 미분하는 것을 두고 "적분 기호 안에서 미분하기(Differentiation under the Integral Sign)"라고 부른다.
여기서 $$\partial$$는 편미분 기호이다. 자세한 내용은 이 문서의 편미분 문단을 참고하면 된다.
2.6. 음함수의 미분
음함수 $$f(x,\,y)=0$$이 있을 때, $$z \equiv f(x,\,y)$$라 하고 양변을 전미분하면
$$\displaystyle {\rm d}z=\frac{\partial f}{\partial x}{\rm d}x+\frac{\partial f}{\partial y}{\rm d}y=0 $$
- 포물선
- 타원
- 쌍곡선
기하적인 의미로, 델 연산자를 사용하여 접선의 법선벡터를 구하는 방법으로 해석할 수도 있다.
음함수 $$f(x,\,y)=0$$의 그래프 위의 점 $$(a,\,b)$$에서의 접선의 법선벡터는 $$\vec h=\nabla f(x,\,y)_{(a,b)}$$
그럼에도 불구하고 많은 미적분학 책에서는 이를 따로 가르치고 있는데 이는 단순한 미분'법'을 가르치기 위해서가 아니라(사실 미분법은 chain rule에서 이미 가르쳤다.) '''$$y$$를 $$x$$에 대한 함수로 본다는 사실'''을 강조하기 위함을 보여진다. 즉, 어떤 이변수 함수 $$f(x,\,y)$$가 주어질 때 $$f(x,\,g(x))=0$$을 만족시키는 '''미분가능한''' $$g(x)$$가 존재하는가? 라는 것을 강조하기 위함이다.
이러한 의문은 '음함수의 정리'가 만족시켜 주는데 기본적으로 미적분학책에서 나올 정도의 함수는 대부분 다 음함수 정리의 조건을 만족시키는 좋은 함수라고 할 수 있다.
2.7. 편미분
partial derivative
다변수 함수 f(x, y, z, ...)에서 하나의 변수만 남겨놓고 '''나머지 변수를 상수 취급하는''' 미분법이다.
다차원 함수식에서 워낙 중요한 연산자인지라 편미분된 함수를 편도함수라고 부르며, $$\partial$$라는 기호를 따로 쓴다.[8][9] 당연하지만 원시함수의 변수가 둘 이상이기 때문에, 제대로 풀려면 순수 해석학만으로는 부족하고 선형대수학을 동원해야 한다.
이 편미분 기호 $$\partial$$[10] 는 명칭이 여러가지로, '델', '디', '파셜', '라운드', '파셜 디', '라운드 디' 등이다. 공대에서는 '라운드'라고 많이 불린다. 그런데 이 중에서도 특히 '델'은 $$\nabla$$(del)[11] 과 이름이 겹치므로 헷갈리지 않도록 주의해야 한다. 대개 $$\partial$$을 '델'로 읽는 사람은 $$\nabla$$를 '나블라'로 읽는 경향이 있다.
고등학교에서 기초적인 편미분을 배울 수 있는데 바로 '이계도함수', '음함수의 미분'[12] 이다. 하지만 그것 말고도 함수가 더럽게 뒤엉켜 있는 함수방정식과 도함수까지 나오는 미분방정식 중 고등학교 시험에 나오는 것들에 요긴하게 써먹을 수 있다. 사실 이런 문제들은 고등학교 수준에서는 꽤 어렵기 때문에 모의고사나 수능에 4점짜리로 종종 나오곤 했는데 요즘에는 절대로 나오지 않는다. 학생들이 다름아닌 편미분으로 너무 쉽게 풀어버리기 때문이다.
다변수함수는 모든 변수에 대한 편도함수가 존재하더라도 연속이 아닐 수 있다. 그러나 편도함수들이 모두 연속이라면 원 함수도 연속이며 미분가능하다.
경제학에서도 편미분이 중시되는데, 그 이유는 경제학에서 여러 변수 중 하나의 변수만 변화하고 나머지는 동일하다(ceteris paribus)는 조건으로 가정하는 경우가 많기 때문이다.
아래의 그림과 같이 $$x$$와 $$y$$가 곱해진 식을 편미분할 때 헷갈릴 수 있으니 주의한다.
[image]
2.7.1. 활용 예시
- 접평면의 방정식
>공간 상의 곡면 $$S$$ 위의 한 점 $$X$$에 접하는 평면과 임의의 평면 $$P$$의 교선은 $$S$$와 $$P$$의 교선 위의 점 $$X$$에서의 접선이다.
위의 정리에서 3차원 좌표공간 상의 곡면 $$S:z=f(x,\,y)$$ 위의 한 점 $$(x_0,\,y_0,\,z_0)$$에 접하는 평면과...
- $$P:x=x_0$$와의 교선은
즉, 접선의 방향벡터는 $$(0,\,1,\,\dfrac{\partial z}{\partial y})$$
- $$P:y=y_0$$와의 교선은
즉, 접선의 방향벡터는 $$(1,\,0,\,\dfrac{\partial z}{\partial x})$$
접평면은 이 두 직선을 포함하여야 하므로 법선벡터는 이 두 벡터에 수직인 벡터이다.
$$\vec h\parallel(0,\,1,\,\dfrac{\partial z}{\partial y})×(1,\,0,\,\dfrac{\partial z}{\partial x})=(\dfrac{\partial z}{\partial x},\,\dfrac{\partial z}{\partial y},\,-1)$$
그러므로 접평면의 방정식은
$$T:\dfrac{\partial z}{\partial x}(x-x_0)+\dfrac{\partial z}{\partial y}(y-y_0)-(z-z_0)=0\\\therefore T:z=z_0+\dfrac{\partial z}{\partial x}(x-x_0)+\dfrac{\partial z}{\partial y}(y-y_0)$$
- 음함수의 미분
$$t:\dfrac{\partial z}{\partial x}(x-x_0)+\dfrac{\partial z}{\partial y}(y-y_0)=0$$
$$\dfrac{\mathrm{d}y}{\mathrm{d}x}$$는 위 직선의 기울기이므로
$$\dfrac{\mathrm{d}y}{\mathrm{d}x}=-\dfrac{\dfrac{\partial f(x,y)}{\partial x}}{\dfrac{\partial f(x,y)}{\partial y}}$$
2.8. 전미분
[13]$$\mathrm{d}f(x,y,z)=f_x(x,y,z)\mathrm{d}x+f_y(x,y,z)\mathrm{d}y+f_z(x,y,z)\mathrm{d}z$$
편미분과는 반대로 '''미분꼴이 다수의 변수를 품은 형태'''이다. 이 개념을 일반화한 게 미분형식이다.
3. 도함수의 응용(활용)
미분법을 배우는 주된 이유 중 하나는 함수의 그래프를 그리기 위해서이다. 도함수로 원래함수의 상태를 알아내 형태를 그릴 수 있기 때문. 함수의 형태와 특징을 알기 위해서는 도함수와 함께 몇가지 다른 개념들이 필요하다. 이 개념들을 이용하면 함수의 그래프를 그릴 수 있다.
3.1. 최댓값과 최솟값
함수 $$f$$가 $$S$$에서 정의되고 $$c\in S$$라 하자.
1. 모든 $$x\in S$$에 대하여 $$f(c)\ge f(x)$$이면 $$f(c)$$는 $$f$$의 최댓값(maximum value)이다.
2. 모든 $$x\in S$$에 대하여 $$f(c)\le f(x)$$이면 $$f(c)$$는 $$f$$의 최솟값(minimum value)이다.
3.1.1. 최대·최소 정리
3.1.2. 임계점 정리
위의 세 종류의 점을 '''임계점'''이라 한다.[14]$$f$$가 $$c$$를 포함하는 구간 $$I$$에서 정의된 함수라 하자. $$f(c)$$가 최대 또는 최솟값이면 $$c$$는 다음 중 하나이다.
1. $$I$$의 끝점 (예를 들어, 구간 $$[a,\,b]$$의 끝점은 $$a$$와 $$b$$이며, 구간 [math([a,\,b))]의 끝점은 $$a$$이다)
2. $$f$$의 정점(Apex) ($$f'(c)=0$$ 인 점)
3. $$f$$의 특이점(Singular point) ($$f'(c)$$가 존재하지 않는 점으로 그래프가 꺾인 점, 접선의 기울기가 발산하는 점, 불연속인 점이 있다)
3.2. 단조성과 오목·볼록
$$f$$가 구간 $$I$$에서 정의될 때 $$I$$ 내의 임의의 두 점 $$x_{1}$$, $$x_{2}$$에 대하여
1. $$x_{1}<x_{2}$$일 때 $$f(x_{1})<f(x_{2})$$이면 $$f$$는 구간 $$I$$에서 '''증가한다(increase)'''고 하고
2. $$x_{1}<x_{2}$$일 때 $$f(x_{1})>f(x_{2})$$이면 $$f$$는 구간 $$I$$에서 '''감소한다(decrease)'''고 하며
3. 함수 $$f$$가 1 또는 2를 만족하면 $$f$$는 구간 $$I$$에서 '''단조롭다(monotone)'''고 한다.
3.2.1. 단조성 정리
이때 구간 $$I$$의 모든 내점 $$x$$에 대하여 증가 또는 감소임에 유의하자. 즉, 증가 또는 감소 구간은 양 끝점을 포함한다. 단조성 정리의 증명과 이로부터 도출되는 정리는 역도함수로 정의되는 부정적분에 있어 굉장히 중요한 의미를 갖는다. 이에 대한 내용은 평균값의 정리를 참조할 것.$$f$$가 구간 $$I$$에서 연속이며 $$I$$의 모든 내점에서 미분가능할 때
1. $$I$$의 모든 내점 $$x$$에 대하여 $$f'(x)>0$$이면 $$f$$는 $$I$$에서 증가하며,
2. $$I$$의 모든 내점 $$x$$에 대하여 $$f'(x)<0$$이면 $$f$$는 $$I$$에서 감소한다.
3.2.2. 오목성 정리
만약 접선이 그래프를 따라 왼쪽에서 오른쪽으로 이동할 때 반시계방향으로 회전하면 그래프는 위로 오목(concave up) 또는 아래로 볼록(convex down)이며, 시계방향으로 회전하면 아래로 오목(concave down) 또는 위로 볼록(convex up)이다.[15]
정확한 정의는 다음과 같다. (반드시 미분 가능해야 할 필요는 없다.)
함수가 미분가능하다면, 도함수를 이용하여 다음과 같이 표현할 수 있다. (위의 정의로부터 어떤 함수가 위로 오목/아래로 오목이면 연속이며 만약 미분가능하다면 도함수가 증가/감소함수임을 보일 수 있다.)함수 $$f$$가 열린구간 $$(a,\,b)$$에서 연속일 때, 임의의 $$0<e<1$$과 $$(a,\,b)$$안의 모든 점 $$x<y$$에 대해 $$f(ex+(1-e)y)\le ef(x)+(1-e)f(y)$$일 때 $$f$$는 위로 오목(아래로 볼록)이며, $$f(ex+(1-e)y)\ge ef(x)+(1-e)f(y)$$일 때 $$f$$는 아래로 오목(위로 볼록)이다.
여기서 열린구간에서 미분가능한 함수임에 유의하자. 즉, 오목 또는 볼록 구간은 양 끝점을 포함하지 않는다. 또한$$\ f''$$이 양수이면 $$f'$$이 증가하고 $$f''$$이 음수이면 f'이 감소하므로 다음의 오목성 정리가 성립한다. $$f$$를 열린구간 $$(a,\,b)$$에서 두 번 미분가능한 함수라 하자. $$(a,\,b)$$의 모든 점 $$x$$에 대하여함수 $$f$$가 열린구간 $$I=(a,\,b)$$에서 미분가능하다고 하자. $$f'$$이 $$I$$에서 증가하면 $$f$$는 위로 오목(아래로 볼록)이며 $$f'$$이 $$I$$에서 감소하면 $$f$$는 아래로 오목(위로 볼록)이다.
$$f$$를 $$c$$에서 연속인 함수라 할 때, $$f$$가 $$c$$를 경계로 한쪽에서는 위로 오목(아래로 볼록)이고 다른 쪽에서는 아래로 오목(위로 볼록)이면 $$(c,\,f(c))$$를 $$f$$의 '''변곡점(inflection point)'''이라고 한다. 여기서 $$f''(x)=0$$인 점이 항상 변곡점인 것은 아니라는 것에 유의하자. $$\ f''(x)=0$$이면서 좌우의 $$f''(x)$$의 부호가 반대인 점이 변곡점이며 또한 $$f''(x)=0$$의 값이 존재하지 않는 점이 변곡점이 될 수도 있다.1.$$\ f''(x)>0$$이면 $$f$$는 $$(a,\,b)$$에서 위로 오목(아래로 볼록)이고,
2.$$\ f''(x)<0$$이면 $$f$$는 $$(a,\,b)$$에서 아래로 오목(위로 볼록)이다.
3.3. 극댓값과 극솟값
극댓값이란 주변값보다 큰 값을, 극솟값은 주변값보다 작은 값을 의미한다. 극댓값·극솟값의 정확한 정의는 다음과 같다.
여기서 임계점 정리의 최대·최솟값을 극값으로 바꾸어도 성립한다. 즉 끝점, 정점 그리고 특이점이 극값이 될 수 있다. 이때 도함수를 이용하면 극값을 판정할 수 있다.$$S$$는 $$f$$의 정의역이고, $$c\in S$$라 하자.
1. $$c$$를 포함하는 열린구간 $$I$$가 존재하여 $$f(c)$$가 집합 $$I\cap S$$에서 $$f$$의 최댓값이면 $$f(c)$$를 $$f$$의 '''극댓값(local maximum value)'''이라고 한다.
2. $$c$$를 포함하는 열린구간 $$I$$가 존재하여 $$f(c)$$가 집합 $$I\cap S$$에서 $$f$$의 최솟값이면 $$f(c)$$를 $$f$$의 '''극솟값(local minimum value)'''이라고 한다.
3. $$f(c)$$가 극댓값이거나 극솟값이면 $$f(c)$$를 $$f$$의 극값(local extreme value)이라고 한다.
$$f$$는 $$(a,\,b)-\{c\}$$에서 미분 가능하고, 임계점 $$c$$는 $$(a,\,b)$$의 원소일 때,
1. $$(a,\,c)$$의 임의의 점 $$x$$에 대하여 $$f'(x)>0$$이고, $$(c,b)$$의 임의의 점 $$x$$에 대하여 $$f'(x)<0$$이면 $$f(c)$$는 $$f$$의 극댓값이다.
2. $$(a,\,c)$$의 임의의 점 $$x$$에 대하여 $$f'(x)<0$$이고, $$(c,b)$$의 임의의 점 $$x$$에 대하여 $$f'(x)>0$$이면 $$f(c)$$는 $$f$$의 극솟값이다.
3. $$c$$의 양쪽에서 $$f'(x)$$의 부호가 같으면 $$f(c)$$는 극값이 아니다.
3.4. 점근선
3.5. 리시 방법
초등함수의 도함수를 구하는 방법을 일반화시킨 것이다.