미분
1. 개요
微分
미분이라는 단어는 영어 differentiation의 번역어이며, 점↔선↔면↔입체가 미적분과 유사한 관계임에서 착안하여 만들어진 단어이다. 즉 어떤 면을 미세하게 층층이 쪼개었을 때, 각각의 층을 '미세한 부분'이라고 하여 '미분'이라고 부른 것이 어원이다. 영어 differentiation이나 differential은 '차이를 두다'라는 뜻의 differentiate에서 파생되었다. derivative라고도 한다.
미분을 알기 위해서는 우선 몇 가지 개념들에 대한 이해가 필요하다. 아래는 뉴턴이 최초로 미적분을 발명하고 거의 비슷한 시기에 라이프니츠가 최초로 정립한 미분계수의 정의와 평균변화율과 순간변화율 개념을 시작으로, 롤, 가우스, 코시, 로피탈, 리만, 바이어슈트라스 등등 여러 인물들이 만들어 놓은 이론과 정리들의 기본 원리가 되는 개념이다.
2. 정의
미분이라는 용어는 서로 다른 두 개념인 미분(differentiation)과 미분(differential)으로 동시에 쓰이기 때문에 이를 구분할 필요가 있다. Differentiation은 differentiate의 명사형이고, differentiate는 우리가 흔히 미분이라 부르는 ''도함수를 얻는 것''을 말하는 동사이다. 또한 differential은 고등학교에 나오지 않았던 개념으로, 원함수의 선형 근사 ''함수''를 말한다.[1] 가령, 일변수 함수 $$f(x)$$의 한 점 $$a$$에서의 미분(differential)은 $$\mathrm{d}f(\Delta x) = f'(a)\,\Delta x$$로 나타나는 선형함수를 말한다. 좀 더 일반적으로, $$a$$ 자체도 변수로 다루면서 $$f(x)$$의 미분 $$\mathrm{d}f$$를 $$\mathrm{d}f(x,\,\Delta x) = f'(x)\,\Delta x$$의 이변수 함수로서 정의한다. 여기서 $$\Delta x$$는 단순히 변수의 표기에 불과하니 오해하지 말자.
왜 이러한 differential이라는 개념이 따로 필요한가는 다변수함수의 미분으로 가면 확실해진다. 일변수 함수에서는 변화하는 '방향'을 고려할 필요가 없기 때문에 평균변화율이나 순간변화율이 유일하게 결정되지만, 3차원(이변수 함수)으로만 가도 서로 다른 방향으로의 무수히 많은 변화율을 생각할 수 있기 때문에 단순하게 일차원의 변화율(직선의 기울기)을 적용하기에는 애로사항이 존재하게 된다. 따라서 미분의 개념에 대해 다른 방향으로 접근해야 하고, 그것이 바로 '''선형근사함수'''이다.[2]
선형함수란 $$L(ax+y)=aL(x)+L(y)$$의 성질을 가지는 함수를 말하며, 일변수의 실수값 함수에서는 원점을 지나는 직선으로, 이변수의 실수값 함수에서는 원점을 지나는 평면으로 나타나며, 일반적으로 $$\mathbb{R}^n$$에서 $$\mathbb{R}^m$$으로 가는 함수의 경우에는 $$L(x)=Ax$$로서 $$m×n$$ 행렬 $$A$$를 변수 앞에(변수를 column matrix의 형태로 간주하여) 곱한 간단한 형태로서 나타낼수 있다.
$$\mathbb{R}^n$$에서 $$\mathbb{R}^m$$으로 가는 다변수벡터함수 $$\mathbf{f}: \mathbf{x} \mapsto \mathbf{f}(\mathbf{x})$$에 대해 한 점 $$\mathbf{a}$$를 고정시키고 이로 만든 새로운 함수 $$\mathbf{f}(\mathbf{x})-\mathbf{f}(\mathbf{a})$$와 원점 근방에서 가장 원함수와 비슷한 선형 근사 함수는 유일하게 결정할 수 있게 되고,[3] 이러한 방향으로 생각한 일변수 함수에서의 미분의 확장은 타당하다 할 수 있다. 이 때 $$\mathbf{f}(\mathbf{x})$$의 $$\mathbf{x}=\mathbf{a}$$에서의 선형 근사 함수 $$L(\mathbf{x})=A\mathbf{x}$$가 위에서 말한 $$\mathbf{a}$$에서의 미분(differential)이고, 이러한 미분의 ''계수''를 미분계수라고 하게 된다. (따라서 차원이 높아지면 이러한 '계수'는 하나의 수가 아닌 행렬로 나타난다. 그게 바로 야코비안.) 모든 고등학생이 도함수의 값을 미분계수라고 부른다는 걸 알고 있지만 정작 '''왜''' 미분''계수''라고 부르는지는 잘 모르는데, 말그대로 미분(differential)의 계수(coefficient)이기 때문에 그렇게 부르는 것이다.
이렇게 다변수로 가면 미분을 먼저 정의해야 그로서 미분계수라는 용어가 자연스럽게 나오고, 그 미분계수와 해당하는 점을 이어주는 함수를 도함수라고 정의할 수 있게 된다.
2.1. 어림값
미분의 정의를 이용하면 미분가능한 함수에서 함숫값의 비교적 정확한 어림값을 쉽게 유추해낼 수 있다. 함수 $$y=f(x)$$에 대해 $$\Delta x$$가 $$x$$의 변화량이고 여기에 대응되는 $$y$$의 변화량을 $$\Delta y$$라 하면, $$\Delta y$$의 어림값으로 $$\mathrm{d}y$$를 쓸 수 있다. 즉, 함수 $$y=f(x)$$의 어림값은 다음과 같이 구할 수 있다.
예를 들어, $$\sqrt{4.2}$$의 어림값을 구하려면, 우선 함수 $$y=\sqrt{x}$$에서 $$\mathrm{d}y = \dfrac1{2\sqrt{x}} \,\mathrm{d}x, \ x=4, \ \mathrm{d}x=0.2$$이므로 $$\mathrm{d}y = \dfrac1{2\sqrt4} \cdot 0.2 = 0.05$$이다. 따라서 $$\sqrt{4.2} = \sqrt{4+0.2} \approx \sqrt4 + 0.05 = 2.05$$이고, 이 값은 $$\sqrt{4.2} = 2.0493901532...$$에 근사하다.$$f(x+\Delta x) \approx f(x) + \mathrm{d}y = f(x) + f'(x)\,\Delta x$$
2.2. 미분가능성과 연속
간단하게 말해서 미분가능이면 연속이다. 이것을 다음과 같이 나타낼 수 있다.
어떤 함수가 $$x=c$$에서 연속이라는 것은 $$\displaystyle \lim_{x\to c} f(x) = f(c)$$이므로 이를 증명하면 된다.$$f'(c)$$의 값이 존재하면 $$f$$는 $$x=c$$에서 연속이다.
$$x \ne c$$일 때, $$\displaystyle f(x) = f(c) + \biggl\{ \frac{f(x)-f(c)}{x-c} \biggr\} (x-c)$$이므로
[math(\displaystyle \begin{aligned}
\lim_{x \to c} f(x) &= \lim_{x \to c} \biggl\{ f(c) + \frac{f(x)-f(c)}{x-c} (x-c) \biggr\} \\
&= \lim_{x \to c} f(c) + \lim_{x \to c} \frac{f(x)-f(c)}{x-c} \cdot \lim_{x \to c} (x-c) \\
&= f(c) + f'(c) \cdot 0 \\
&= f(c)
\end{aligned})]
이 정리의 역은 성립하지 않는다. 즉, $$f$$가 $$x=c$$에서 연속이더라도 $$f$$가 $$x=c$$에서 반드시 미분가능한 것은 아니다. 예를 들어 $$y=|x|$$ 같은 함수는 $$x=0$$에서 연속이지만 좌우 미분계수가 다르므로 $$x=0$$에서 미분가능하지 않다.[4] 카를 바이어슈트라스는 '''모든 점에서 연속이지만 동시에 모든 점에서 미분 불가능한 함수'''를 제시하기도 했다.
미분가능하지 않은 점에는 연속이 아닌 점, 첨점(뾰족점), 접선의 기울기가 발산하는 점[5] 등이 있다.
3. 변화율
4. 미분법
5. 평균값 정리
6. 기타
영국 수학계는 라이프니츠 식이 나온 이후에도 뉴턴 식을 고집하다가 결국 유럽 대륙에 비해 수학의 발전이 약 1 ~ 200년 정도 뒤처지게 된다. 은근히 안습.
뉴턴과 라이프니츠 이전에, 사실 피에르 드 페르마가 좌표평면 비슷한 것을 만들면서 접선을 구하는 방법을 생각해냈다.[6] 미분을 도입할 때 곡선상의 두 점에 대해 두 점을 잇는 직선인 할선을 생각한 후에, 한 점을 다른 한점에 극한으로 보내는 방식이 페르마가 생각했던 접선을 정의하는 방식이다. 다만 이는 모든 곡선에 보편적으로 적용할 수 있는 ''''완전한 해법'은 결코 아니었으며,''' 이러한 모든 곡선, 모든 점에서의 접선을 구할 수 있는 일반적인 방법은 뉴턴과 라이프니츠가 거의 동일한 시기에 '최초로' 발견해낸 것이 옳다.
물리 공부할 때에는 적분과 더불어 사실상 필수이다[7] . 물론 고등학생 수준에서는 최저값/최고값 찾기에나 쓰지만, 배워 놓으면 꽤 편리할 뿐만 아니라 물리 개념 이해에 도움을 주기 때문에 배워놓는 것을 권장한다.[8] 상경계열 학생들에게도 필수다. 경제학에서 모형분석 시 자주 사용한다는 차원을 넘어서 경제원론 수준에서조차 탄력성, 한계효용 개념에서부터 미분 개념이 등장하기 때문에 못 하면 매우 피곤하다. 공학에서도 공학수학의 기초 중 하나이기 때문에 필수다. 사실상 수식을 사용하는 거의 모든 학문에 필수로 들어간다고 보면 된다.
사실 적분에 비해서는 계산이 훨씬 쉬운 편이다. 오죽하면 미분은 기술이지만 적분은 예술이라는 말이 있을 정도. 곱의 형태나 분수 형태로 된 함수도 공식만 잘 적용하면 쉽게 계산이 가능한 데다(참고로 곱이나 분수 형태의 함수를 적분하기 위한 일반적인 해법은 없다.[9] ) 위에 설명한 chain rule의 존재로 인해 아무리 지수가 높아진 함수라도 계산이 복잡해질 뿐 도함수를 아예 못 구하는 경우는 많지 않기 때문이다. $$y=x^x$$ 처럼 겉보기에는 절대로 도함수를 못 구할 것처럼 보이는 함수도 양쪽에 로그를 취하고 chain rule을 사용하면 도함수를 구할 수 있다.[10] 단, 지수, 로그, 삼각함수[11] 같은 특수 함수의 도함수는 매번 극한을 써서 유도해내어 쓸 수 없으니 시험 잘 보려면 닥치고 외워야 한다(...). 정 뭣하면 오일러의 공식이라도 알아두자. 지수함수로부터 삼각함수를, 삼각함수로부터 지수함수를 유도해낼 수 있는 마법을 쓸 수 있다!
보다 고급 과정으로 들어가면 연속함수가 아닌 함수의 미분을 생각할 수가 있다. 재미있게도 정의하는 과정에서 '''적분'''이 등장하는데, 제대로 이해하기 위해서는 사전에 측도론(measure theory)에 관한 지식이 필히 요구된다.[12]
7. 관련 문서
- 고급 수학Ⅰ
- 고급 수학Ⅱ
- 델 - 스칼라 장의 변화, 벡터장의 발산, 회전 등을 나타내는 데 쓰이는 연산자이다.
- 적분
- 차분
- AP 미적분학
- 미분과 적분(7차)
- 미분귀신
- 미분방정식
- 미적분(교과)
- 미적분 I
- 미적분 II
- 미적분의 기본정리
- 미적분과 통계 기본
- 미적분을 배우지 않은 문과생
- 수학Ⅱ(2015)
- 적분과 통계
- 로피탈의 정리
[1] 미분형식 참조[2] 정확히는, 방향을 고정하면 이런 식의 미분값들을 생각할 수는 있다. 방향도함수라고 하는데, 편미분도 여기에 속한다. 하지만, 모든 방향에 대해서 방향도함수 값이 존재하면서도 연속은 안 되는 골때리는 상황도 존재하므로, 다른 방향의 일반화를 생각하는 것이다.[3] 단, 먼저 존재성을 따져야 한다. 이런 선형 근사 함수가 존재할 때 미분가능, 존재하지 않으면 미분 불가능이라 한다.[4] 참고로 $$|x|$$의 실제 미분은 $$|x| \to \mathrm{sgn}(x) \to 2\delta(x) \to 2\delta'(x) \cdots$$ 같은 식으로 흘러간다.[5] 쉽게 말해 접선이 y축에 평행한 경우. 예를 들면 $$\displaystyle \lim_{x \to 0^+} \dfrac{{\rm d} \sqrt{x}}{{\rm d}x} = \infty$$[6] 좌표평면은 데카르트와 독자적으로 연구해서 '대수기하학'의 시초기도 하다.[7] 애초에 그 유명한 $$\mathbf{F}=m \mathbf{a}$$도 미분방정식이다![8] 사실 대학별 논술시험에서는 막 나온다.[9] 곱의 형태로 된 함수를 적분하기 위해 부분적분이란 기법이 등장하긴 했지만 (부분적분의 기법 자체는 f(x)g(x) = f'(x)g(x) + f(x)g'(x) 의 양변을 적분해본 일반화된 공식에서 등장한다) 이 방법을 써도 풀리기는커녕 오히려 더 복잡해지는 함수가 훨씬 많다(대표적으로 $$e^x \tan x$$). 또 치환적분이란 테크닉이 있기도 하지만 치환적분은 이걸 이렇게 치환하면 계산이 편해지는구나~ 라고 '''이미 알고 있는''' 함수를 적분하기 위해서 쓰는 방법이다.[10] $$y=x^x, \log_e y=x \log_e x, \dfrac{y'}{y}=1+\log_e x, y'=y(1+\log_e x), y'=x^x+x^x\log_e x$$[11] 그나마 지수 같은 경우는 미분해 보았자 원함수에 ln(a)만 붙으니 외우기 쉽다.[12] 이러한 정의에서는 함수값이 측도가 0인 집합에서 다른 것은 별 문제가 되지 않는다. 예를 들면 항등함수 0과 유리수에서 1, 무리수에서 0의 값을 갖는 함수는 같은 것으로 본다. 어차피 적분하면 0이므로.