젠센 부등식

 

1. 개요 및 진술
2. 증명
3. 활용
4. 확장
5. 관련 문서


1. 개요 및 진술


Jensen Inequality
옌센 부등식이라고도 한다. 덴마크의 수학자 요한 옌센(Johan Jensen)에 의해 발표된 부등식이다. 수학경시 등 고교 과정의 이산적인 버전.

함수 $$f:I\to R$$이 볼록함수라고 하자. 그러면, 임의의 $$x_1,x_2,\cdots,x_n\in I$$와 $$\lambda_1+\lambda_2+\cdots+\lambda_n=1$$을 만족하는 임의의 음이 아닌 실수 $$\lambda_1,\lambda_2,\cdots,\lambda_n$$에 대하여 $$\lambda_1 f\left(x_1\right)+\lambda_2 f\left(x_2\right)+\cdots+\lambda_n f\left(x_n\right)\geq f\left(\lambda_1 x_1+\lambda_2 x_2 +\cdots+\lambda_n x_n\right)$$이다. 만약 $$f$$가 오목함수이면, 위 부등식의 부호가 반대이다.

또는 확률론 등에서 나오는 일반화된 버전

볼록함수 $$f$$와 적분가능한 확률변수 $$X$$에 대해, $$ \mathbb{E} \left[ f(X) \right] \ge f \left( \mathbb{E}[X] \right) $$ 가 성립한다.[1]

이 있다. 볼록함수에 대해서는 문서 참조.[2] 아래의 버전에서 $$X$$를 $$P(X=x_i) = \lambda_i $$인 이산확률변수로 설정하면 위의 버전이 됨을 확인할 수 있다.
한마디로 요약하면 아래로 볼록한 함수에서 ''함숫값의 산술평균값이 산술평균값의 함숫값보다 크거나 같다''는 내용이다.
수학 경시대회의 젠센 부등식은 절대부등식을 증명하는 데에 있어 반드시 알아놔야 할 아주 '''강력한''' 부등식으로 평가받는다. 특히 수학 경시대회에서 출제된 부등식 문제가 볼록 (오목) 함수에 관한 것이라 추측이 가능하면 대부분 이 젠센 부등식으로 해결이 가능하다. 합이 주어진 상황에서 함수값의 최적화를 생각하는 사실상의 일반적인 방법으로 생각할 수 있다.
물론 젠센 부등식의 진가는 경시대회에 국한되지 않는다. 마치 벡터만 있으면 나오는 코시-슈바르츠 부등식처럼, 볼록성과 관련된 다방면에 걸친 현상을 설명하는 '''근본적인''' 부등식으로 간주되어 확률론, 통계학, 통계 역학, 금융수학 등 정말 다양한 분야에서 자연스럽게 등장하곤 한다.

2. 증명


$$f$$가 두번 미분가능할 때의 증명은 다음과 같다. $$ x_0 = \mathbb{E}[X]$$에 대해 볼록함수에 대한 부등식 $$ f(x) \ge f'(x_0) (x-x_0) + f(x_0)$$ 을 생각한다. (증명은 구간 $$[x_0,x]$$ 또는 $$[x,x_0]$$ 에서 평균값 정리를 쓰면 된다.) 여기서 $$x=X$$로 놓고 기대값을 취해주면 끝. 미분가능하지 않은 일반적인 볼록함수에 대해서도, 어떤 상수 $$a$$가 존재해
$$ f(x) \ge a (x-x_0) + f(x_0)\quad\cdots \left(*\right)$$
를 만족시킨다는 사실은 변함없기 때문에 그대로 진행하면 된다.
(*)의 자세한 증명
구간 $$[a,b]$$에서의 평균변화율을 $$ df_{p,q} = \dfrac{f(q)-f(p)}{q-p} $$ 라 표기하자. 다음을 먼저 증명한다.

$$p < q < r $$에 대해 $$df_{p,q} \le df_{p,r} \le df_{q,r} $$ 이다.

이는 볼록함수의 정의로부터 따라나오는 $$(r-p)f(q) \le (r-q)f(p) + (q-p)f(r) $$을 변형시켜서 $$ (r-p)(f(q)-f(p)) \le (q-p)(f(r)-f(p))$$, $$ (r-p)(f(q)-f(r)) \le (r-q)(f(p)-f(r)) $$ 등을 얻어내면 된다. 위의 성질을 이용하면 $$h_1 > h_2 > 0$$에 대해
$$df_{x_0-h_1, x} \le df_{x_0-h_2, x} \le df_{x_0,x_0+h_2} \le df_{x_0,x_0+h_1}$$
을 알 수 있고, 따라서 좌미분 $$ d_{-}f(x_0) = \liminf_{h \rightarrow 0+} df_{x_0-h,x_0} $$와 우미분 $$ d_{+}f(x_0) = \liminf_{h \rightarrow 0+} df_{x_0,x_0+h} $$가 존재하고 $$d_{-}f(x_0) \le d_{+}f(x_0)$$임을 알 수 있다. 이제 $$a$$를 $$[d_{-}f(x_0),d_{+}f(x_0)]$$ 사이의 아무 숫자로 잡으면, $$x > x_0$$에 대해
$$ f(x) - f(x_0) = df_{x_0,x}(x-x_0) \ge d_{+}f(x_0) (x-x_0) \ge a (x-x_0) $$
이고, $$x < x_0$$에 대해서는
$$ f(x) - f(x_0) = df_{x_0,x}(x-x_0) \ge d_{-}f(x_0) (x-x_0) \ge a (x-x_0) $$
이므로 성립한다.

이므로 성립한다.}}}
경시대회 등에서 이산적인 경우는 보통 수학적 귀납법을 이용해 다음처럼 증명한다.
$$n=2$$일 때는 볼록함수의 정의에 의해 성립한다.
이제 $$n=k$$일 때 성립한다고 가정하자.
$$\lambda_k>0$$이고 $$\lambda_1+\lambda_2+\cdots+\lambda_k+\lambda_{k+1}=1$$일 때
$$\sum_{i=1}^{k+1}\lambda_i f\left(x_i\right)=\left(1-\lambda_{k+1}\right)\sum_{i=1}^{k}\frac{\lambda_i}{1-\lambda_{k+1}}f\left(x_i\right)+\lambda_{k+1}f\left(x_{k+1}\right)\quad\cdots \left(1\right)$$이다.
이 때 $$\lambda_1+\lambda_2+\cdots+\lambda_k=1-\lambda_{k+1}$$이므로 $$\sum_{i=1}^{k}\frac{\lambda_i}{1-\lambda_{k+1}}=1$$이다.
$$n=k$$일 때 성립한다고 가정했으므로 $$\sum_{i=1}^{k}\frac{\lambda_i}{1-\lambda_{k+1}}=1$$일 때
$$\sum_{i=1}^{k}\frac{\lambda_i}{1-\lambda_{k+1}}f\left(x_i\right)\geq f\left(\sum_{i=1}^{k}\frac{\lambda_i x_i}{1-\lambda_{k+1}}\right)$$가 성립한다.
이 식을 $$\left(1\right)$$에 대입하면
$$\sum_{i=1}^{k+1}\lambda_i f\left(x_i\right)=\left(1-\lambda_{k+1}\right)\sum_{i=1}^{k}\frac{\lambda_i}{1-\lambda_{k+1}}f\left(x_i\right)+\lambda_{k+1}f\left(x_{k+1}\right)\geq\left(1-\lambda_{k+1}\right)f\left(\sum_{i=1}^{k}\frac{\lambda_i x_i}{1-\lambda_{k+1}}\right)+\lambda_{k+1}f\left(x_{k+1}\right)\geq f\left(\sum_{i=1}^{k+1}\lambda_i x_i\right)$$가 성립하게 되어 $$n=k+1$$일 때도 성립한다.
함수 $$f$$가 오목함수일 때도 같은 방법으로 증명이 가능하다. $$f$$가 오목함수이면 $$-f$$가 볼록함수이므로 부호만 바꿔주면 된다.

3. 활용


$$f\left(x\right)=\ln x$$, $$\lambda_i=\frac{1}{n}$$라 하자. 로그함수는 오목함수이므로 위 부등식의 방향을 뒤집고 잘 정리해주면 산술·기하 평균 부등식이 튀어나온다! 한 줄 짜리 증명이 되어버리는 것. 이 외에도 삼각형의 세 각 $$\alpha,\beta,\gamma$$에 대해 $$\sin\alpha+\sin\beta+\sin\gamma\leq\frac{3\sqrt{3}}{2}$$같은 유명한 부등식을 증명하는데도 젠센 부등식이 가장 효과적이다.
$$L^p $$ 공간을 연구할 때 쓰이는 횔더부등식 (Hölder's inequality)를 유도할 때 중요하게 쓰이는 부등식이다. 또한 해당 부등식으로부터 민코프스키 부등식 (Minkowski inequality) 를 유도하면 해당 공간에 노름을 정의할 수 있다.
여러 응용수학에서도 확률변수와 볼록함수가 같이 튀어나오면 무조건 사용되는 부등식이다. 정보 이론에서 나오는 엔트로피에 대한 Gibbs 부등식 $$ - \sum p_i \log p_i \le - \sum p_i \log q_i $$이나, 통계역학의 여러 상황들이라던지. 금융수학 계열에서도 많이 등장하는데, 보험계리사 보험수리 시험에 나오는 젠센 부등식 (2013년) 이나 FRM: Market Risk management - fixed income 파트에서 젠센 부등식을 채권의 볼록성과 연관지어 학습하게 된다거나(증명과정까지는 요구하지 않지만 기본적인 concept을 이해하고 계산까지 할 줄 알아야 한다.) 등등의 사례가 있다.

4. 확장


개요에서 언급했듯이 젠센 부등식은 산술평균값의 함숫값과 함숫값의 산술평균값을 비교한 부등식이다. 산술평균 대신 다른 평균 (기하평균, 조화평균, 멱평균, 가중치 멱평균)을 넣어도 가능하다. 주의할 점은, 이 때는 함수를 그래프로 나타내었을 때 꼭 아래로 혹은 위로 볼록일 필요는 없다는 것이다.
양의 실수 $$x_1$$, $$x_2$$, $$\cdots$$, $$x_n$$의 $$r$$차 멱평균을 $$M_n^r \left\{ x_i \right\}$$라고 하자. 즉,
$$M_n^r \left\{ x_i \right\} = \left\{ \begin{array}{l} \sqrt[r]{\dfrac{x_1^r + x_2^r + \cdots + x_n^r}{n}} & r \neq 0\\ ~ \\ \sqrt[n]{x_1 x_2 \cdots x_n} & r=0\end{array} \right.$$ 이다.
그리고, 양의 실수 $$x_1$$, $$x_2$$, $$\cdots$$, $$x_n$$의 합이 $$1$$이고 모두 양수인 가중치 $$\lambda_1$$, $$\lambda_2$$, $$\cdots$$, $$\lambda_n$$에 대한 $$r$$차 가중치멱평균을 $$M_n^r \left\{ x_i | \lambda_i \right\}$$라고 하자. 즉,
$$M_n^r \left\{ x_i ,\lambda_i \right\} = \left\{ \begin{array}{l} \sqrt[r]{\lambda_1 x_1^r + \lambda_2 x_2^r + \cdots + \lambda_n x_n^r} & r \ne대 0\\~\\ x_1^{\lambda_1} x_2^{\lambda_2} \cdots x_n^{\lambda_n} & r=0\end{array} \right.$$ 이다.
멱평균으로 일반화한 젠센 부등식은 다음과 같다.

함수 $$f:I \rightarrow R$$와 실수 $$r$$이 주어져 있다. 임의의 $$x_1$$, $$x_2 \in I$$에 대하여, $$M_2^r \left\{ f(x_i) \right\} \ge (\le) f \left( M_2^r \{ x_i \} \right)$$이 성립하면, 임의의 자연수 $$n$$과 임의의 $$x_1$$, $$x_2$$, $$\cdots$$, $$x_n$$에 대하여 $$M_n^r \left\{ f(x_i) \right\} \ge (\le) f \left( M_n^r \{ x_i \} \right)$$이 성립한다.

그리고 가중치 멱평균으로 일반화한 젠센부등식은 다음과 같다.

함수 $$f:I \rightarrow R$$와 실수 $$r$$이 주어져 있다. 임의의 $$x_1$$, $$x_2 \in I$$와 임의의 합이 $$1$$인 양의 실수 $$\lambda_1$$, $$\lambda_2$$에 대하여, 부등식
$$M_2^r \left\{ f(x_i) |\lambda_i \right\} \ge (\le) f \left( M_2^r \{ x_i |\lambda_i \} \right)$$이 성립하면, 임의의 자연수 $$n$$과 임의의 $$x_1$$, $$x_2$$, $$\cdots$$, $$x_n$$, 그리고 합이 $$1$$인 임의의 양의 실수 $$\lambda_1$$, $$\lambda_2$$, $$\cdots$$, $$\lambda_n$$ 에 대하여 $$M_n^r \left\{ f(x_i) |\lambda_i \right\} \ge (\le) f \left( M_n^r \{ x_i |\lambda_i \} \right)$$이 성립한다.

'''하지만, 이게 끝이 아니다!''' 위 젠센 부등식을 더욱 일반화할 수 있는데, 일반화 내용은 부등식 양변의 멱평균의 차수가 같을 필요가 없다는 것이다. 즉, 멱평균과 가중치 멱평균으로 더욱 일반화된 젠센 부등식은 각각 다음과 같다.

함수 $$f:I \rightarrow R$$와 실수 $$r$$, $$s$$가 주어져 있다. 임의의 $$x_1$$, $$x_2 \in I$$에 대하여, $$M_2^r \left\{ f(x_i) \right\} \ge (\le) f \left( M_2^s \{ x_i \} \right)$$이 성립하면, 임의의 자연수 $$n$$과 임의의 $$x_1$$, $$x_2$$, $$\cdots$$, $$x_n$$에 대하여 $$M_n^r \left\{ f(x_i) \right\} \ge (\le) f \left( M_n^s \{ x_i \} \right)$$이 성립한다.

함수 $$f:I \rightarrow R$$와 실수 $$r$$, $$s$$가 주어져 있다. 임의의 $$x_1$$, $$x_2 \in I$$와 임의의 합이 $$1$$인 양의 실수 $$\lambda_1$$, $$\lambda_2$$에 대하여, 부등식
$$M_2^r \left\{ f(x_i) |\lambda_i \right\} \ge (\le) f \left( M_2^s \{ x_i |\lambda_i \} \right)$$이 성립하면, 임의의 자연수 $$n$$과 임의의 $$x_1$$, $$x_2$$, $$\cdots$$, $$x_n$$, 그리고 합이 $$1$$인 임의의 양의 실수 $$\lambda_1$$, $$\lambda_2$$, $$\cdots$$, $$\lambda_n$$ 에 대하여 $$M_n^r \left\{ f(x_i) |\lambda_i \right\} \ge (\le) f \left( M_n^s \{ x_i |\lambda_i \} \right)$$이 성립한다.

증명은 멱평균 부등식을 이용할 경우 $$n$$에 대한 확장된 귀납법 (즉, $$n$$이 $$2$$의 거듭제곱일 때 수학적 귀납법으로 증명하고, $$2$$의 거듭제곱이 아닌 경우를 나중에 증명하는 방법)으로 증명하고, 가중치 멱평균 부등식을 이용할 경우 $$n$$에 대한 일반적인 수학적 귀납법을 이용하면 된다.

5. 관련 문서



[1] $$f(X)$$가 적분가능할 필요는 없다. $$f(X)$$의 음수 부분이 적분가능하며, 양수 부분의 적분이 발산하는 경우가 이에 해당한다. 저 부등식은 그대로 성립.[2] 간단히 설명하면, 그래프가 아래로 볼록하게 생긴 함수를 볼록함수라 한다. 즉, 그래프 위의 어느 두 점을 찍더라도 그 점을 이은 선분보다 그래프가 밑에 있다.