확률밀도함수
[clearfix]
probability density function
1. 개요
연속 확률 변수를 나타내는 함수. 확률 질량 함수의 연속형 version.
2. 정의
(절대)연속확률변수 X에 대해서 $$ F(x) $$가 누적분포함수 일때
X의 확률밀도함수 $$ f (x) $$는
$$ F(x) =\int _{ -\infty }^{ x }{f(t)dt }$$ 로 정의한다.
여기서 미분불가능한 지점은 기껏해야 셀 수 있어야 하며 그 지점에서의 f의 값은 어느값이어도 제한이 없으나 통상적으로
좌연속이거나 우연속이 되도록 지정해준다.
정규 분포에 사용되는 확률밀도함수는 $$f(x) = e^{-x^2}$$라는 지수함수로 주어진다.
3. 절대 연속 조건
보통의 이공계에서는 (절대)라는 조건을 생략하고 그냥 가르치는 경우가 많다. 하지만 위의 정의의 식이 말이 되게 하는 f가 존재하려면 반드시 F의 절대연속성이 보장되어야 한다. 따라서 절대연속의 개념을 첨부한다.
4. 의미
어떤 확률변수X를 완벽하게 묘사하는 함수는 누적분포함수(CDF) $$ F(x) $$이다. 이는 X가 이산이든 연속이든 이산과 연속이 섞인 형태이든 변하지 않는 진리이다. 하지만 실제 상황이나 문제에서는 CDF를 다루는 상황보다 확률밀도함수(pdf)를 다루는 경우가 훨씬 많다. 그러므로 확률밀도함수의 개념을 이해하는 것은 매우 중요하다.
이 개념에 확률 '밀도' 함수라는 개념이 붙은 이유를 알아야 하는데 이는 확률 '질량'함수에서의 이유와 같다. 기본적으로 연속형 확률변수의 경우에는 개별 값들에 대한 확률값이 존재하지 않는다. 연속의 경우에는 반드시 구간단위로 확률이 존재할 수 밖에 없는데 확률밀도 함수는 특정 지점에대한 값을 말한다.
직관적으로 자연스럽게 pdf의 값은 x주변의 미소구간에서의 미소확률(질량)에대한 밀도값이라는것을 알 수 있다.
즉 선형밀도=질량/길이 와 동일하게 pdf=미소확률/dx 인 것이다. 여기서 미소구간길이dx가 부피에 해당된다.
그러므로 $$f(x)=\lim _{ \Delta x\to 0 }{ \frac { P(x\le X\le x+\Delta x) }{ \Delta x } }=\lim _{ \Delta x\to 0 }{ \frac { F(x+\Delta x)-F(x) }{ \Delta x } }=\frac { dF }{ dx } $$이므로 정의의 그것과 일치한다.
제대로 이해하고 싶다면 수학과의 해석학과 실해석학을 이수하여 르베그 적분과 일반화된 도함수의 정의를 공부해보자
Y축을 중심으로 위로 볼록한 함수이기 때문에 디랙 델타 함수의 주춧돌로 쓸 수 있는 함수이기도 하다.