GARCH
'''G'''eneralized '''A'''uto'''R'''egressive '''C'''onditional '''H'''eteroskedasticity
(일반 자기회귀 조건부 이분산성)
1. 개요
ARCH 모형의 파생형 중 하나로 어떤 시계열의 평균은 예측하지 못해도 분산은 예측할 수 있는 경우라 할 수 있다. 금융시장에서 각종 가격변수들을 예측할 때 널리 사용된다. FRM 등의 시험에도 출제되는 매우 범용적인 부분.
2. 정의
$$\epsilon_{t}$$를 white noise, $$\omega$$를 상수라 하자. 이때 $$\sigma_{t}^{2}\sim GARCH(p, q)$$ 모형은 다음과 같이 정의된다.
$$\sigma_{t}^{2}=\omega+\alpha_{1}\epsilon_{t-1}^{2}+\cdots+\alpha_{q}\epsilon_{t-q}^{2}+\beta_{1}\sigma_{t-1}^{2}+\cdots+\beta_{p}\sigma_{t-p}^{2}$$
일반적으로 가장 많이 사용되는 모형은 GARCH(1, 1)이다.
$$\sigma_{t}^{2}=\omega+\alpha\epsilon_{t-1}^{2}+\beta\sigma_{t-1}^{2}$$
3. 특징
KOSPI지수를 분석해보면 지수의 값은 랜덤워크에 가깝게 움직인다. 즉, 내일 코스피 지수는 '오늘 코스피 지수 +- 무작위 오차'식으로 예측할 수 있다. 그러나 지수의 변동성(표준편차, 분산)은 오늘 낮으면 내일도 낮고 오늘 높으면 내일도 높은 식의 관계가 존재한다.(volatility clustering) 바꿔 말해서 박스피는 계속 박스피로 남고, 천천히 올라가는 장이면 계속 천천히 오르거나 내리고, 급락/급등장에서는 또 급락/급등이 이어질 확률이 높다는 것이다. 따라서 지수 자체를 예측하는것은 힘들지만 그 변동성을 예측하기위해 나온 모형이 ARCH, GARCH 모형이다.
얼핏 생각해보면 분산을 예측하는 것이 의미 없다 여길 수 있지만 분산이 곧 리스크[1] 인 만큼 중요할 수밖에 없는 분야.[2]
구체적인 계산방법은 매 기간[3] 의 수익률을 구한 다음 첫날의 분산을 수익률의 제곱으로 구하고 두번째날부터의 분산은 전날의 수익률, 분산과 절편을 구하면서 절편과 가중치는 특정 분포[4] 에 잘 들어맞는 최우추정법(MLE)을 사용하므로 수치해석방법으로 구한다. 그렇게 되면 절편/(1-(가중치 합))이 변동성이 된다.
전날 하루치의 수익률과 분산만 반영하면 GARCH(1, 1)이다. 이게 제일 보편적이다. GARCH(1, 1)로 파라미터(절편과 가중치)가 적절하지 않은 값이 나오면 n,m이나 파생모형을 사용한다. 이틀치 수익률과 하루치 분산은 GARCH(2, 1) 이런 식이다.
4. ARCH에서 GARCH가 파생된 이유
ARCH는 공적분(cointegration)에 대한 연구 공로로 노벨경제학상을 탄 C. Granger와 R. Engle 중 Engle이 만든 모형으로 시계열 데이터 자체보다는 해당 시계열의 변동성의 분석 및 예측을 위한 모형으로 시계열 자료의 오차항, 조건부분산 등을 이용하여 모형을 추정한다. 그런데 ARCH 모형은 시차를 얼마나 줄 것인지, nonnegativity 조건[5] 이 깨질 위험성 등이 있기 때문에 이를 보완하기 위해 만들어진 것이 GARCH 모형이다. 실제로 ARCH(∞) 모형이 GARCH(1, 1)과 동치이기 때문에 훨씬 적은 파라미터로 동일하거나 더 나은 설명력을 보여준다. 이러한 이유로 실증분석 논문들을 보면 거의 모든 논문들이 ARCH 대신 GARCH나 GARCH를 변형한 모형을 쓴다. GARCH를 변형한 모형으로는 IGARCH, EGARCH, GJR-GARCH, TGARCH, NGARCH, fGARCH 등이 있다.
[1] 물론 리스크란 단어는 여러가지로 이해될 수 있다.[2] 단적으로 우리나라의 산업생산지수는 코스피의 분산에 상당한 영향을 받는다.[3] 연, 월, 일, 시 등.[4] 보통 정규분포이다.[5] 단, 분산은 항상 0보다 크거나 같아야 한다.