DIPS

1. 개요

2. 배경

3. 등장

4. 근거

4.1. 태생적 한계

5. 의문과 설명

5.1. 뛰어난 투수들은 BABIP를 어느 정도 낮출 수 있다

5.2. 맞혀잡는 유형의 투수를 저평가한다

5.3. 위기 관리 능력을 무시한다

5.4. ERA를 예측하기 위한 종속적인 보조 지표로 개발되었다

5.5. 통계적 아웃라이어가 존재할 수 있다

5.6. 의미 퇴색

5.7. KBO 리그와 FIP

6. 보완

7. 평가

8. 계산 방법

8.1. 보로스 맥크라켄의 DIPS

8.2. 톰 탱고의 FIP

9. 관련 문서

1. 개요

'DIPS'는 'Defense Independent Pitching Statistics (수비 무관 투구 기록)'의 약자로, 보로스 맥크라켄이란 사람이 만든 투수 평가를 위한 세이버메트릭스 기록의 하나다. 이것은 수비수들의 수비와 무관하다 볼 수 있는 기록인, 삼진, 사사구, 홈런만을 통해 투수의 기록을 재구성한 것이다. 또한 수비를 완전히 배제한다는 이 개념을 공유하는 모든 지표들에 대한 통칭이다.
비교적 익숙한 'FIP'이란 지표는 톰 탱고에 의해 고안된 DIPS 기반 평균자책점의 한 종류로, 'Fielding Independent Pitching(수비 무관 투구)'의 약자다.

2. 배경

투수의 승패와 평균자책점은 매우 오래 전부터 투수를 평가하는 대표적인 지표로 자리잡아왔으며, 현재까지도 그 위상을 (과거만큼 절대적이지는 않으나) 유지하고 있다. 하지만 동시에, 일찍부터 눈썰미 있던 일부 사람들은 해당 기록이 가지는 단점을 알아채고 비판해왔다.
투수를 평가하는 클래식 스탯 중 승패는 투수의 기량과 상관없는 팀 타선의 득점력이 큰 요인으로 작용한다는 명확한 단점을 가지고 있는만큼, 오랜 기간 동안 강한 비판의 대상이 되어왔다. 그 결과, 최근에 접어들어선 평가 지표로서의 가치는 거의 상실해 그 상징성만 유지하고 있는 상태이다.
그렇지만 평균자책점만은 여전히 강한 영향력을 유지하고 있다. 그러나, 평균자책점 역시 큰 문제를 내포하고 있다는 점은 승패와 마찬가지다. 평자점이 도입된 배경은 다음과 같다. 실점을 많고 적게 하는 것은 투수의 책임이 크긴 하다. 하지만 이걸 투수 혼자만의 책임으로 볼 순 없다. 수비는 투수와 동료 수비수들이 함께 하는 것이기 때문이다. 그렇기에 온전한 투수의 능력을 평가하기 위해선 동료 수비수들의 영향을 배제할 필요가 생긴다. 이를 해결하기 위해 도입된 개념이 자책점이다. 자책점은 수비수들이 평균 이하의 플레이, 즉, 실책을 저질렀을 때 해당 상황을 재구성해 투수에게 타당하다 여겨지는 점수를 부여한다.
언뜻 생각해보면 평균자책점이 합리적으로 보이지만 실상은 그렇지 않다. 문제는 실책이 기록자의 주관에 의해 결정된다는 것이다. 기록관의 실력과 무관하게 수비를 평가하는 일은 매우 어려운 일로, 평가가 기계적으로 이뤄질 수 있었다면 수많은 사람들이 오랜기간 고민해 올 필요가 없었을 것이다. 기록관이 판단하는 것은 그저 '''수비수의 실수가 있었는가 뿐'''이다.즉 수비수가 공을 실수없이 포구했는가, 송구와 그에 대한 포구가 실수없이 이뤄졌는가 정도에 그친다. 수비 범위가 좁아서 자연스럽게 무수한 안타를 허용하는 것이나, 반대로 중견수가 외야를 휘저으며 타자의 안타를 막아내는 것들은 고려하지 않는다.
그리고 2아웃 이후 실책이 나왔을 경우, 이후 투수가 해당 이닝에 몇 점을 더 내주건 그건 투수의 자책점이 아니게 된다는 점도 지적받는다. 실책이 없었다는 가정 상 해당 이닝은 이미 종료됐으므로 이후에 준 점수는 투수의 책임이 아닌 것으로 계산되는 것이다. 이런 방식은 엄연한 투수의 투구 내용을 표본에서 배제하는 것으로 적절하다고 보기 어렵다. 야수 실책 후에 계속해서 얻어터지는 투수와 침착하게 후속타자를 바로 잡아내는 뛰어난 투수가 똑같게 취급받는 것이다. 또한 주자를 남겨놓고 마운드에서 내려갔을 경우, 투수 본인과 상관이 없는 후속 투수의 능력에 의해 자책점이 달라질 수 있다는 점 또한 문제로 지적되고 있다.[1]
이렇듯 투수를 평가하기 위한 기존 지표들의 한계는 명확했고, 이를 극복하기 위한 많은 시도들이 있어왔다. 하지만 그럼에도 불구하고 '투수의 투구'와 '수비수의 수비'를 분리하는 일만큼은 난제에 가까웠는데, 이 둘은 매우 밀접하게 관련돼 있었기 때문이다.

3. 등장

그러던 1999년 11월 18일, 세이버메트리션들의 오랜 숙원이었던 투구와 수비의 분리에 대한 하나의 답이 세상이 나왔다. 보로스 맥크라켄이 당시 유즈넷 커뮤니티를 통해 DIPS를 발표했던 것이다.
이때 맥크라켄이 내놓은 답은 아예 무시하라는 것이었다. 그는 볼 인 플레이 상황이 됐을 때 그것이 안타가 되는 비율, 즉, 'BABIP(Batting Average on Ball In Play)'[2]는 투수의 능력과 무관하다. 그러므로 투수의 능력을 평가함에 있어 이를 배제해야 한다는 주장을 폈다.
이 내용은 당시로선 말도 안 되는 이야기처럼 여겨졌다. 이 때까지만 해도 야구계 전반은 물론, 세이버메트리션들 사이에서도 인플레이된 공이 범타가 되느냐 안타가 되느냐의 여부는, 투수의 기량이 크게 영향을 미친다는 것이 상식이었으니 당연한 일이었다. 이후 맥크라켄은 빌 제임스를 비롯한 많은 세이버메트리션들의 반발을 겪었고, 심지어 일부로부터는 조롱까지 받기도 했다.
그러한 조롱은 자료가 누적되면서 유감스럽게도 사실로 드러났다. 후속 연구결과 ''''투수가 BABIP에 30% 정도 영향을 미친다''''는 결과가 나온 것이다.[3] 즉, DIPS 개념은 대전제부터 잘못되었다. 다만 수비의 비중을 줄이고 투수를 평가한다는 관점 정도는 여전히 유효하다.
다만 이것은 자료가 누적된 훗날의 이야기이고, 처음 등장했을 당시에는 우연찮게 여러가지 요인이 맞아떨어지며 혁신적인 발견이라는 평을 들었었다. 왜 그런 평을 들었고 그런 평가가 뒤집혔는지는 후술.

4. 근거

맥크라켄이 그런 황당해보이던 주장을 한 것은 근거가 있었다. 맥크라켄의 연구 결과에 따르면, 삼진, 사사구, 홈런은 매년 투수 나름의 고유한 값을 유지하는 경향이 있었던 반면, BABIP는 그렇다고 볼 수 없었다. 투수의 BABIP는 매년 크게 변동했고,[4][5] 투수 고유의 값을 가지기 보단 리그 평균에 근처에서 머무르는 경향을 보였다. 그리고 투수의 BABIP가 높거나 낮은 경우는 팀 동료들의 기록 역시 비슷한 양상을 보였다. 또한 DIPS에 기반해 투수의 미래를 예측하는 편이 평균자책점을 이용하는 것보다 훨씬 정확했다.[6]
바로 이런 결과를 통해 맥크라켄은 투수의 BABIP에는 투수 기량 외적 요인, 즉 팀의 수비력과 구장, 그리고 운이 매우 큰 영향을 미친다는 결론에 도달했던 것이다.
왜 이런 결과가 나오는지 정확히 설명할 순 없었지만, 이런 결과가 나온다는 것만은 사실이었다. 처음 이 의견에 반대했던 세이버메트리션들도 시간이 흐를수록 맥크라켄의 주장에 동의하는 입장으로 변해갔다. 빌 제임스 역시 이후 이것을 일찍 깨닫지 못한 자신이 어리석었다며 입장을 철회했다.
랜디 존슨이 안타를 적게 맞은 것은, 그가 허용했던 타구들이 약해서라기보단 애초에 그가 볼 인 플레이 상황을 적게 만들었기 때문이라고 이전 문서에 적혀있었지만... 후속 연구결과에서 뒤집혔다. 오히려 2010년대 후반부터는 높은 K/BB(K-BB%)와 함께 약한 타구 유도가 세이버메트릭스적 투수 분석의 양대 산맥이 되었을 정도이다(타구의 질에 대한 분석은 자연스럽게 HR% 같은 요소 역시 포함하게 된다.). 맥크라켄이 분석한 99, 00년의 데이터가 하필이면 랜디 존슨의 BABIP이 리그 평균에 수렴한 시기였던 것이 원인이다.[7] 맥크라켄이 왜 이런 결과가 나오는지를 정확히 설명 할 수 없었던 이유는 단순한 우연이기 때문이었다. 우연을 논리적으로 설명 할 수는 없으니... 세이버메트리션들도 맥크라켄의 입장에 반대 → 동조 → 수정으로 태도가 지속적으로 바뀌어갔다.[8]

4.1. 태생적 한계

DIPS는 태생적으로 지나치게 급진적이어서 한계가 명확한 이론이었다. 모든 논리가 BABIP 투수 통제불가론에 기반을 두고 있는데, 그 논리적 기반이 잘못되면 이론 자체가 신뢰를 잃을 위험성이 너무 컸다. 상식적으로 한가지 지표만으로 투수의 성적을 평가 할 수 있다는 발상 자체가 비정상적이었다.
애초에 세이버메트릭스는 클래식 스탯만으로 선수의 성적을 평가할 때 발생하는 문제점을 통계를 이용해서 다각도에서 분석하려는 목적에서 시작한 것이다. 그런데 DIPS는 세이버메트릭스의 기존 접근과는 달리 투수의 성적을 획일적으로 한가지 지표만으로 평가하자는 상반된 이론이었다. 지금까지 그 주장이 당연하게 받아들여져 온 것이 오히려 더 신기한 상황이었다. 페드로 마르티네스, 랜디 존슨, 그렉 매덕스와 같은 특급 투수들의 BABIP이 패전처리 투수와 차이가 없다는 급진적 발상과 제시된 자료가 마침 자료 부족과 우연이 묘하게 겹친 결과로 그럴싸하게 맞아떨어졌고, 한가지 지표로 모든 투수의 성적을 평가할 수 있을 것이라는 근거없는 믿음이 불러온 결과였다.

5. 의문과 설명

DIPS 이론은 급진적인만큼 매력적인 부분이 많아서 많은 추종자와 반발자를 만들어냈다. 특히 투수의 미래 성적을 예측할 수 있다는 DIPS 속성은 추종자들을 열광시켰다.[9] 그 결과 FIP 주장에 대한 반론이 제시될 때마다 통계적 오차, 아웃라이어, 근거 없는 몇몇 사례라는 식으로 무시했다.
현재 DIPS 이론은 많은 부분에서 문제가 발견되어 수정되고 있으며 그만큼 위상도 많이 낮아진 상태이다.

5.1. 뛰어난 투수들은 BABIP를 어느 정도 낮출 수 있다

삼진 능력이 뛰어난 투수의 BABIP가 낮은 경향이 있긴 하다. 하지만 이는 무시할만한 수준이다.
스트라이크 존 가장자리로 잘 제구된 공의 BABIP가 낮은 것도 사실이다. 하지만 이것 또한 유의미한 차이를 낸다고 보긴 어렵다.
무엇보다 리그의 규격을 초월한 것처럼 보여지던 전설적인 투수들이 좋은 반례다. 이들은 대부분은 거의 매년 훌륭한 DIPS를 꾸준히 유지한 반면, BABIP에서 만큼은 꾸준하지 못했고, 특별하지 못했다.
-
이 주장은 거짓으로 드러났다. 전설적인 투수들 중 BABIP이 유의미하게 낮은 선수는 적지 않다.

상기 주장에 대한 반박이 BABIP 항목에 적혀 있다. '''클레이튼 커쇼 같은 플러스 피치급 패스트볼을 보유한 투수는 BABIP을 낮출 수 있다'''. 삼진을 많이 잡는 선발 투수와 마무리 투수의 BABIP은 유의미하게 낮다. 초기에는 위 주장은 맞는 것처럼 보였지만, 후속 연구로 자료가 축적되면서 뛰어난 투수들은 BABIP을 유의미하게 낮출 수 있음이 밝혀졌다.

5.2. 맞혀잡는 유형의 투수를 저평가한다

삼진은 적지만 좋은 성적을 내는, 소위 '맞혀잡는 투수'들을 저평가한다는 의문을 가지는 사람이 많다. 하지만 DIPS는 단순히 삼진을 최고로 여기는 게 아니다. 볼넷과 함께 홈런도 평가에 포함된다. DIPS는 삼진을 많이 잡지 못하더라도 볼넷과 홈런을 억제할 수 있다면 훌륭한 투수가 될 수 있다는 것을 보여준다.[10]
물론 매덕스는 통산 삼진이 3000개가 넘는다. 하지만 그건 통산 5008이닝이나 던졌기 때문이고, 통산 9이닝당 탈삼진이 6.1개, 커리어하이 시즌도 1995년 7.8개 정도로 그리 높지않은 편이다.
'FIP가 땅볼투수를 저평가한다'고 말하고 싶다면, 땅볼 비율이 높은 투수들이 BABIP가 낮은 경향이 있다(또는 ERA가 FIP보다 낮은 경향이 있다)는 걸 보여줘야 하는데, 당연히 그런 결과는 안 나온다.
대체로 그런 주장을 하는 사람들은, 땅볼 비율이 높으면서 BABIP가 유독 낮았던 케이스를 몇 개 들고와 이야기하는 게 전부다. 찾자면 삼진을 많이 잡으면서 BABIP가 낮았던 경우도 찾을 수 있고, 같은 방식으로 'BABIP은 삼진을 많이 잡는 투수를 저평가 한다'고 주장할 수도 있을 것이다. 물론 어느 쪽이든 제대로 조사하면 유의미한 경향은 안 나온다.
덧붙이자면, 땅볼투수들에게선 ERA가 낮아보이는 '착시현상'을 포착할 수 있는데, 이 부분이 저러한 통념에 기여했을 수도 있다. 똑같은 수비지원 하에서 똑같은 이닝, 똑같은 실점을 기록한 땅볼투수와 뜬공투수가 각각 있을 경우, 자책점이 더 적은 쪽은 땅볼투수일 공산이 크다. 땅볼투수들은 속된말로 자책점을 '세탁'해 비자책점으로 만드는 일이 다른 투수들에 비해 잦기 때문이다. 뜬공에 비해 땅볼 에러가 많은 건 수비의 능력과 별개로 당연한 현상이다. 보통 리그 평균의 자책점/실점 비율은 0.93 정도지만, 땅볼투수들의 평균은 그보다 더 낮다.
다만 1사 1, 3루 등 어떤 상황에서는 삼진보다 땅볼유도가 병살을 만들어내기에 좋기 때문에 일부러 땅볼을 유도하는 경우가 많은데, 이런 것은 FIP가 반영하지 못하는 부분이다. 또한 이렇게 땅볼유도를 하는 상황들은 보통 투수에겐 위기상황인 경우가 많기 때문에 바로 아래의 항목과도 연관이 있다.

상기 주장에 대한 반박이 BABIP 항목에 적혀있는데, 요약하자면 ''''땅볼이 된 타구는 장타가 될 확률이 낮다''''는 것이다. 역시 BABIP 항목에 있지만, 땅볼로 맞춰잡는 투수들은 수비가 쉬운 땅볼을 유도할 수 있고 그렇게 한다. 수비가 쉬운 타구를 유도하는 것도 투수의 능력이며, 이것조차 수비빨이라고 한다면 다른 구기 스포츠와 마찬가지로 야구도 팀 플레이라는 사실을 잊어버린 것이다. 투수의 능력을 제대로 평가한다는 명분을 핑계로 야구를 개인 스포츠화 시켜서는 안된다. 야구는 한 명의 타자와 아홉 명의 야수가 교대로 겨루는 팀 스포츠이며 축구의 승부차기와 같이 1:1로 대결하는 같은 룰 같은 것은 애초에 없다. 팀 스포츠에서 동료의 능력을 살리는 것도 그 투수의 능력이다.

5.3. 위기 관리 능력을 무시한다

DIPS도 각각의 이벤트들의 가치를 종합한 컴포넌트 ERA로 볼 수 있으므로 이 말은 맞는 말이다. 세이버메트릭스 스탯에서는 위기관리 능력을 평가하는 것에 대해 비관적인 입장이다. 이는 클러치 히터 논쟁이 좋은 참고가 될 것이다.

상기 주장에 대한 반박이 클러치 히터 항목에 적혀 있다. 아직까지는 투수의 위기 관리 능력을 평가하는 설득력 있는 평가 지표가 없는 것은 맞다. 하지만 모든 투수의 위기 관리 능력이 동일하다는 이야기는 아니다. '평가 지표가 없다'는 것과 '그런 능력은 없다'는 같은 의미가 아니다. 주자 유무에 따른 투수의 피장타율 차이만 보더라도 무시하기에는 투수별 편차가 상당히 큰 편이며, 땅볼투수의 경우 피장타율이 유의미하게 낮은 경향을 보였다. 투수의 위기 관리 능력이란 존재하지 않는다고 주장하는 것은 위험한 발상이다.

5.4. ERA를 예측하기 위한 종속적인 보조 지표로 개발되었다

사람들이 DIPS의 미래 예측력이 뛰어나다는 점을 잘못 받아들여, DIPS가 미래를 예측하기 위해 설계됐다고 생각하는 경향이 있다. DIPS의 목적은 미래 예측이 아니라 이미 일어난 일에 대한 평가이고, DIPS가 예측력이 뛰어난 건 그저 기량 외적 노이즈를 제거해서 투수의 기량을 더 잘 파악한 결과일뿐, 그걸 위해 설계됐기 때문이 아니다.
DIPS는 '무엇이 일어날까?'에 대한 답이 아니라 '무엇이 일어났어야 했는가?'에 대한 답이라고 볼 수 있다.

위쪽 문단에서 DIPS의 예측성을 이야기하던 추종자들이 뒤늦게 주장을 바꿨다. 한마디로 비겁한 변명이다. 이 말대로라면 그동안 ERA-FIP 격차가 많이 나던(특히 FIP가 더 높게 나오던) 투수들을 폄하한 것은 자기모순적인 행위가 되어버린다. 미래를 예측하기 위해 만든 스탯이 아닌데, ‘격차가 많이 나네? 올해 뽀록이었으니 내년에는 성적 나빠질 것이다!’ 라며 미래를 예측했었으니 말이다.
DIPS는 ERA를 대체하기 위한 목적으로 만들어졌다. 투수가 BABIP을 통제 할 수 없기때문에 현재의 성적이 좋거나 나쁘더라도 결국 FIP로 수렴할 것이라는 예측성이 DIPS 이론의 핵심이었다. 따라서 세이버메트리션들은 투수의 성적이 뛰어나더라도 DIPS를 근거로 플루크 시즌이라고 폄하하거나, 반대로 성적이 나쁘더라도 DIPS를 근거로 결국 회복될 것이라는 낙관론을 펼쳐왔다. 그런데 지금에 와서 예측성이 아니라 '무엇이 일어났어야 했는가?'로 후퇴하는 포지션을 선택한 것은 어딜 어떻게 보더라도 도망내지 말바꾸기이다.[11]
DIPS는 투수가 BABIP을 통제 할 수 없다는 급진적 이론을 바탕으로 '수비무관 평균자책점'이란 개념으로 탄생하였다. 투수가 30% 정도 BABIP을 통제 할 수 있다면 이는 결코 적은 수치가 아니며, 더 이상 DIPS 성적만을 근거로 어떤 투수의 성적을 판단하는 것은 위험하게 됐다. 즉, DIPS는 투수를 평가하는 클래식 스탯인 ERA를 대체해야 할 지표로 화려하게 등장했지만, 지금은 투수를 다른 관점에서 분석하는 종속적 보조 지표로까지 위상이 떨어진 것이 현실이다.

5.5. 통계적 아웃라이어가 존재할 수 있다

DIPS 역시 완벽할 순 없다. 실제 후속 연구에 의해 BABIP에 투수가 전혀 영향을 줄 수 없는 것은 아니라는 결론이 나온 바 있다.#
||<table width=350px><rowbgcolor=#3D414D> 타구 종류 || 타자 || 투수 || 수비 || 리그 평균 ||
||<rowbgcolor=#ffffff> 땅볼 || 47% || 29% || 13% || 11% ||
||<rowbgcolor=#ffffff> 플라이볼 || 39% || 26% || 21% || 13% ||
||<rowbgcolor=#ffffff> 라인드라이브 || 46% || 28% || 13% || 13% ||
대부분 아웃으로 연결되는 내야뜬공을 많이 양산한다던가, 투수 본인의 수비력이 뛰어나다던가, 투수 역시 BABIP에 영향을 줄 수 있다. 앞서 언급했듯이 위기 관리 능력을 아예 무시한다는 점 또한 아웃라이어를 만드는 요인으로 작용한다.
명예의 전당에 입성한 300승 투수 톰 글래빈이 대표적인 예라고 할 수 있다. 그는 극단적인 경계선 투구와 자기 자신의 뛰어난 수비력, 그리고 위기 관리 능력을 통해 DIPS에 비해 더 좋은 결과를 낸 대표적인 투수였다. 또한 맷 케인과 제러드 위버, 그리고 크리스 영도 DIPS의 아웃라이어로 꼽힌다. 이 투수들은 내야뜬공을 많이 양산함으로써 오랜 기간 평균에 비해 BABIP를 낮게 유지해왔다. 그리고 필 니크로, 찰리 허프, 팀 웨이크필드 같은 너클볼러들도 빼놓을 수 없다.[12]
이 정도면 통계적으로 무시하기에는 아웃라이어의 숫자가 너무 많다. 아니 이쯤되면 저들이 아웃라이어인 게 아니라 이론이 잘못됐다는 뜻이다.
위의 긍정적인(?) 아웃라이어들과 반대로 커리어 내내 평균자책점이 DIPS보다 높은 투수도 있다. 예를 들어 리키 놀라스코. 누적이닝이 1,800이닝을 넘는 데도 양쪽의 차이가 0.6에 달해서 DIPS의 취약점을 거론할 때 자주 (부정적) 예시로 나온다.
이렇듯 DIPS 역시 완전할 순 없고, DIPS가 놓치는 부분에서 뛰어난 모습을 보이는 투수들이 종종 있는 것이 사실이다. 하지만 주의해야할 점은, 근래의 세이버메트리션들이 DIPS 외에 우리가 놓칠 수 있는 부분을 무시하자는 입장인 것은 결코 아니란 점이다. 팬그래프에서 제공하는 투수 WAR이 철저하게 DIPS에만 기반해 투수를 평가하는 것을 두고, 세이버메트릭스는 DIPS 외의 부분을 완전히 무시한다고 생각하는 것은 착각이다.[13]
그곳의 운영진인 데이브 캐머런은 2013년 사이영 상을 예상하면 실점 3할, DIPS 7할 정도가 적절할것 같다는 의견을 내비친 적이 있다. 그리고 팬그래프는 수많은 세이버매트릭스 사이트의 일부일 뿐, 팬그래프를 세이버매트릭스의 전부로 착각하면 곤란하다.
그럼에도 투수를 평가함에 있어 DIPS만 보는 것은 한 두 시즌 단위의 표본에서 DIPS가 훨씬 우수하면서도, 커리어 전체의 관점에서의 정보 손실도 크지 않기 때문이라고 할 수 있다.
그리고 팬그래프의 WAR은 하나의 기준일 뿐이지 그들이 주장하는 절대적인 가치가 아니다. 위키나 기록을 활용해 가치 판단을 내리는 건 결국 보는 사람에 달려있다. 실제 팬그래프는 기본 DIPS 기반 WAR과 함께 BIP-Wins와 LOB-Wins라는 DIPS 외의 요소를 설명하는 지표를 함께 제공함으로써 이용자들의 판단을 돕고 있다.

상기 주장이야말로 DIPS 이론의 문제점을 극명하게 드러내주는 사례인데, BABIP 항목에 들어가보면 ''''900 이닝 이상 투구한 투수 중에서 BABIP이 유의미하게 낮은 경우가 1/3에 달한다''''는 자료가 있다. 전체 대상의 1/3을 통계적 아웃라이어라고 부르지는 않는다. 이 숫자는 BABIP에 투수가 영향을 준다는 비율과 유사한 수준이다.[14] 톰 글래빈을 DIPS를 반박하는 사례로 들었을 때, 세이버메트리션들은 아웃라이어라고 주장했었고, 지금은 그 아웃라이어의 숫자가 30%를 넘고 있다. 즉, DIPS가 나머지 70% 투수를 평가하는데 유의미한 지표가 될 수 있지만, 30%의 아웃라이어(?)[15]에 대해서는 오히려 평가를 왜곡시키게 된다.

5.6. 의미 퇴색

DIPS는 세이버메트리션들조차 어쩌지 못하던 클래식 스탯인 ERA를 대체하기 위한 목적으로 만들어졌다.
''''투수가 BABIP에 전혀 영향을 미칠 수 없다''''는 전제하에 투수를 삼진, 볼넷(+사구), 홈런만으로 평가하자는 수비무관 평균자책점 개념으로 시작했는데, 대전제가 잘못 되었다면 뿌리부터 흔들릴 수 밖에 없다. DIPS는 특급 투수와 패전처리 투수 간에 인플레이시 안타가 될 확률에 아무런 차이가 없다는 파격적인 발상때문에 야구계에 충격과 관심을 몰고 온 것이다. 만일 투수의 1/3은 BABIP에 영향을 미치지만 나머지 2/3는 영향을 미치지 못한다는 주장이었다면 큰 관심사가 되지 못했을 것이고,[16] 여러가지 세이버 스탯 중에 하나로만 남았을 것이다. 뒤늦게 30% 정도는 투수가 BABIP에 영향을 미치고, 투수에 따라서 BABIP의 결과가 달라질 수 있다고 인정한 시점에서 DIPS의 골격은 무너져버린 것이다.
결국 원래 목적인 ERA 대체에는 완벽하게 실패했고, 사실상 이도저도 아닌 큰 의미를 갖지 못하는 스탯이 되고 말았다.[17][18]

5.7. KBO 리그와 FIP

KBO 리그에서는 FIP 같은 스탯이 크게 작용하지 않으며 FIP와 ERA 사이의 확연한 차이를 커리어 내내 유지하는 투수가 적지 않다. 이를 분석하기 위해서 2009년~2018/9/8에 500이닝 이상 투구한 투수를 기준으로 RA9와 FIP-ERA의 회귀분석을 해보면 R제곱이 0.3164가 나온다. 큰 값은 아니지만 무시할 수 있을 정도의 값도 아니다.
이러한 이유는 현재 사용하는 DIPS가 MLB를 기준으로 만들어졌기 때문이다. 각 항의 계수가 KBO 리그에서는 다를 수 있는데 똑같이 사용했기에 이러한 현상이 발생했다는 것. 물론 최근 10년간 500이닝 이상이라는 기준은 빠른 계산을 위해 범위를 조금 좁혀서 선택한 것으로 자의성이 포함되어 있고 스탯티즈는 데이터 export를 지원하지 않기 때문에 더 많은 표본으로 계산을 하는데 어려움이 있으나 어느 기간이든 일정 이상 이닝으로 기준을 잡을 경우 RA9가 낮은 투수들은 FIP-ERA가 양수거나 작은 음수값을 가지고 RA9가 높은 투수들은 FIP-ERA가 음수거나 작은 양수값을 가지는 경향을 일정하게 나타낸다는 점에서 KBO 리그에서 공통적으로 나타나는 현상으로 볼 수 있을 것 같다.
사실 KBO에서 잘 안 맞네 어쩌네 할 것도 없는게, 현재는 MLB에서도 의미를 거의 상실한 스탯이다. 몇 년 전만 해도 중계에서 FIP를 언급하고 사이 영 상 투표도 FIP 기반으로 했다는 기자들이 있었지만 이제는 중계에서 거의 언급도 되지 않으며 저걸 기반으로 사이영 상 투표를 하는 기자도 없다. 말하자면 KBO라서 안 맞았던 게 아니라 처음부터 대전제가 틀린 이론을 갖다 적용했으니 KBO에서 맞지 않았던 것. 애초에 FIP 자체가 ERA를 설명하고 예측하는데 이제는 설사 단기간이라고 해도 더 이상 그리 유용한 지표가 아니다. 보다 진보된 DIPS 스텟을 보거나, 라이트 팬들의 경우는 RA9를 보는 것이 가장 확실할 듯 하다.[19]

6. 보완

당연히 DIPS 또한 부족한 부분을 보완하기 위한 여러 노력이 있어왔다. 내야 뜬공을 양산하는 투수들을 평가하기 위해 그것을 계산에 포함한 'IFFIP(In Field Fly Fielding Independent Pitching)'란 지표가 소개되기도 했고, 아예 타구의 유형을 반영한 'tRA(True Runs Average)' 같은 지표도 있다.
그러나 이런 지표들 역시 DIPS의 또 다른 갈래일 뿐으로, DIPS의 불완전함을 극복했다고 보긴 어렵다. IFFIP은 특정 유형을 표적으로 삼은 지표에 가깝고, tERA는 타구 분류가 완벽하지 않을 뿐더러 라인드라이브 비율은 투수의 능력이라고 보기 애매한 구석이 있다.
결국 가지고 있는 정보가 거기서 거기라면, 앞서 언급했던 표본에 따라 DIPS 외의 영역을 적절히 섞어보는 것이 좋은 선택이 될 것이다. 캐머런 외에도 톰 탱고는 7-8년 정도의 장기간의 투수들을 대상으로 기량을 평가하기에는 DIPS보다 실점이 더 좋다는 취지의 말을 했고, ZiPS 프로젝션의 개발자인 Dan Szymborski 또한 자기는 투수를 평가함에 있어 3200타석(이닝으로 대략 800이닝)을 기준으로 DIPS와 수비를 보정한 실점를 50%씩 보는 것을 선호한다고 한 바 있다.[20]

7. 평가

ERA에 대한 패러다임을 바꾸는 기폭제였으나, 정작 그 자신은 자리잡지 못했다.[21] 현 시점 DIPS의 위치는 상당히 떨어졌고, 오히려 BABIP이 운과 실력을 분리해서 보려는 시도에 더 적합한 상황이다.[22]
이제 세이버메트릭스에서 단순한 평균자책점은 20세기에 비해서는 큰 의미를 갖지 못하며, 또한 투수의 승패가 그랬던 것처럼 야구계 전반에서도 평균자책점에 대한 평가 비중이 예전만은 못한 상황이라고 볼 수 있다. 선수들 중에서도 맥스 슈어저, 잭 그레인키처럼 해당 지표에 호의적인 선수들이 존재하며, 2010년 무렵부터는 사이 영 상 투표에서 DIPS를 근거로 표를 던지는 기자들이 늘어나기 시작했다. 특히 2014년 AL 사이 영 상 투표에선 코리 클루버가 펠릭스 에르난데스를 제치고 수상할 수 있었던 원동력 중 하나로 작용했다고 볼 수 있다.[23]
그러나 2018년 기준 세이버매트리션 사이에서는 예전만큼의 위상은 없는 스탯. 사실 FIP도 간편함을 위해 쳐낸 잔가지가 제법 많은 스탯이다. 특히 표본이 충분한 배테랑 투수의 전체 커리어 평가는 오히려 ERA가 더 낫다라고까지 여겨진다.[24] 시즌 별 변동성이 커서 FIP에서 쳐낸 요소들이 수 년의 커리어가 쌓이면 안정화(stabilize)되기 때문.[25] 이제 세이버매트리션들은 "ERA랑 FIP 차이나니까 운빨! 수비빨!"같은 소리 더 이상 '''못 한다'''.[26] 이제 FIP는 ERA를 대체하는 개념이라기보다 다른 각도에서 분석하는 보조지표일 뿐이다. 어떤 투수의 ERA와 FIP가 유의미하게 차이가 난다면 그 원인을 분석해야하며, 예전처럼 ERA를 무시하고 FIP가 옳다는 식으로 접근해서는 안된다. ‘BABIP 투수 통제불가론’이란 대전제가 무너졌으니 당연한 것인데, 투수가 BABIP을 어느 정도 통제 할 수 있다면 수비를 무시하는 것이 오히려 통계를 왜곡하는 결과가 되어버리기 때문이다.

8. 계산 방법

8.1. 보로스 맥크라켄의 DIPS

보통 DIPS라 하면 수비와 무관하게 계산된 평균자책점을 떠올리지만, 아주 엄밀히 따졌을 때, 이는 DIPS의 속해있을 뿐 DIPS 그 자체는 아니다. 삼진, 사사구, 홈런을 통해 계산된 투수의 이닝, 피안타, 심지어 승패까지도 모두 DIPS라고 할 수 있다.
맥크라켄이 설명한 DIPS를 계산하는 과정은 대략적으로 이렇다.

1. 파크팩터를 이용해 볼넷, 삼진, 홈런을 보정.
2. 보정된 기본 스탯들을 바탕으로 DIPS 피안타, DIPS 이닝을 계산.
3. 계산된 스탯들을 XR에 적용해 투수의 DIPS ER을 계산.
4. DIPS 이닝과 DIPS ER을 이용하여 DIPS ERA 계산.
5. 피타고리안 승률을 이용하여 투수의 DIPS 승률을 계산.[27]
득점엔 당 시즌 리그의 평균자책점을, 실점엔 투수의 DIPS ERA를 적용한다.
6. 해당 시즌 리그 전체의 이닝과 디시전의 비율을 계산 후, 이를 투수의 DIPS 이닝에 적용, DIPS 디시전을 계산.
7. DIPS 디시전에 5번에서 구한 DIPS 승률을 계산하여 승패 계산.

8.2. 톰 탱고의 FIP

위의 과정을 보면 알 수 있듯이 계산 과정이 꽤 번거로운 편이라 일반 팬들 사이에서 널리 쓰이기엔 한계가 있었다. 이에, 톰 탱고가 간단한 계산으로 'DIPS ERA'를 계산할 수 있는 식을 만들어 소개했는데 이것이 바로 FIP다.
FIP의 식은 아래와 같다.

((-2×삼진 +3×(볼넷 +몸에 맞는 볼) +13×홈런)/이닝) +C

볼넷에서 고의사구를 제외하기도 하는데 FIP를 취급하는 커뮤니티 중 가장 널리 알려진 팬그래프에서는 IBB를 제외하지 않는다.
C는 Constant의 머릿글자로, FIP를 ERA 스케일로 맞추기 위한 상수다. 현대 야구[28]
팬그래프를 참고하면 저 3.00~3.20 이라는 수치로 어느정도 유지되기 시작한건 1993년부터다.
에서는 보통 3.00~3.20 정도의 값을 지니며, 이로 인해 리그 ERA와 리그 FIP는 같은 값을 가지게 된다. 참고로 평균자책점이 아닌 9이닝 당 실점을 기준으로 맞춘다면 FIP기반의 9이닝 당 실점이 된다.
- C값의 계산식:
  [image]
  여기서 사용되는 스탯은 모두 리그 전체의 값이다.
-2, 3, 13이란 각 계수는 '상황별 기대 득점(Run Expectancy)'에 기반해 계산된, 이벤트별 '득점 가치(Run Value)'를 통해 구해진 값이다. C값을 제외한 식이 의미하는 바는 즉, '9이닝당 수비 무관 득점 가치'로 볼 수 있다. -2, 3, 13 각 숫자를 9로 나눠주고, 인플레이 상황의 득점 가치를 더해주면 그것이 삼진, 사사구, 홈런의 득점 가치가 된다.
또한 'xFIP(Expected Fielding Independent Pitching)'라고 하여 홈런마저도 제외하고 이를 기대 홈런으로 대체한 스탯도 존재한다. 기대 홈런은 선수의 플라이볼에 리그 평균 플라이볼 대비 홈런 비율을 곱함으로써 계산된다.

9. 관련 문서

[1] 후속 투수에 의한 추가 실점은 비자책점 역시 동일하게 적용된다.[2] 맥크라켄은 Hits per ball in play란 표현을 사용했다.[3] 주의할 것은 나머지가 70%이므로 역시 DIPS는 유의미하다는 식의 자의적 발상이다.[4] 이것을 아주 명확하게 보이는 투수가 바로 2009 시즌의 유동훈이다. 매해 잘하면 3점대 초반의 방어율을 기록하던 그가 BABIP이 1할 7푼대로 떨어지면서 리그 정상급 마무리로 군림했다. 다만 다음 해에 바로 플루크란 것이 뽀록났지만.[5] 상기와 같은 DIPS 맹신은 위험한 발상이다. ERA와 FIP 차이를 무조건 플루크로 폄하하는 태도는 DIPS로 설명 할 수 없는 1/3 정도의 투수를 부당하게 평가하게 된다. 유동훈의 사례도 2009 시즌 1년 성적만으로 능력을 평가하기 어렵다는 것이지, 'BABIP으로 판단하건대 플루크'라는 것이 아니다.[6] 이 주장은 아래 쪽 문단에서 DIPS가 미래를 예측하기 위한 목적이 아니라 무슨 일이 일어났어야했는가 측면에서 봐야한다는 궁색한 주장으로 바뀐다.[7] 랜디 존슨의 BABIP는 항상 리그 평균보다 낮았는데, 하필 99, 00년에는 리그 평균 정도였다.[8] 결국 DIPS의 위상은 초창기에 비해 많이 낮아졌다. 야구 덕후나 찾아보는 수준의 색다른 지표 정도 수준이며, FIP를 근거로 사이영상에 투표한다는 기자는 이젠 찾아보기 어려워졌다.[9] 미래는 불확실하기때문에 사람들은 항상 타당성 있게 결과를 예측하면 열광한다. 문제는 그런 예측은 맞는 경우도 있지만 틀리는 경우도 많다는 점이다. 하지만 추종자들은 틀린 경우에는 주목하지 않거나 의도적으로 무시한다. 괜히 ‘고장난 시계도 하루에 두 번은 맞는다(Even a broken clock gets right twice a day)’라는 속담이 있는 게 아니다.[10] 물론 매덕스는 통산 삼진이 3000개가 넘는다. 하지만 그건 통산 5008이닝이나 던졌기 때문이고, 통산 9이닝당 탈삼진이 6.1개, 커리어하이 시즌도 1995년 7.8개 정도로 그리 높지않은 편이다.[11] 예를 들어 리키 놀라스코는 은퇴를 고려해야 할 나이인 지금까지도 FIP 대비 ERA가 낮은 수준인데, 그 긴 시간동안 '무엇이 일어났어야 했는가?'로 긍정적 평가를 해야한다는 것은 말이 안된다. 리키 놀라스코 한 사람에 국한된 이야기가 아니다. DIPS 이론으로 설명하기 어려운 아웃라이어는 통계적으로 무시하기에는 너무 많다.[12] 이 정도면 통계적으로 무시하기에는 아웃라이어의 숫자가 너무 많다. 아니 이쯤되면 저들이 아웃라이어인 게 아니라 이론이 잘못됐다는 뜻이다.[13] 그곳의 운영진인 데이브 캐머런은 2013년 사이영 상을 예상하면 실점 3할, DIPS 7할 정도가 적절할것 같다는 의견을 내비친 적이 있다. 그리고 팬그래프는 수많은 세이버매트릭스 사이트의 일부일 뿐, 팬그래프를 세이버매트릭스의 전부로 착각하면 곤란하다. [14] 위의 아웃라이어를 주장하는 표를 보면 이미 예시로 8명이나 나와 있고, 여긴 없지만 한동안 FIP로 꽤나 폄하받던 제레미 헬릭슨도 빼놓을 수 없는 FIP와 맞지 않는 사례이다. 어디 이름도 못 들어본 투수들 긁어온 것도 아니고 이름 좀 날렸다는 투수들 중에도 아웃라이어(?)가 저렇게 많다는 것 자체가 이론이 문제가 있다는 뜻이다.[15] 이 정도 숫자가 아웃라이어라면 이론에 문제가 있는 것이다. 기교파 투수, 땅볼 투수, 너클볼 투수 등 특정 유형의 투수는 다 제외하고 적용되는 이론이라면 범용적인 지표로 쓸 수 없다.[16] DIPS 이론은 등장했을 때부터 자극적인 표현이 많았다.[17] 당장 이 문서에 적혀있는 DIPS에 대해서 반박하는 주장들은 대부분 사실로 드러난 상태이다. 애초에 대전제가 망가진 이론이므로 의미를 부여하기에도 뭣하다..[18] DIPS는 위상이 하락했지만, DIPS를 설명하기 위해 고안된 BABIP은 위상이 공고해졌다. 완전히 주객이 전도되어 버렸다.[19] 가장 큰 이유는 FIP 전제인 투수 BABIP 통제불가론이 잘못 되었기 때문이다. 이 문단에서도 FIP라는 도그마에 과도하게 집착해 끼워맞춘 흔적을 볼 수 있는데, 한국과 미국이 전혀 다른 방식의 야구를 하는 것도 아닌데 한국에서 영 스탯이 맞지 않는다면 이론을 의심했어야 하나 그러지 않고 오히려 KBO라는 집단을 아웃라이어라고 부정해 버린 것이다. 처음부터 투수를 평가하는 단일 지표로 개발됐는데, KBO에서만 맞지않는다면 지표 자체가 잘못되었다고 보는 것이 맞는데 말이다.[20] DIPS가 투수를 평가하는 종속적 보조지표로 불리는 이유이다. 예를 들어 출루율이란 지표를 보정해서 보지는 않는다. DIPS를 보정해서 본다면 그건 이미 단독 평가지표가 아니라 단순한 분석 내지 보조 지표라는 것을 의미한다.[21] 예전에는 위대하다고 적혀 있었지만 그렇게 평가하기에는 최근 위상이 너무 무너졌다. ERA와는 다른 관점에서 그 투수를 보는 종속 지표 정도의 위치이다.[22] 그러나 나무위키의 투수 항목들을 보면 여전히 FIP가 높으니 운이 따랐다(또는 FIP가 낮으니 운이 없었다), FIP와 ERA가 차이가 많이 나기 때문에 곧 FIP로 수렴할 것이다, BABIP는 투수가 컨트롤할 수 없다 등의 서술이 많이 있고, 또 계속해서 그런 서술을 집어넣는 경우도 있으므로 적당히 필터링해서 봐야 한다. 그리고 과거 FIP의 위상이 아직 높을 때, 리키 놀라스코나 톰 글래빈, 제레미 헬릭슨 등의 FIP와 맞지 않는 선수들을 FIP라는 도그마에 끼워넣기 위해 온갖 가설들을 동원하여 분석한 서술들도 아작 남아 있다. 지금 시점에서는 FIP라는 도그마에 과도하게 집착하며 억지로 끼워맞춘 사례들이라고 볼 수 있으며, 오히려 이것을 보면 FIP가 가지고 있는 문제점들을 알 수 있다.[23] 이 이야기도 옛날 이야기다. 이젠 기자들도 FIP 성적이 높기 때문에 더 뛰어난 투수라는 식의 평가를 하지 못한다.[24] 클래식 스탯인 ERA가 투수를 제대로 평가하지 못해서 개발된 것이 DIPS인데, 오히려 ERA가 더 낫다면 DIPS의 존재목적이 불분명해진다. 그리고 이제 FIP은 단일시즌에 한정해도 ERA보다 낫다고 말하기 힘든 상황이고.[25] 예를 들어 변동성이 큰 것으로 알려진 투수의 BABIP은 약 3700BF(900~1000이닝) 정도면 안정화된다고 한다.[26] 안하는 것이 아니라 못하는 것이다[27] 득점엔 당 시즌 리그의 평균자책점을, 실점엔 투수의 DIPS ERA를 적용한다.[28] 팬그래프를 참고하면 저 3.00~3.20 이라는 수치로 어느정도 유지되기 시작한건 1993년부터다.

분류

세이버메트릭스