세이버메트릭스

 

1. 개요
2. 상세
2.1. 위험성
2.2. 사례
3. 말말말
3.1. 2019년 9월 이벤트
4. 유명한 세이버메트리션
5. 세이버메트릭스 관련 사이트
6. 관련 문서


1. 개요


sabermetrics[1]
야구사회과학게임 이론통계학적 방법론을 적극 도입하여 기존 야구 기록의 부실한 부분을 보완하고, 선수의 가치를 비롯한 '야구의 본질'에 대해 좀더 학문적이고 깊이있는 접근을 시도하는 방법론. 기존 주먹구구식 선수 평가론을 전면 부정하고, 야구선수에 대해 좀 더 객관적인 평가를 하기 위해 창안된 이론이다.
어원은 SABR(The Society for American Baseball Research. 미국야구연구협회) + metrics/metrician. 초기에 SABR(세이버라고 부른다.)라는 모임을 중심으로 형성되었기에 이런 이름으로 부른다. 이름에서 알 수 있듯이 세이버메트리션들은 여러 가지 수리적 방법론을 동원해 야구라는 스포츠를 '분자 단위로 분해'하는 것을 일삼는 사람들이다.[2]

2. 상세


The system of keeping batting averages needs a complete overhauling. At present this system merely gives the comparative number of times a player makes a hit without paying any attention to the importance of that hit. Home runs and scratch singles are all bulged together on the same footing, when everybody knows that one is vastly more important than the other. The result is that the records are grossly misleading.

타율을 중요시하는 관점은 완전히 손 볼 필요가 있다. 현재의 시스템은 단지 타자안타를 만들어내는 상대적인 빈도만 제공해줄 뿐, 그 안타의 의미와 가치에는 전혀 관심을 기울이지 않는다. 홈런 하나와 행운의 안타 하나는 똑같이 값이 매겨져있지만, 누구나 하나가 다른 하나에 비해 훨씬 더 중요하다는 사실을 알고 있다. 결과적으로 그 스탯은 사람들을 매우 오해하게 만드는 셈이다.

ㅡ F.C. 레인(Ferdinand Cole Lane). 1915년. 원문, 번역본

흔히 빌 제임스가 최초의 세이버메트릭스로 평가받지만, 현재는 F.C. 레인이 최초의 세이버메트리션으로 간주되기도 한다. 그래서 미국야구연구협회는 2012년 레인에게 '헨리 채드윅상(Henry Chadwick Award)'을 수여하기도 했다.[3]
빌 제임스[4]는 "세이버메트릭스는 야구를 객관적으로 이해하려는 시도이다"라고 정의한 바 있다. 이러한 주장을 하는 사람들을 세이버메트리션(sabermetrician)이라고 한다. 속된 말로 야구기록 덕후. 1990년대 이후의 현대 야구는 이들과 떼어놓고 생각할 수 없다. 다만 평범한 사람들이나 가볍게 야구를 즐기는 이들한테는 그저 할 일 더럽게 없는 잉여집단일 뿐... 게다가 2000년대 들어서는 세이버매트릭스의 기록 계산법이 절대 진리라고 밀어붙이는 일종의 선민사상을 가진 세이버매트릭스들과 이를 부정하려는 전통 야구관을 가진 야구팬들 때문에 인터넷에서는 세이버매트릭스 진영과 반세이버매트릭스 진영과의 충돌이 수시로 일어나고 있다.
일반적으로 빌 제임스의 Baseball Abstract 시리즈를 세이버메트릭스의 시초로 취급하지만 실제 시초는 1916년 F.C 레인이 '5센트, 10센트, 25센트, 50센트를 같은 선상에 두고 비교하는 것이 과연 옳을까?'라는 의문을 시작으로 62경기의 실황 중계를 바탕으로 단타는 0.457점, 2루타는 0.786점, 3루타는 1.15점, 홈런은 1.55점의 가치를 가진다는 것을 밝혀냈다는 것을 야구 통계학 즉, 세이버메트릭스의 시초로 둔다. 라이브볼 시대도 아닌 데드볼 시대타율은 가치없는 지표이며 출루와 장타가 중요하다[5]는 매우 앞선 생각을 가진 사람이었다. 그리고 1944년 브루클린 다저스에서 그 당시 단장이였던 브랜치 리키는 야구 역사상 최초로 통계학자인 앨런 로스를 고용해 첫 흑인 선수인 재키 로빈슨을 중심타선에 세우도록 만들었다. 재키 로빈슨이 뛰는 것에 대해 극심한 반대를 한 그 당시 다저스 최고의 선수인 딕시 워커를 트레이드를 시키기까지 했다.
1944년 브루클린 다저스가 먼저 통계를 사용하기 시작했으며 이 세이버메트릭스라는 단어만 없었을 뿐이지 야구 분석학이라는 세이버메트릭스의 기반이 되는 학문은 1950년대 초부터 각광받기 시작했다. 1954년 <LIFE> 잡지에 위에서 말한 다저스 단장인 브랜치 리키는 로스의 이론에 따른 현대 세이버메트릭스의 기초가 되는 출루율장타율 개념을 10페이지가 넘는 장문의 글로 게시했다. 그리고 조지 린지가 F.C 레인의 이론을 약간 수정한 '득점 기대치' 이론이[6] 나오면서 본격적으로 세이버메트릭스가 시작되었다 볼 수 있다. 언쇼 쿡은 <확률야구>라는 논문에서 야구 작전과 선수 평가에 확률론을 처음으로 접목시켰으며 세이버메트릭스의 기본이 되는 플레이 인덱스를 만들었다. 그의 논문을 본 저명한 작가 프랭크 디포드가 스포츠 일러스트레이트에서 '지금까지의 야구는 틀렸다'라고 할 만큼 큰 파장을 불러일으켰다. 그리고 볼티모어 오리올스1969년 얼 위버가 감독으로 취임하면서 통계에 비중을 많이 두었는데 이 시기 오리올스가 통계를 바탕으로 AL 동부를 완전히 독식하면서 다른 팀들도 야구 통계학에 관심을 가지기 시작했다. 그러다 1970년대 들어 빌 제임스를 비롯한 일군 선구자들이 나타나 수학적, 통계학적 방법론을 도입한 새로운 기록 및 통계를 제시하게 되었고, 당시 금융업과 결합하여 급격히 성장하고 있던 미국 통계학계의 야구팬들이 이에 열광하면서 이러한 새로운 통계적 접근이 더욱 발전하게 된다.
이들이 도입한 개념 중 비교적 직관적인 OPS, WHIP와 같은 초보적인 스탯 개념들[7]은 이제 KBO 야구 중계에서도 흔히 들을 수 있을 정도로 일반화되었다. 하지만 아직 해외에 비해 많이 뒤처져 있는데 해외 세이버 메트릭스에서도 유명무실한 타율이나 평균자책점, WHIP나 가지고 판단하는 것을 보면, 더 많은 기록 일지를 보급하여야 하지만, 스탯티즈 사태 이후 망했어요
이들의 통계학적 접근방식은, 과거에는 매우 풍부한 경험을 지닌 현장 야구인 일부만이 어렴풋이 이해하고 있던 야구의 그윽한 경지를 수치화하여 일반인들도 쉽게 접해 이해할 수 있도록 만들었다는 데 가장 큰 의의가 있다. 선수도, 코치도, 기자도 아닌, 그야말로 '단지 야구와 수학이 좋았을 뿐'인 일반인들의 연구가 실제 야구판에 영향을 미쳤다는 점도 높이 평가할 만 하다.
이들의 기여로 인해 바뀐 대표적인 관행이 바로 선수들의 연봉 협상. 이전에는 주먹구구식으로 구단이 책정한 고과가 협상의 기본 자료였다면, 지금의 연봉 협상은 서로가 객관적인 통계수치를 들이대는 법정 싸움[8] 비슷한 것으로 바뀌었다.
지금의 세이버메트리션들은, 모든 플레이 하나하나의 상황을 최대한 객관적이고도 정확히 남겨 세밀한 분석이 가능하도록 하는 데 집중하고 있다. 이에 따라서 필연적으로 세이버메트릭스의 학문화와 전문화가 진행되었는데, 그 부작용으로 야구에 어지간히 관심이 많은 팬들도 이해하지 못하는 어려운 개념과 수학적/통계학적 모델링이 동원되고 있다. 어지간한 계량경제학이나 게임이론 수준까지 도달했다. 일부 수학자들은 이를 논문의 형태로 학계에 발표하기도 했다. 그러다 보니 세이버메트릭스를 접할 수 있는 기회가 늘어난 것에 비해, 일반 야구팬들이 마주하는 심리적인 장벽은 높아졌다고 할 수 있다.
그러나 일반적으로 올드 스쿨, 즉 애매하고 중의적인 흐름을 중요시하는 야구 해설식 분석[9]보다는 세이버메트릭스의 과학적인 접근이 훨씬 더 야구 세계의 진리에 가까워진 경우가 많다. 흔히 통계의 허상을 들이대며 세이버메트릭스를 비판하는 사람들이 있는데, '세이버메트릭스=통계'도 아닐 뿐더러[10] 그런 식으로 통계를 까는 사람들이 가장 허술한 통계인 타율을 신뢰하는 경우가 많다는 점에서 적합하지 못하다. 그리고 사실 세이버메트릭스를 신뢰하지 않는 사람들 중에는 단지 귀찮아서 세이버메트릭스의 주장을 받아들이지 않는 경우가 상당히 있다. WHIP이나 OPS 등의 단순한 스탯이 성공한 것을 고려하면 더더욱 가능성은 높다.
머니볼의 유행으로 오클랜드 어슬레틱스빌리 빈 스타일을 전형적인 세이버메트리션으로 오해하는 경우가 있는데, 이들은 단지 '일정선 이하의 금액을 어떻게 효과적으로 투자할지'를 결정하기 위해 세이버메트릭스를 응용했을 뿐, 이들의 소위 머니볼 스타일이 세이버메트릭스의 전부는 아니다. 더불어 빌리 빈의 오른팔이자 전형적인 세이버메트리션인 폴 디포데스타[11]LA 다저스 단장 노릇을 하면서 구단을 말아먹은 뒤로는, 일선에서는 세이버메트릭스와 전통적인 스카우트 기법을 적절히 섞어 합리적인 운영을 하는 쪽으로 진화하고 있다. 물론 이 빌리 빈 스타일을 통해 스몰마켓의 운영 해법을 찾았다는 점은 의미가 있다.
그리고 빌 제임스와 보로스 매크래컨 등 세이버메트리션들을 대거 기용하고 테오 엡스타인이라는 젊은 단장을 기용한 보스턴 레드삭스가 2000년대 중후반 두 차례 우승을 거머쥐면서 세이버메트릭스의 위상은 추락하기는 커녕 오히려 점점 높아지고 있다. 세이버메트릭스의 성공이라고 하면 일반적으로 오클랜드만 떠올리는데, 오클랜드보다도 많은 영향을 받고 그 이상의 성공을 본 게 보스턴이다. 세이버메트릭스에 호의적이던 존 헨리[12] 구단주가 취임하면서 빌 제임스를 구단으로 끌어 들였고, 빌리 빈을 거액을 들여 단장직 영입을 시도했으며, 이를 실패하자 엡스타인을 단장으로 임명했다. 출루율의 가격이 오르자 수비를 강화하는 현재의 모습 등은 돈에 좀 더 여유가 있는 오클랜드의 그것과 유사한 상황. 헨리 구단주 이전 보스턴이 마초의 팀에 가까웠던 것을 고려하면 밤비노의 저주를 깬 것도 커트 실링의 레드삭스가 아니라 세이버메트릭스라고 봐도 좋을 정도였다.
다만 타격은 OPS, wOBA 같은 간단한 편에 속하면서도 신뢰성이 있는 데이터를 만들었지만, 피칭에 대해서는 DIPS, FIP 등이 많이 누적되었다고 해도 타격에 비하면 부족하며[13], 특히나 수비에 관한 간단한 데이터는 만드는 데 애를 먹고 있다. 기본적으로 수비에 대한 데이터 산출부터 문제인데다, 일반적으로 알려진 수비율도 공을 전혀 건드리지 않으면 그만이고,[14] 빌 제임스가 개발한 레인지 팩터같은 데이터들도 다 장단점이 극명해 변수가 잦은 수비를 비교해 주긴 무리가 따른다. 다만 팀 수비의 경우 DER(수비효율)을 통해 어느 정도 측정이 가능하다. 그런데 이 DER 역시 여러가지 계산법이 있어서 그 방법에 따라 결과가 제각각인 경우가 있다. 깊이 들어가면 ZR, UZR, +/-와 같은 지표가 있지만 이 쪽은 애호가가 아닌 일반 야구팬이 직관적으로 접근하기는 어려운 편이다. 게다가 일정 수준이 넘어가면 대개의 사이트들은 돈 내고 보라는 식으로 진입장벽을 만들어놓기 때문에 일반 팬들과의 단절감은 심화된다.
위에서 언급했듯 세이버메트릭스를 야구 경기보다 통계, 숫자에 집착한다며 비판하는 경우가 있는데, 세이버메트릭스의 핵심은 어떠한 스탯이 선수의 실질적 가치에 가까운 스탯인가를 찾는 것이다. 다시 말해 상대적으로 부정확한 스탯인 타율/다승이 아닌 wOBA/WAR를 보는 게 더 좋다는 것이지, 야구를 보지 말고 스탯만 뒤지자는 것이 아니다. 또한 세이버메트릭션들이 통계를 이용한 숫자놀음을 많이 하는 것도 어디까지나 그 선수의 객관적인 평가를 위한 것일 뿐이다. 가장 좋은 것은 숫자놀음이 아닌 선수의 플레이 그 자체를 보고 선수를 정확히 평가하는 것이지만, 그런 경지에 도달한 사람은 현장의 야구인 중에서도 역대급으로 꼽히는 소수의 몇명 뿐이다. 따라서 차선책으로 통계를 통한 논리적, 합리적 분석을 추구할 수밖에 없는 것이다.
오히려 통계의 허점에 대해서는 세이버메트리션 쪽에서 더 많이 언급하고 있다. 세이버메트릭스에 대한 비판 가운데 많은 수를 차지하는 것이 세이버 스탯에 대한 충분한 이해가 없이 그저 본인의 상식과 다르다는 것을 근거로 이루어지는 형태인데, 세이버메트릭스에서 주로 사용하는 스탯들과 그 스탯을 만들어낸 원리와 공식도 재대로 알아보지도 않고 까는것은 비판이 아닌 비난일 뿐이다. 정작 선수들과 선출 야구인들은 세이버메트릭스를 아는 경우 자체가 적은데다 설명을 들어도 '뭐 그딴 쓸데없는...'이라는 반응을 보인다. 무엇보다 유명한 세이버메트리션 대부분이 비선출이다. 인생을 야구에 바친 야구 전문인들 입장에선 자기들 가지고 수치놀음 하는 이상한 사람들로 보일 뿐.
일반적인 야구팬들 사이에서 언급되는 대표적인 오해의 예로 '타선은 OPS 순으로 나열해야 한다' 같은 것이 있는데, 그 내용 자체도 세이버메트리션 쪽의 의견과는 다르다. <The Book>에서 타석에 서는 횟수와 타석에 섰을 때의 상황을 종합해서 낸 결론에 따르면 1번과 2번, 4번이 가장 중요하며 3번과 5번이 그 뒤를 잇는다. 전체적인 타격 능력이 비슷한 경우 출루에 강점을 가진 선수일수록 앞쪽에 놓으면 좋다. 6~9번은 잘 치는 선수일수록 앞에 두면 된다. 애초에 세이버메트릭스에서는 타순을 중요하게 다루지도 않는데, 연구 결과 효율적인 타선 배치로 인한 이득이 일반적인 통념보다 훨씬 낮게 나타나기 때문이다. 가장 효율적인 타선 조정으로 얻는 점수는 시즌을 통틀어도 5점 미만이다. 결국 이 논제는 세이버메트릭스에 대한 오해 중 하나.
일반적인 야구팬들, 하다못해 세이버메트릭스에 대한 이해가 없던 세이버메트릭스 도입 초창기의 스카우터들도 갖고 있던 오해 중 하나는, 세이버메트릭스가 제시하는 이상적인 선수의 상이 하나뿐이라는 것이다. 대충 그들이 가지고 있던 생각은 '세이버메트릭스가 생각하는 이상적인 타자는 딱 하나인데 2할 중 후반대의 그다지 높지 않은 타율, .360~.380 수준의 높은 출루율, .420~.460 수준의 적당한 장타율재미없는 선수가 그것이다' 라는 것. 세이버메트릭스에 대한 반감을 가지고 있던 스카우터들은 세이버메트리션과의 대담을 나누는 자리에 나와서 '너네들 방법으로 뽑는 선수는 다 똑같을 거다. 우리는 슈퍼스타를 뽑아낼 수 있지만, 이제 야구는 다 재미없어지고 똑같은 애들만 뽑게 될 거다' 라는 뉘앙스로 비꼬기도 했다. 물론 이건 세이버메트릭스를 모르기 때문에 나온 촌극이자 무시. 오히려 세이버메트릭스는 이전에 무시받던 유형의 선수에게도 중요한 가치가 있음을 알려주며, 더 다양한 선수들의 유형이 등장하게 만들었다. 일례로 2017년 7월 3일 기준, 코디 벨린저는 .262, .335 라는 낮은 타율과 출루율을 기록중이지만 미친듯한 홈런 퍼레이드로 .633의 장타율을 기록 중이다. 코리 시거는 벨린저만큼 홈런을 많이 치진 못하지만, 타/출/장이 거진 3/4/5 에 수렴하는 밸런스 잡힌 성적을 보여주고 있다. 다니엘 머피는 볼넷을 거의 얻지 못하며 출루율 따위는 개나 주라는 듯한 타석 접근법을 보여주고 있지만 .334 라는 미친듯이 높은 타율로 출루율 역시 .387 을 유지하고, .569 의 뛰어난 장타율을 보여주고 있다. 이 세 선수는 각각 일발 장타형 홈런 타자, 어줍잖은 밸런스 타자가 아닌 타출장 3/4/5 의 완벽한 밸런스 형 타자, 미친듯이 높은 타율과 꽤나 좋은 파워를 보유한 타자로 제각기 판이한 모습을 보여주고 있지만, 세이버메트릭스로 분석한 이들의 리그 평균 선수 대비 타석 효율은 각각 146%, 143%, 142% 로 매우 비슷하다.
세이버메트릭스가 선수 능력을 수치화하는데 유용한 도구인 것은 분명하지만, 세이버메트릭스를 지나치게 맹신하는 것도 지양해야 할 것이다. 예를 들어 세이버메트릭스의 아버지 빌 제임스는 2017년 한국 언론과의 인터뷰에서 데이터로 사람을 평가한다는 것은 매우 어려운 일이며, 세이버메트릭스를 이용한 선수 평가 역시 틀릴 수도 있다는 것을 인정해야 한다고 말하였다.[15] 기사 링크 물론 어디까지나 세이버메트릭스만으로 평가하기 어렵다는 뜻이고, 현장에서 수집한 정보 등의 다른 정보와 합쳐지면 평가하기 상당히 좋아지며, 최소한 타율이나 타점, 승이나 평균 자책점만 보고 평가하는 것보다는 비교할 수조차 없을 정도로 신뢰도가 높다는 것은 변하지 않는다.
자세한 것은 야구의 기록 계산법 참조.
참고로 류현진에 의하면 2010년 후반 통계 분석이 치밀한 편에 속하는 LA 다저스는 다음과 같은 수준이라 한다.

단순히 A란 타자가 B 투수 상대로 몇 타수 몇 안타인지 같은 기록은 데이터 축에 들지도 않는다. 투수의 구속과 회전수, 회전축, 가로와 세로 무브먼트, 릴리스포인트를 전부 데이터화 하여 계산에 넣고 타자의 스윙궤적까지 측정해 계산한다. 이렇게 투수와 타자, 구종에 따라 세세하게 예측한 시뮬레이션을 바탕으로 매 경기의 계획과 전략을 세우고, 시나리오를 짜서 경기에 임하는 게 요즘 MLB 구단이다. 물론 이렇게 분석해도 이따금 지난해 포스트시즌처럼 아쉬운 결과가 나오긴 하지만, 단순히 ‘감’에 의존해서 불합리한 선택을 하는 과거 방식과는 비교가 되지 않는다.#


2.1. 위험성


세이버메트릭스는 어디까지나 성적을 분석하는 하나의 도구(tool)일 뿐이다. 따라서 그 결과를 절대적으로 맹신해서는 안된다.
세이버메트릭스 신봉자들이 범하기 쉬운 대표적인 오류가 '찾지 못한 인과관계는 없는 것이다'라고 성급히 결론짓는 사고 경향이다. 세이버메트릭스는 수치화 된 근거로 분석하는 객관성과 다각도에서 분석하는 다양성이 장점이다. 근거 없는 감에 의존하는 기존 사고방식을 배제하므로 위력을 발휘하지만, 문제는 이러한 장점을 맹신하면 명확한 인과관계를 수치로 제시하기 어려우나 실제로는 존재가 긍정되어온 것조차 부정하게 된다는 것이다.
예를 들어 머니볼로 우승하지 못하는 이유도 인과관계를 찾지 못했기 때문에 단순히 운이 없었다고 결론짓는데, 전혀 사실이 아니다.링크 저 자료는 인과관계를 못 찾았다고 해서 없다고 섣불리 결론짓는 자세가 얼마나 위험한 것인지 보여준다.[16] 즉, 우승하기 위해 현장에서 필요하다고 생각되었던 요소들, 에이스/수비/특급 마무리 투수는 실제로도 우승과 유의미한 관련이 있다. 단지 설득력있는 하나의 지표로 제시하지 못했던 것 뿐이다.
올바른 세이버메트리션의 관점이라면 '찾지 못한 인과관계는 없는 것이다'가 아니라 '없을 수도 있다'로 접근하는 것이 바람직한 태도이다. 세상에는 밝혀진 법칙보다 그 원리가 명확하지 않지만 인과관계가 있는 것으로 추정되는 가설의 숫자가 압도적으로 많다.
또한 세이버메트릭스는 객관적인 기록으로 명확히 드러난 요소들만 스탯으로 간주하기 때문에 그외의 다른 요소는 무시한는 문제점이 있다. 아무리 개인종목의 특징이 강하다해도 야구는 엄연한 팀 종목이므로 팀워크, 더그아웃 분위기 등이 팀 성적에 영향을 줄 수 밖에 없다. 하지만 세이버메트릭스는 이런 기록으로 드러나지 않는 요소들을 반영하지 못하기 때문에 야구에서의 모든 인과관계를 세이버메트릭스만으로 설명할 수 있다는 주장에는 논쟁의 여지가 남아있다.
선수의 부상 등의 요인도 세이버매트릭스만으로는 가늠하기 힘들다는 것도 문제다. 온갖 부상에 시달리는 유리몸 선수도 세이버매트릭스 데이터만으로 분석하면 제대로된 평가가 힘들 수 있다. 제아무리 세이버매트릭스 데이터 지표가 좋고 건강할 때 경기력이 좋은 선수라도 시즌 도중 장기부상으로 아웃당하는 빈도가 잦다면 구단으로서는 큰 골칫거리다. 단적인 예로 LA 다저스 1기시절 맷 캠프는 세이버매트릭스 지표상으로는 아주 준수한 활약을 보여주었지만 이후 유리몸으로 전락하면서 치어리더라는 멸칭까지 듣는 애물단지로 전락하고 말았다.

2.2. 사례


DIPS 이론의 기반이 된 'BABIP 투수 통제불가론'이 대표적이다.
선수 능력을 수치화하여 평가하는 세이버메트리션에게 투수는 BABIP에 영향을 미칠 수 없고, 특급 투수와 패전처리 투수의 BABIP은 동일하다는 급진적 주장은 매우 매력적이었다. 세이버메트릭스는 야구의 상식과 동떨어진 주장이 수치화 된 자료로 입증될 때 가장 돋보이기 때문. 클래식 스탯인 타율이란 지표가 세이버메트리션에 의해 출루율로 대체된 것처럼 ERA도 DIPS로 대체 될 것이라고 섣불리 단정한 것이다. 더욱이 DIPS는 투수의 성적을 예측 할 수 있다는 점에서 더욱 각광받았다.[17] 성적이 좋은 투수를 ERA와 FIP 간에 괴리가 크다고 플루크 시즌이라고 폄하하고, 성적이 나쁜 투수를 FIP가 좋다고 성적이 회복될 것이라고 낙관론을 펼치기도 했다. 후속 연구결과에서 DIPS 이론에 문제점이 발견되면서 이런 주장은 근거가 없어져버렸는데, 무려 1/3에 달하는 투수가 BABIP을 통제 할 수 있다는 사실이 밝혀진 것이다. 결국 BABIP 투수 통제불가론은 폐기되었고, DIPS 이론 맹신의 후폭풍도 결코 작지 않은 상황이다.[18] 최근에는 ERA 대신 FIP 만으로 투수를 평가하자고 주장하는 세이버메트리션은 없다.

3. 말말말


대부분의 구단들이 큰 결정을 내릴 때 세이버메트릭스를 기준으로 삼는다. 물론 선수한테 세이버메트릭스가 도움이 될 때가 있다. 예를 들어 구단이 선수를 지원하고 정보를 공유해줄 때, 나도 그런 정보를 통해 배우는 부분이 있다. 구단이 선수의 의견을 존중하고 정보를 제공한다면 좋은 결과가 뒤따르기 마련이다. 그러나 선수와의 대화 없이 선수보다 세이버메트릭스를 앞세운다면 어느 지점에서는 충돌이 빚어질지도 모른다. (숫자의 한계를 의미하는 건가?) 그렇다. 예를 들어 숫자로 봤을 때는 내가 수비면에서 많이 뒤떨어진다고 하는데 경기에서 내 모습을 직접 본 동료들, 코치들, 심지어 상대팀 선수들은 전혀 그렇게 생각하지 않는다. 숫자가 다 담지 못하는 것들이 존재하기에 그들이 내게 그런 말을 하는 게 아닐까 싶다. 세이버메트릭스가 도움이 되지만 나는 다른 선수들의 의견이나 코치들, 감독의 의견도 중요하다고 생각한다. 33세란 나이는 선수로서는 많아 보여도 사회에 나가면 젊은 축에 속한다. 야구에서는 나보다 나이가 많지만 여전히 훌륭한 성적을 보여주는 선수들도 있고, 나이가 어리지만 나보다 성적이 뒤떨어지는 선수들도 있다. 즉 나이가 전부는 아니라는 얘기다.

애덤 존스 #


LA 다저스는 타 팀에 비해 최첨단 통계자료 활용을 중시한다. 연구원처럼 보이는 50여 명의 다저스 구단 리서치팀이 경기력 향상을 위해 다양한 분석자료를 내놓는 시대다. 예전에는 상상도 못했던 것이다. 하지만 아직도 많은 팀들이 다저스처럼 세이버메트릭스 자료를 신봉하는 것은 아니다. 예를 들어, 세인트루이스 카디널스는 포수 야디어 몰리나의 리드에 많이 의존하는 것으로 알고 있다. 통계자료에만 의존하는 것이 꼭 바람직한 것은 아니다. 요즘은 선수를 스카우트할 때 ‘숫자’로 평가할 수 없는 투지, 승부욕, 동료와 관계 등은 잘 보지 않는다.

클레이튼 커쇼 #


타율 3할 5푼을 치는 타자와 처음 상대해도, 데이터 분석에서 나온 대로 던지기만 하면 거의 100% 삼진을 잡을 수 있다.

류현진 #


요즘 야구에서 데이터에 의존하는 부분이 과도하고 야구는 의외성의 경기. 데이터에 지나치게 의존하는 것도 재미를 떨어뜨릴 수 있고, 이에 대응해 새로운 규정이 나오는 것도 달갑지 않다.

추신수 ##[19]


투표권을 가진 기자들 중 내셔널리그 담당은 내 모습도 보지 못했을 것이며 언젠가 세이버메트릭스가 나를 도와줄 시기가 오길 바란다.

에드가 마르티네스 #


야구에서도 ‘유행’이라는 게 있다. 예를 들어 몇 년 전에는 유틸리티 선수들이 인기를 끌던 시절이 있었다. 매 경기마다 다른 포지션을 소화할 수 있기 때문이다. 몇몇 구단들이 유틸리티 선수들의 활약 덕분에 좋은 성적을 거뒀고 그것을 본 다른 구단들도 유틸리티 선수들을 영입하려고 많은 노력을 기울였다. 그러나 유틸리티 선수들을 영입했다고 해서 모든 구단들이 성공하지는 않았다. 세이버메트릭스와 선수들에 관한 통계들도 마찬가지다. 나 또한 내 기록 관련해서 통계들을 살펴봤는데 아직까지도 WAR(대체승리기여도)의 숫자가 높다는 게 확실히 어떤 부분을 의미하는지 잘 모르겠다. 시간이 지나도 선수에게 중요한 것은 ‘야구의 정석’이라고 생각한다. 공을 얼마나 잘 치는지, 수비를 얼마나 잘하는지, 공을 잘 던지고 있는지 등 야구의 기본에 충실하지 않다면 그 숫자들은 아무런 의미가 없다. 유행을 따라가기만 하는 것보다는 기본을 단단히 정립하는 게 더 중요하다.

찰리 블랙먼 #


케미스트리를 위한 세이버메트릭스는 없다.

자니 곰스 #


구단에서 제공하는 통계자료는 무시하는 편이다.

마이클 와카 #


그런 분석 데이터 숫자들을 보유하고 있는건 구단들만이 아니다. 선수들과 에이전트들도 그 숫자들을 갖고 있고, 똑같은 지식을 보유하고 있다.

댈러스 카이클 #


생각했던 것과 메이저리그가 달랐다. 한국에서 보던 것과 너무 달랐다. 플래툰이 철저했고 수비 시프트를 많이 사용했다. 데이터 활용이 생각보다 훨씬 많았다.

박병호 #


프런트와 같은 것을 믿고 있고 같은 목표를 갖고 있다. 데이터 분석과 세이버 메트릭스에 대해서도 완전히 열린 마음을 갖고 있다. 라인업을 구성하기 전 최대한 많은 정보를 갖기 원하지만 최종 책임은 내가 지는 것.

데이브 로버츠 #


요즘 야구는 숫자의 게임으로 변하고 있습니다. 많은 구단들이 데이터를 다룰 것을 요구하죠. 그들은 예를 들어 ‘그래, 우리가 보니까 너는 2M 정도의 가치가 있어. 너가 2M보다 못한 활약을 보일 경우엔 우리는 너를 방출할거고, 그보다 더한 활약을 보여줄 경우엔 계속 데리고 갈거야.’라고 말하죠. 모든게 다 숫자 투성이입니다. 하지만 야구는 사람이 하는 스포츠입니다. 각자의 성격과 감정이 들어가있는 스포츠죠. 그렇기에 감독은 소통을 할 줄 알아야 하며, 개개인의 능력을 최대로 뽑아낼 수 있도록 모두를 이해하는 사람이 되어야 할 것입니다.

네드 요스트(캔자스시티 로열스 감독) #


만약 우표에 관심이 있는 사람들이 우표 수집을 하고, 몸집이 큰 사람들이 스모를 좋아한다면, 통계를 좋아하고 시시콜콜한 정보에 관심 있는 사람들은 야구에 끌릴 것이다.

스티븐 제이 굴드


내가 각 숫자들에 접근하는 방식은 기계공이 멍키스패너를 들고 일을 시작하는 것과 크게 다르지 않다. 내가 시작하는 것은 늘 내 눈으로 직접 목격하거나 그 곳에 있었던 사람들의 목격담을 듣는 것이 가능한 경기들부터이다. 그리고는 스스로에게 묻는다. 이것은 진실인가? 그것을 증명할 수 있는가? 측정이 가능한가? 이것은 내 기계 전체 구조와 어떻게 들어맞는가? 그리고는 이에 대한 해답을 얻기 위해 각각의 기록들을 파고든다. (중략) 오늘도 야구는 수많은 기록들을 만들어내고, 사람들은 그에 대해 무척 많은 것을 이야기하고, 논쟁하거나 생각한다. 그런데도 왜 사람들은 그 자료들을 이용하지 않고 있는 것일까? 또는 왜 아무도 이런저런 자료들을 앞에 놓고 그것을 '증명해볼 것'을 요구하지 않는 것일까?

빌 제임스, 1979 Baseball Abstract 중


데이터는 신비로운 마법도 절대적 진리도 아니다. 대신 "당신 야구 얼마나 해봤는데?" 라고 묻지도 않는다. 그것은 편견 없는 소통의 언어이며 협력의 플랫폼이다.

신동윤 한국야구학회 데이터분과장.


세이버매트릭스라는 건 확률이잖아요? 그래서 믿을수가 없어요.

안경현 SBS Sports 야구 해설위원.[20]

[21]


3.1. 2019년 9월 이벤트


9월 16일(한국 기준) LA 다저스-뉴욕 메츠 경기는 미국 스포츠전문채널 ESPN의 '선데이 나이트 베이스볼'로 미국 전국에 생중계됐다. 경기가 진행되는 도중 ESPN은 다저스와 메츠 선수들에게 세이버메트릭스 전문 용어들을 묻는 영상을 방송에 내보냈다. 다저스 선수 중에는 켄리 잰슨, 코디 벨린저, 맥스 먼시, 워커 뷸러, 키케 에르난데스 등이 출연했고 메츠 선수 중에서는 피트 알론소, 토드 프레이저, 노아 신더가드 등이 질문에 답했다.
ESPN은 출연선수들에게 낱말 맞추기 형식으로 FIP, wOBA, wRC+ 등 용어의 알파벳 첫 글자만 알려주고 나머지 뜻을 질문했다. 출연한 선수들 대부분은 용어들의 뜻을 추측하며 FIP(수비 무관 평균자책점:Fielding Independent Pitching), wOBA(가중출루율:Weighted On-Base Average), wRC+(조정득점생산력:Weighted Runs Created Plus) 등을 전혀 알지 못한다고 응답했다.
다저스 투수 워커 뷸러만이 유일하게 모든 질문에 정답을 제시했다. 뷸러는 다저스 선수들 중에서도 세이버메트릭스 자료들을 신봉하는 것으로 알려져 있다. 팀 동료 키케 에르난데스는 wRC+를 묻자 "뷸러가 말한 것이 정답일 것"이라고 웃으며 응답했다. 그리고 에르난데스는 wOBA는 가중출루율(Weighted On-Base Average)이라고 올바르게 대답하면서도 "정확한 의미는 모르겠다. 하지만 연봉 중재시 중요하다는 것은 알고 있다"고 장난 섞인 응답을 내놓았다.#

4. 유명한 세이버메트리션



4.1. KBO 리그


  • FreeRedbird: 한국 굴지의 세이버메트리션. 세이버메트릭스 항목은 스탯과 이론들을 소개하는 글 위주로 포스팅된다. 세이버메트릭스는 알고싶은데 영어는 자신없는 사람들의 필수 코스. 블로그 요즘에는 바쁜지 카디널스 얘기(원래부터 카디널스 팬이었다. redbirds가 카디널스의 별칭)만 하는 듯.
  • 박기철 ('스포츠투아이' 부사장. 출처: 한국프로야구 1세대 세이버메트리션. 참고로, 언급된 기사에 의하면, NC 다이노스는 2014년 초에 세이버메트릭스 전담 직원을 채용, 적극적으로 활용중. 같은 기사에서, NC의 라이벌 롯데 자이언츠도, 2013년 최하진 사장 취임과 동시에 '미래혁신TF팀'을 만들어 세이버메트릭스를 적극적으로 활용하려는 작업을 진행. 2016년 4월 6일 심장마비사망.
  • 이동현: 스탯티즈 운영자. 필명으로 스탯티즈라는 이름을 쓴 적도 있다.
  • 최민규: 일간스포츠 기자로 한국 1세대 세이버메트리션 중 한 명. pc통신 시대부터 세이버이론을 펼쳤으며 인터넷 사이트 후추닷컴에서 기자를 시작한 이래로 스포츠 2.0에서 세이버메트리션 관련 칼럼을 연재하기도 했다.
  • 정재승: 카이스트 교수. 과학 콘서트의 저자로 유명하며, 대중적으로는 가장 인지도가 높은 과학자로 손꼽히는 인물. 세이버메트릭스 계에서는 4할타자가 나올 확률에 대해 연구한 최초의 소셜 네트워크 연구인 백인천 프로젝트를 처음으로 기획한 것으로 유명해졌다.[22] 이 백인천 프로젝트 참가자들을 중심으로 한국야구학회가 성립되었고 첫 회장으로 추대되기도 했다.
  • 비즈볼프로젝트: 유의미한 스포츠 컨텐츠의 지속적 생산을 목표로 하는 스포츠 리서치 팀. 기존에는 다른 여러 스포츠를 함께 아울렀으나 현재는 야구에 아무래도 무게 중심이 쏠리고 있다. 자체 팟캐스트인 트루볼쇼는 네이버 스포츠 라디오에도 올라오고 있다. 프로젝트 내 멤버들도 야구학회에 자주 참석할 뿐 아니라 자체 컨퍼런스도 개최하고 있다.홈페이지 야구팀이 야구공작소로 분리된 이후 사실상 농구사이트로 탈바꿈한 것은 비밀.
    • 야구공작소: 비즈볼프로젝트의 야구팀 구성원들이 독립하여 만든 사이트다. 2017년 현재 엠스플뉴스와 일간스포츠를 통해 기사가 송고되고 있고 네이버 라디오 야자수를 방송중이다.
  • 토아일당 Baseball-in-Play.com: 구글에서 검색되는 세이버메트릭스 이론과 개념 정리글 중 이 사람이 쓴 것이 꽤 된다. 개인블로그 뿐 아니라 KBreport, 비즈볼프로젝트, 야구학회 등에서도 활동한다. MLB가 아니라 KBO리그의 데이터를 바탕으로 한 분석이 많은 것이 특징이다. 블로그 페이스북
  • 황규인: 야구사이트 파울볼에서 오랜기간 글을 연재해온 논객 출신 동아일보 기자. 당시 닉네임 kini. 주간동아에 베이스볼비키니라는 세이버 칼럼 연재중. 최민규 영향을 받아 세이버메트릭스에 입문한 것으로 보임. 블로그에도 읽을 만한 각종 스포츠 글이 꾸준히 올라 온다.
  • 썩빡꾸: 세이버메트릭스에서 주로 타자의 스탯을 가지고 여러 가지 글들을 보여준다. 팬그래프에서 새롭게 제시되는 이론들을 재밌게 소개해준다. 홈페이지
  • Buer: Pecota Projection 에 대해서 이해하고 싶다면 한 번 방문해 보자. 블로그

4.2. 메이저 리그 베이스볼


  • 네이트 실버(Nate Silver): 통계학자, PECOTA(페코타) 프로젝션의 창시자, 통계 포털 '파이브서티에이트(FiveThirtyEight)' 창립자.(출처) [23][24]
  • 클레이 데이븐포트(Clay Davenport): 통계학자, 야구 통계 사이트 '베이스볼 프로스펙터스(Baseball Prospectus)' 설립자이자 Claydavenport.com 의 운영자 출처 KBO선수의 MLB 활약상을 예측하는 Davenport Translation도 볼 수 있다.
  • 빌 제임스(Bill James): 일명 세이버메트릭스의 아버지.
  • 보러스 매크래컨(Voros McCracken): BABIPDIPS(FIP) 이론의 최초 발표자.
  • 키스 올버먼(Keith Olbermann)[25]: 방송인, ESPN2 스포츠정보프로그램 '올버먼(Olbermann)' 앵커(2013~현재). 미국 SABR협회 정회원.
  • 키스 울너(Keith Woolner): 세이버메트릭스의 핵심 그룹 중 하나인 베이스볼프로스펙터스의 필진이었고 2007년 그 즈음의 많은 세이버메트리션들이 그런 것 처럼 MLB구단 프런트 오피스로 들어간다. (클리블랜드 인디언스) 그는 선수평가지표인 VORP( Value Over Replacement Player)를 고안했는데, WAR 과 같은 지표에서 사용하는 대체레벨(replacement level) 개념이 여기에 바탕을 두고 있다.
  • 밥 코스타스(Bob Costas): 방송인, MLB 네트워크 및 NBC 스포츠캐스터. 친구 올버맨[26]과 함께 SABR 정회원.
  • 톰 탱고(Tom Tango): TangoTiger라는 닉네임으로 더 유명. 탱고는 세이버메트리션이란 명칭 대신 세이버리스트(Saberist)라 불러달라고 한다. 빌 제임스바흐 쯤 된다면, 톰 탱고는 모차르트이자 베토벤이다. wOBA를 비롯해서 WPA, FIP 등 2000년대 이후 가장 널리 사용되는 세이버메트릭스 지표 중 상당수가 그의 작품이다. 또한 탱고의 블로그는 세이버메트리션들의 토론의 장이기도 하다. 2016년에 하던 일을 그만두고 MLBAM으로 이직했다. 그동안도 야구 관련 일을 해오긴 했지만, 이사 문제 등으로 풀타임 제의는 고사해왔다. 이번에는 조건이 딱 맞아떨어졌다고. 이번 일을 맡은 기념으로 야덕 사이트 팬그래프의 수장 데이브 카메론과 톰 탱고의 이메일 인터뷰를 소개한 글인 (인터뷰)톰 탱고: MLB의 새로운 데이터 구루를 만나다도 그를 이해하는데 도움이 될 것이다.
  • 폴 디포디스타: 애슬레틱스의 부단장이 되기 전까지는 평범한 세이버메트리션이였으나 빌리 빈 단장의 눈에 띄어 부단장 자리를 얻고 오클랜드 머니볼 시대를 이끌었다. 하지만 LA 다저스의 단장으로 영전한 뒤에는 토미 라소다 부회장 등과 갈등을 빚다 별다른 성과를 내지 못하고 물러났다. 2016년까지 뉴욕 메츠의 부단장을 역임하였고 현재는 NFL 클리블랜드 브라운스의 Chief Strategy Officer로 재직하며 미식축구계에 데이터 분석을 접목하는 시도를 하는 중.
  • 피트 파머(Pete Palmer): 빌 제임스와 함께 초기 세이버메트릭스의 대표인물. SABR의 초기멤버이기도 하다.
참고로 이들을 포함한 수많은 세이버메트리션들은 상당수가 특정 구단이나 언론사 등에 고용되어 일하고 있다. 업계에서 세이버메트리션들이 가진 가치를 알아주기 시작하면서 덕업일치의 길이 열린 셈인데, 세간에 알려진 WAR 계산법이라던지 역사적 상수 계산법이라던지 등등을 아마추어의 정보력만으로 이들에 준하는 수준으로 섭렵하는 데에는 한계가 있음을 인정하는 것이 스스로의 정신건강에 이로울 것이다. 이들은 단순한 야덕이 아니라 빅리그 구단에게 고액의 페이를 받는, 학계에서 최고로 꼽히는 인재[27]들이다. 이들은 지금도 일개 아마추어 라이트팬들은 생각해내지조차 못하는 관점에서 DIPSWAR 같은 세이버메트릭스의 히트작들을 까내리며 뜯어고치고 있다. 까놓고 말해, 선수나 코칭스태프들이 부상 숨기고 팀내의 트러블 숨기는 것처럼 세이버메트릭스 업계에서도 영업기밀이 많다. 만약 이 글을 읽는 이가 새로운 발상을 떠올려서 인터넷에 게시했다면, 그리고 그것이 영어로 어째저째 괴수들의 눈과 귀에 들어갔다면, 흔한 천조국 야구팀의 정보요원들에게 납치(?)되어 평생 직장을 얻을 수도 있다.
역으로 말하자면 인터넷의 열린 토론 공간에서 자신의 정보를 널리 퍼뜨리던 사람들이 구단 산하로 들어가면서, 구단과 외부의 정보격차가 점점 벌어지고 있다는 비판도 나온다. 타구, 투구, 수비를 분석하기 위한 천문학적 비용의 분석도구들이 구단들에서만 돌고 외부로 풀리고 있지 않은 상황에서, 인적 자원마저도 구단 내부로 들어가면서 2010년대 세이버메트릭스 발전은 정체되어 가고 있다고 해도 과언이 아니다.
대표적인 세이버메트릭스의 장점과 한계를 보여주는 것이 스탯캐스트이다. 빅데이터 분석, 레이더 추적, 심박수 측정 등 야구 분석지 정도 보는 것으로는 답이 없는 자료가 생성 축적되기 시작했고, 여기 접근할 수 있는 사람과 없는 사람의 정보 격차가 안드로메다처럼 벌어졌다. 일부가 공개되기도 하지만 진짜로 중요한 정보는 공개되지 않는다고 봐야할 것이다. 단적으로 한국에도 스탯캐스트의 기본이 되는 트랙맨 시스템을 도입해서 구장에 설치한 구단이 몇몇 있지만, 이중 대중에 공개된 자료는 전혀 없다.

4.3. 일본프로야구


  • 하토야마 유키오: 젊은 시절 세이버 메트리션 이었고, 관련 논문을 발표하기도 했다.[28]
  • ever_17: NPB Career WAR를 정리한 용자이다. NPB 세이버 스탯에 대한 이야기는 여기서 하자. 블로그

5. 세이버메트릭스 관련 사이트



5.1. KBO 리그


  • 스탯티즈: 한국 세이버메트릭스 관련 사이트 중 가장 유명한 사이트. 2011년 박동희 스탯티즈 논란으로 문을 닫았으나 2015년 10월 다시 문을 열었다. KBO 관련 공개 기록사이트 중 최고 수준의 데이터를 자랑한다.
  • KBO 공식 기록실: 2015 시즌부터 그나마 타격, 투구 기록은 연도별, 팀별로 공개 되었는데, 수비는 2002년부터만 보여준다. 페이지 먹통 현상 등이 많고 인터페이스도 부실하다.
  • 레전드닷컴: 프로스포츠 통계 전문 업체인 스포츠투아이에서 제공하는 사이트. 사이트운영주체가 프로야구 공식 데이터 제공업체이다 보니 상당히 상세하다. 나오는 정보는 KBO 공식 홈페이지와 거의 동일.
  • 다음 스포츠: 정보제공을 포기한 네이버와 달리 각팀별 페이지와 선수별 페이지가 있어서 링크 타고 넘어가기 좋다. 현역 선수의 타격 투구 쪽만 간단히 보려면 매우 좋은 사이트. OPS, WHIP 를 볼 수 있다. 다만 사사구(볼넷+힛바이피치볼)란에 볼넷 개수를 적어 놓았다는 심각한 오류가 있다.
  • KBO 공식 안드로이드 앱: KBO 공식 기록을 담당하는 스포츠 투아이에서 배포. 처음에는 유료앱이었지만 2013년 현재는 무료화. 투수에게 중요한 스탯인 피OPS를 찾아볼 수 있는 유일한 곳. 그리고 스포츠투아이에서 산출하는 war을 kbo앱을 통해 직접 확인할 수 있다.
  • 베이스볼 랩: 이쪽은 역대 커리어나 역대 리그 통산 기록등을 정리해놓은 사이트. 현재 선수 기록들은 나와있지 않지만 리그별 투고타저 현황이라던지 양준혁의 통산 BABIP, WAR같은 통산 세부스탯들을 공개하고 있다. 참고로 운영진인 이현우는 엠엘비네이션의 운영진이기도 하다. 2015년 하반기부터 제대로 접속이 되지 않고 있다.
  • Ballgraphi: 야구 데이터 시각화 공작실. 2015년 열었으며 여러 야구통계를 그래프 형태로 보여준다. 업데이트가 매일 이루어지지 않는 것이 단점. 여기도 16년 어느 시점부터 접속이 제대로 안 된다.
  • MLB Nation: FreeRedbird 등의 세이버메트릭스 스탯에 대한 칼럼을 읽을 수 있다.
  • 베이스볼-인-플레이: 다양한 세이버매트릭스 소개하고 "도루는 어느정도 가치가 있나?"같은 양질의 칼럼들이 올라온다. 그리고 2016년 기준 한국에서 유일하게 타구 지점을 일시적이나마 제공하고 있다.
  • 스트존: KBO 문자중계 데이터를 정리해놓은 사이트. 매일 경기가 끝난 후 업데이트 된다. 2021년 현재 유일하게 스트라이크 존을 확인할 수 있는 사이트.


5.2. 메이저 리그 베이스볼


  • 베이스볼 레퍼런스: MLB의 각종 역사와 기록을 가장 일목요연하게 확인할 수 있는 곳. 팬그래프나 BP 등의 세이버메트릭스 사이트들처럼 통계학 등을 이용해 숨은 내면을 분석하기 보다는 실제 벌어진 '역사, 기록' 그 자체에 더욱 중점을 두는 편. 때문에 투수의 WAR를 (실제 벌어진) 실점, 즉 RA9를 보정한 스탯을 기반으로 측정한다. 역대 MVP, 사이 영 상 순위나 골드글러브, 행크 아론 상 등의 수상 기록, 심지어 역대 드래프트 순위, 출신 학교 등 '기록'이라는 측면에서는 어떤 사이트보다도 충실하다.
  • 팬그래프: 위에 언급된 베이스볼 레퍼런스나 ESPN, 베이스볼 아메리카 등과 함께 덕후들이 좋아하는 곳. 레퍼런스가 '기록'이라면 팬그래프는 '분석'이라고 요약할 수 있다. 특히 이 사이트에서는 비록 최근이라 옛날 정보가 부족하긴 하지만 투구 추적 시스템(Pitch F/X)도 도입되었기 때문에 세이버메트리션들 뿐만 아니라 투구 궤적이나 무브먼트 계산 등 여러가지로 야덕후 전반에 걸쳐 유익한 정보들을 많이 접할 수 있다. 또한 수비 데이터 중 가장 신뢰도가 높다고 평가받는 UZR 데이터를 무료로 공개하고 있다.
  • Baseball Prospectus: 최초의 세이버메트릭스 덕후 사이트 중 하나. 상기한 팬그래프나 레퍼런스보다도 더 매니악한 사이트로 여겨진다. VORP와 EqA의 개념을 처음으로 고안해 낸 곳이기도 하다. 2000년대 초반에 세이버메트릭스의 중심지 역할을 하였으나, 스탯의 계산법을 공개하는 경우가 드물고 공개하더라도 유료로 풀어버리는 등 폐쇄성이 문제가 되어 현재는 팬그래프에 완전히 밀려버렸다. 그후 칼럼진을 개편하고, cFIP, DRA(투수), DRC+(타자) 같은 스탯을 야심차게 내놓는 등 재역전을 노리는 중. 포수의 프레이밍 데이터를 WAR에 가장 먼저 반영한 사이트이다. 이 사이트의 진짜 단점은 너무나도 구린 사이트 인터페이스로, 2000년대 초중반 수준에서 전혀 발전을 못한 상태이다. 팬그래프도 모바일 최적화가 개떡이지만 이쪽에 비하면 양반이다.
  • Harball Times: 가장 활발한 토론이 이루어지는 미국 세이버메트릭스 사이트 중 하나. 읽어볼 만한 칼럼이 정말 많다.
  • Tangotiger Blog: 유명 세이버메트리션인 톰 탱고(Tom Tango)가 운영하는 블로그. 본좌들의 토론을 생생히 지켜볼 수 있다.
  • Baseballsavant: 스탯캐스트 데이터와 이를 기반으로 한 2차 스탯을 제공하는 사이트. 주루속도, 팝타임, 타구의 속도 및 각도 등을 제공하며, xwOBA[29], OAA[30] 등 스탯캐스트의 기술력을 이용한 2차 스탯들을 제공한다. 당연하겠지만 스탯캐스트 도입 이전인 14시즌 전의 데이터는 제공하지 않는다.
다만 해외 사이트들 중에는 연간 일정 금액을 결제해야 고급 정보를 열람할 수 있는 사이트들이 많이 있으니 이용에 있어 유의할 것.

5.3. 일본프로야구


  • 1.02 ESSENCE OF BASEBALL: 일본의 세이버메트릭스 사이트. 한국의 스포츠투아이와 비슷한 회사인 DELTA라는 스포츠기록전문 업체에서 운영하는 사이트로 2015년 11월에 오픈베타에 들어갔다. 수비 스탯인 UZR와 주루 UBR 데이터까지 공개된다는 점이 큰 장점. 정식 오픈 이후에는 유료제로 전환하여 무료회원은 규정타석/이닝 선수의 기록만 확인이 가능하다.

6. 관련 문서



[1] matrix와 혼동하여 세이버트릭스라고 쓰는 경우가 많은데 metrics이므로 세이버트릭스가 옳은 표기다.[2] 농구에도 비슷한 부류의 학파가 있는데, 그 쪽은 APBR메트릭스라 부른다. APBR는 Association for Professional Basketball Research의 약자다. 세이버라는 독음과 달리 간단히 읽기에는 영 좋지 않은 약자다보니 그냥 APBR메트릭스라고만 부르는 모양.[3] 오늘날 통용되는 야구의 기록 계산법을 창안한 헨리 채드윅을 기념하여, 야구 연구에 기여한 인물을 대상으로 수여되는 상이다. 2009년에 제정되었다.[4] 흔히들 빌 제임스를 세이버메트릭스의 아버지라 부르지만 빌 제임스는 자기 자신을 세이버메트릭스의 아버지 또는 개척자라 말한 적은 없다. 높은 평가를 받는 이유는 세이버메트릭스라는 용어를 제안했으며 대중성을 확보했기 때문이지, 세이버메트릭스를 처음 만들어서가 아니다.[5] OPS지향적이다[6] 여기서는 단타 0.41점, 2루타 0.82점 ,3루타 1.06점, 홈런 1.42점.[7] 이들은 엄밀히 말하자면 세이버메트릭스 스탯이 아니다.[8] 이는 사실 비유하는 말이지만, 연봉조정 등의 여러 절차나 MLB 사무국에 구단의 횡포를 제소하는 행동을 보면 정말로 법정 싸움과 같은 모습이 되고 있다. 또한 MLB에서 활동하는 에이전트들은 대개가 로스쿨을 나와서 변호사 자격증을 갖고 있다. 대표적으로 스캇 보라스.[9] 하일성의 해설을 떠올려 보라. 편안하다고는 할 수 있어도 절대 정확하지는 않다.[10] 세이버메트리션들은 야구 기록 못지않게 야구 역사의 덕후이기도 하다. 일례로 위의 제임스의 경우 Historical Baseball Abstract라는 엄청나게 두꺼운 책에서 120년 간 MLB와 니그로리그를 역사 서술의 방법으로 분석했다. 또한 미국의 SABR에서는 동양 야구, 19세기 중반 야구, 유니폼의 역사, 야구선수 개개인의 biography 등 통계연구 이외에도 다양한 연구 분과를 두고 있다.[11] 그리고 2016년부터 NFL 클리블랜드 브라운스에서 일하고 있다.[12] 금융가로서 선물#s-2전문가다.[13] 이 차이를 극명하게 느낄 수 있는 가장 쉬운 방법은 MLB 통계 사이트의 양대산맥이라 볼 수 있는 팬그래프와 베이스볼 레퍼런스의 WAR을 비교해보면 된다. 타자의 WAR은 대개 10% 이내, 많아야 20% 수준의 차이가 날 뿐이지만 투수의 경우 심한 경우 두 배 가까운 차이가 나기도 한다.[14] 에러를 할 수 있는 가장 좋은 방법은 공을 잡을 수 있는 위치에서 공을 잡으려고 시도하는 것이라는 이야기까지 있다. 때문에 세이버메트릭스에서는 초기부터 에러를 클러치 히터로 표현되는 타점과 함께 극도로 불신하는 성향을 보인다.[15] 국내 사례만 봐도, 세이버메트릭스에 기반해 외국인 선수를 영입한 NC 다이노스의 2018년 외국인 선수 영입이 실패한 것만 봐도 알 수 있다.[16] 오클랜드 어슬레틱스가 20년 동안 월드 시리즈에 나가지 못하는 이유를 단순히 운이 없다고 볼 수는 없다. 같은 스몰 마켓팀인 캔자스시티 로열스는 그 기간 동안 2차례 월드 씨리즈에 나갔고 한 번은 우승했다.[17] 미래를 예측하는 지표는 스포츠 이외 영역까지 확대해도 극소수에 지나지 않는다.[18] 더 이상 땅볼이나 내야 뜬 공 투수를 무시 할 수 없어서 DIPS를 보완하는 연구가 진행되고 있지만 아직까지 뾰족한 방법이 없는 상태이다. FIP 추종자들은 FIP와 변형 DIPS 간에 유의미한 차이가 없으니 FIP가 우수하다거나 대안부재로 그냥 FIP를 쓰자고 주장한다. 하지만 BABIP에서 장타/단타를 구분하지 않아서 땅볼투수의 FIP가 무차별해진 것이지 영향력이 없는 것이 아니다. 대안부재로 FIP를 써야한다면 장시간 검증되어온 ERA가 이미 있다.[19] 정작 추신수 본인은 세이버메트릭스가 아니었다면 그런 대형계약을 맺지 못했을 것이다.(...)[20] 한 가지 간과해선 안 되는 사실이 있는데, 세이버메트릭스가 통계인 건 맞지만, 확률과 같은 수많은 데이터를 하나로 집계한 것이 통계이다. 즉, 통계를 내는데 각종 확률들이 통계 안에 들어간다는 것이다. 그리고 안경현은 세이버매트릭스가 고안해 낸 각종 야구의 기록 계산법을 객관적인 통계가 아닌 확률이라는 우연성으로 치부해 버리는 발언 때문에 세이버메트릭스와 이를 잘 이해하는 야구팬들부터 무수한 비판을 받고 있다. 적지 않은 야구 팬들은, 안경현을 현대야구에 뒤처진 상당히 구시대적인 야구관을 가졌다 평가 한다.[21] 사람들이 간과하기 쉬운것이 흔히들 세이버매트릭스의 지표라고 하면 WAR이라던가 WPA, FIP등의 스탯만 생각하는데, 넓은의미의 야구통계 지표라는 측면에서는 클래식 스탯인 ERA(투수의 방어율)과 타자의 타율 또한 세이버스탯의 일종이라고 할 수 있다. 이것 또한 한 해, 혹은 여러 해에 걸쳐서 해당선수의 기록을 통계화 한 확률이다. 방어율은 투수가 9이닝을 던질 시 실점할 확률이나 마찬가지이고, 타자의 타율 또한 이 타자가 타석에 서서 안타를 때릴 확률이다. 확률이라서 믿을 수 없다면 투수의 방어율도, 타자의 타율또한 마찬가지로 못믿는다는 말인데 이건 그냥 야구의 스탯이라는것 자체를 안믿는다는 말과 다를 바 없다. 세이버매트릭스의 모든 지표는 타자의 타율이나 투수의 방어율같은 클래식 스탯이 그 선수의 모든 가치를 설명하는데 모자란 부분을 채워주기위해서 좀 더 많은 모집단과 영향을 주는 요소들을 고려한 또다른 스탯일뿐이기 때문이다.[22] 사이언스북스에서 단행본으로 나오기도 했는데, 통계 책보다는 야구 책으로서의 성격이 더 강하다.[23] 스포츠 바깥 영역에서도 놀라운 성과를 냈다. 2008년과 2012년의 미국 대통령 선거 선거인단 배정 예측에서 완벽에 가까운 적중률을 기록했다. [24] 또한 스포츠 중심 포털이라는 간판답게 파이브서티에이트에서 독자적으로 통계에 기반한 축구 칼럼을 쓰기도 했는데(네이트 실버 본인이 쓴 건 아니고, 소속 필진이 쓴), 몇몇 칼럼이 번역되어 국내 축덕들에게 상당한 관심을 끌기도 했다.[25] 정치 평론가로도 유명하다. 2003년부터 2011년까지 MSNBC에서 이라는 뉴스 평론 프로그램을 본인의 이름을 걸고 진행했었다. 이때 상당히 강성이어서, 빌 오라일리 등으로 대표되는 폭스 뉴스와 대립각을 세웠고, 조지 워커 부시 정부와 08년 대선 당시 공화당 미국 부통령 후보였던 세라 페일린은 올버만에게 두고두고 씹히는 안주거리였다. 유튜브에서 검색만 해도 영상이 쏟아질 지경.[26] 올버맨과 코스타스는 1992년부터 1997년까지 ESPN의 레전드 심야 스포츠정보프로그램 'Sportscenter'를 함께 진행했다. 이후 지금도 절친.[27] MBA 출신도 많고, 통계학, 컴퓨터 공학, 물리학 같은 이쪽 관련 학문의 석박사 학위를 가진 이들도 부지기수다. 월 스트리트실리콘 밸리에서도 이들을 두고 스카우트 경쟁을 할 정도.[28] 참고 [29] Expected wOBA. 타구의 속도와 각도를 기반으로 1루타, 2루타, 3루타, 홈런 등을 다시 구해 wOBA 공식에 적용시킨 스탯. 구장 효과, 상대 수비, 타자 본인의 스피드 등이 배제된 '타구의 질'을 구하는 스탯[30] 타구의 비거리, 체공 시간으로 구한 '포구 확률'을 기반으로 외야수의 포구 능력을 평가한 스탯.