표준점수
1. 정의
標準點數
원점수가 정규 분포를 따른다고 가정하고 일정한 공식을 통해 변환한 점수.
원점수는 시험의 난이도를 반영하지 못하고, 원점수만으로는 수험자의 상대적 위치를 알 수 없기 때문에 대학수학능력시험이나 지능 지수(IQ) 검사 등에서는 표준점수를 사용한다. 주로 표준점수를 말하면 수능에서의 표준점수를 말한다.
표준점수의 기본 중의 기본은 Z점수로, 이 Z점수를 2차 가공하면 다른 표준점수들을 얻을 수 있다. Z점수는 '(자신의 원점수 - 자신이 속한 집단의 원점수 평균)/원점수 표준편차'로 구한다.[1] 이론상 Z점수는 최대치와 최저치가 존재하지 않으나 일반적으로는 -5부터 5까지의 값[2] 을 가진다. 점수들의 분포가 원 집단과 동일하며 평균은 0, 표준편차는 1이다. 센스가 있다면 금방 알아차렸겠지만 평균이 0이기 때문에 평균 이하의 값은 음수로 표현되며 소수점이 매우 길어져 지저분해진다.
이런 단점을 극복하기 위한 것중 유명한 것이 T점수다. T점수는 평균을 50, 표준편차를 10으로 설정한 것인데 수능의 표준점수가 이 T점수를 이용한다. 원래 10z+50으로 구하는데, 정확히는 원점수 50점 만점인 과목은 T점수 공식을 그대로 10z+50으로 사용하고, 원점수 100점 만점인 과목은 T점수를 2배 하여 20z+100으로 사용한다.
IQ검사는 검사기관마다 다소 다르기는 하지만 보통 상대검사 방식이며, 이때의 공식은 15z+100이다. 평균 100, 표준편차 15기 때문에 1표준편차인 IQ 85~115에 대부분(68%)의 사람들이 들어간다. 절대검사도 있지만 대부분의 검사는 다시 말하지만 상대검사다. 즉 동일 집단에서 동일한 시간과 공간에서 검사를 받지 않았다면 단순히 IQ만으로 높다 낮다를 판단할 수 없다. 현재 가장 널리 쓰이는 웩슬러 지능검사에서는 정의만 표준점수이고 실제 IQ 점수는 절대평가로 채점한 뒤 원점수 - 표준점수 대응표에 대입해서 구하는 방식으로 한다.
C점수는 2z+5로 구하며 평균은 5, 표준편차를 2로 하는 표준점수 척도로, 1~9까지의 범위를 가지나 간혹 그 범위를 초과할 수도 있다. 10에서 C점수를 빼면 스테나인 점수를 얻을 수 있다.
스테나인 점수는 역시 1~9사이의 정수값만을 가진다. 눈치 챘겠지만 스테나인 점수가 바로 수능이나 내신에서 사용되는 등급제다.
덧붙여서 일본의 고등학교에서는 편차치라는 개념을 많이 사용한다. 그 학교가 전국에서 성적을 기준으로 어느 정도에 위치해있나를 확인할 수 있는 지표다. 편차치의 평균은 50으로 50 이상의 값은 평균 이상의 학교라는 뜻이고, 50 이하의 값은 평균 이하의 학교라는 뜻이다. 공식은 T점수 척도를 이용한다.
2. 표준점수는 상대평가
'''표준점수는 전형적인 상대평가이다.'''
표준점수 공식을 잘 뜯어서 관찰해보면 표준점수가 상대평가라는 점을 쉽게 이해할 수 있을 것이다. 표준점수는 'Z값 = (자신의 원점수 - 자신이 속한 집단의 평균) / 표준편차' 에 따라 결정되는데, 여기서 (자신의 원점수 - 자신이 속한 집단의 원점수 평균)은 바로 '자신의 편차'에 해당한다[3] . 따라서 Z값은 자신의 편차값이 양수인가 혹은 음수인가[4] , 그리고 자신의 편차가 표준편차(약 자신이 속한 집단의 편차 평균이라고 생각하면 된다)에 비해 몇 배인가에 의해 구체적인 Z값이 결정된다. 이는 다른 사람에 비해 잘했는가 못했는가, 그리고 얼마나 잘했는가 못했는가에 따라 평가가 이루어지는 전형적인 상대평가 시스템이다.
3. 수능에서의 표준점수
'''현행 입시 제도 중 수능에서 가장 많이 반영되는 입시 지표.'''
원점수로는 시험 간, 과목 간 난이도 차이를 반영하기 어렵기 때문에 원점수를 아래의 계산식처럼 표준화하여 입시에 반영한다.
원래 표준점수는 만점이라는 개념 자체가 없다. 그러나 T점수는 일반적으로 20~80점 혹은 25~75점 사이 즉 3표준편차 내지 2.5표준편차를 벗어나는 값이 나올 확률은 매우 낮다. 수능에서는 5표준편차 구간인 0~200점을 범위로 하여 그 값을 벗어난 점수에 대해서는 0점 혹은 200점으로 절삭하여 제공한다.[5][6] 탐구/제2외한 영역은 0~100점을 그 범위로 한다. 아랍어는 수능(!!)이나 모의평가에서 툭하면 표준점수가 100을 넘겨 100점으로 절삭되기 일쑤다.'''계산식'''
국어/수학 표준점수 = 20*((수험생 취득 원점수-응시 집단의 전체 원점수 평균)/응시 집단의 전체 원점수 표준편차)+100
사회/과학/직업탐구/제2외국어&한문 표준점수 = 10*((수험생 취득 원점수-응시 집단의 전체 원점수 평균)/응시 집단의 전체 원점수 표준편차)+50
산출식이 저렇기 때문에 원점수 평균을 m이라 하고, m점을 획득한 수험생이 있다면 (m-m)=0 이 되기 때문에 100점 혹은 50점이 된다. 즉 100점 혹은 50점은 표준점수의 절대 평균점이 된다. 이는 표준점수의 주요한 특징중 하나이다.
보통 표준점수 최고점은 수학 나형>수학 가형>=영어>국어 순으로 높게 형성된다고 생각되었으나 요새는 수학 가형의 평균이 상당히 오른 탓에(2018 가형 점수의 중앙값은 약 72점) 수학 나형>=국어>>수학 가형(영어는 절대평가) 수학 나형의 경우 수포자들의 존재로 인해 표준편차가 가장 크지만 대신 평균이 워낙 낮게 잡히기 때문에 표준편차가 상쇄되어 표준점수 최고점이 보통 난이도에도 140점대 초반이 잡히고 쉬워봤자 130점대 후반은 나온다라고 알려져 있으나 2018 수능 나형에서는 135점으로 정확히 130점대 중반이 나왔다. 수학 가형의 경우 나형보다 평균이 높지만 표준편차가 작으며(아주 잘하는 사람은 적지만 중상위층이 매우 두텁다) 영어의 경우 평균이 낮고(2013 수능 기준 약 56~57점) 표준편차가 중간(22~23) 때문에 표준점수 최고점이 높게 잡힌다. 이제는 영어가 절대평가가 되어 의미가 없지만 보통 난이도에서는 130점대 후반, 어려우면 140점대 초~중반 정도로 잡히게 된다. 한편 국어의 경우 평균이 높고 표준편차가 낮은 편이기 때문에 어려우면 130점대 후반~140점대 초반, 보통 130점대 초중반 정도에서 잡힌다. 쉽게 나오면 120점대까지 떨어진다. 그리고 2019학년도 수능에서는 표준점수 최고점이 '''150점'''에 달해 근 15년간 수능중에 가장 높은 표준점수를 찍었다. 단 최근 수학 영역이 쉽게 출제되는 경향으로 가형은 표준점수 최고점이 130점대 초반에서 잡히고 있고 나형도 웬만해선 130점대 후반에서 중반 정도에서 잡히고 있다. 또한 영어는 아예 절대평가로 바뀌면서 표준점수가 의미가 없게 되었다. '''탐구나 제2외국어는 난이도에 따라 예측이 힘들다.'''
7차교육과정 수능이 까이는 사람들에게 '''엄청나게 까이는''' 원인이 바로 이것. 게다가 과목마다 난이도가 달라지기 때문에 탐구를 똑같이 만점을 받고도 표준점수의 차이 때문에 어떤 과목을 선택한 사람은 합격하고 어떤 과목을 선택한 사람은 불합격하는 불상사가 생긴다. 또 다른 까임 원인은 매년마다 수능의 난이도가 일정하지 않기 때문에 표준점수라는 척도 자체를 신뢰할 수 없다는 것이다. SAT나 TOEIC 등 네임드 시험들은 보통 난이도 차이에 따라서 실력에 관계 없이 점수가 튀는 현상을 보정하기 위한 장치가 되어 있으나 '''수능에는 그런 장치가 전혀 없다는 것이 욕을 먹는 대표적인 원인 중 하나''' 그런데 이 부분은 어쩔수 없다. 원래 SAT는 1년중 여러번을 실시하여 그 성적을 보정하는 표준화 검사이다. 그런데 수능은 연 1회 단발성 실시에 그치기 때문에 점수 보정, 즉 표준화작업을 진행할 수가 없다. 그렇다고 원점수를 제공할 수도 없는 것 아닌가? 바로 여기에 평가원의 딜레마가 있다.
그래서 결국 표준점수에 따른 차이때문에 생기는 불이익을 줄이기 위해서 SKY를 비롯한 상위권 대학에서는 표준점수를 그대로 반영하거나 단순변환하는 국어, 수학과는 달리 탐구과목의 경우 변환표준점수 기준을 따로 두어 이 차이를 보정하고 있다. 물론 이 방법도 완벽한 건 아니다.
이 문제점은 오로지 수능을 '''1년에 최소 4회 이상''' 치르는 수밖에 없다. 4회 이상의 수능을 치고 그 수능 중 가장 잘 본 거 1~2개를 대학입시에 사용하는 방법으로 해결해야 한다.
이런 표준점수의 특징 덕에 어느 정도 내공이 쌓인 수험생이라면 과목명, 백분위, 표준점수만 보고도 시험의 개략적인 난이도 를 알 수 있다.
4. 대학 입시에서의 표준점수
학생부 종합전형 등에서 일부 대학들이 해당 학생들의 실질적인 학습 능력을 보다 정확히 파악하기 위한 평가 수단이다. 해당 학생의 원점수는 해당 학교의 학습 수준이나 시험 난이도에 따라서 천차만별로 변하기 때문에 학생 선발과정에서 표준점수를 사용해 그런 상황들을 모두 고려하면서 학생의 수준을 수치화하였다. 고교등급제가 폐지됨에 따라 학교의 대략적인 수준을 파악할 수 없자 일부 대학들이 학생 선발과정에서 적용하였다.
예를 들어 쉬운 내신 시험으로 인해 운 좋게 좋은 1~2등급을 받은 중하위권의 학생이라거나 강남 8학군의 일반고 총합 내신 1.5와 지방 일반고 총합 내신 1.5가 같은 취급받는 일을 방지하기 위해서다.
물론 타 학교간의 비교뿐만 아니라 동일 학교 내 학생들에게도 적용할 수 있다. 따라서 표준점수를 적용하면 단순히 이수단위와 과목 등급만으로 총합 내신 등급을 산출한 '''동일 학교의 '''전교 2등'''이 '''전교 1등'''보다 좋은 평가를 받는 경우도 발생한다.
계산식에서 알 수 있듯이 z점수가 높으려면 평균이 낮음과 동시에 표준편차가 작아야한다. 즉, 해당 학교의 시험이 난이도가 어려움과 학생들의 수준이 이곳저곳에 분포되지 말고 되도록 균일해야한다. 주로 이런 케이스들이 만족시키는 곳이 바로 '''자사고, 외고''' 등의 최상위권 학교라고 생각하기 십상이다. 안타깝게도 이런 곳은 표준편차는 작으나 학생들의 평균 수준이 워낙 높고 일반고처럼 밑바닥이 존재하지 않기에 시험의 난이도에 비해 과목 평균이 일반고처럼 30~50점대 정도로 떨어지지 않는다. 특목고 내신 과목 평균을 찾지못해 수능 평균으로 대체한다'''계산식'''
Z=(원점수-시험 평균)/표준편차
오히려 Z점수가 높은 곳은 높은 표준편차에 비해 과목 평균이 압도적으로 낮은 '''중하위권 일반고'''다. 이런 상황을 고려해 이 Z점수나 T점수를 직접적으로 반영하는 게 대학 자체에서 '''환산 지표'''를 사용하지만 그 구체적인 내용은 대학에서 공개하지 않았다.
[1] 엑셀에서 STANDARDIZE 함수를 이용하면 간단히 구할 수 있다.[2] 표준점수가 국영수는 0~200, 탐구영역은 과목당 0~100인 것이 이것 때문이다.[3] 편차란 평균에서 떨어진 정도를 의미한다[4] 자신의 원점수가 자신이 속한 집단의 원점수 평균보다 높으면 양수값이, 낮으면 음수값이 나온다[5] 하지만 이론상으로 표준점수가 5표준편차를 벗어나는 비율은 '''1,744,278명''' 당 1명뿐이다. 따라서 수능에서는 웬만하면 벗어나지 않는다고 봐도 무방하다.[6] 실제로 고2 전국연합학력평가 수리나형에서 미친 난이도로 인해 2010년 6월(1컷55, 표준점수 207, 95점 이상), 2011년 3월(1컷54, 표준점수 214, 91점 이상)의 경우 표준점수가 200점이 나왔다. 1997학년도 대학수학능력시험때에도 비공식적으로 만점 표준점수를 계산해보면 '''인문계 205점'''이 뜨기도 하였다!