지능 지수

1. 개요

2. 지능 지수 비교

2.1. 일반화

2.2. 특수한 기준

2.2.1. 유의 사항

2.2.2. 테스트의 맹점

3. 발명

4. 지능 검사 종류

4.1. 약식 검사 및 집단 검사

4.2. 웩슬러 지능검사(WAIS-IV)

4.3. 문화 보편적 지능 검사

4.4. 비율 지능과 편차 지능

5. 사회적 영향

5.1. 직업

5.2. 성적

5.3. 생식률

6. 비판

6.1. 지능 검사의 오용

6.2. 검사 방법의 한계

7. 여담

8. 관련 문서

1. 개요

知能指數, Intelligence Quotient(IQ)
지능의 일부분을 표준점수로 수치화한 것.

2. 지능 지수 비교

2.1. 일반화

지능을 수량화한 확률변수 $$X$$에 대하여 평균을 $$m$$, 표준 편차를 $$\sigma$$라고 하자. 이를 표준 정규 분포로 나타내어 그 범위를 나타내면 다음과 같다. 여기서는 상위 $${\color{Blue} 2.28}\% $$와 상위 $${\color{Red} 1.07}\% $$만 각각 살펴보기로 한다.

'''항목'''	'''백분위'''	'''확률변수의 범위'''
평균	$$50.00$$	$$X=m \ {\color{Gray} + \ 0 \times \sigma} $$
상위 $${\color{Blue} 2.28}\% $$	$$97.72$$	$$X=m+{\color{Blue} 2.0} \times \sigma $$
상위 $${\color{Red} 1.07}\% $$	$$98.93$$	$$X=m+{\color{Red} 2.3} \times \sigma $$
만점(滿點)	$$100.00$$	$$X=m+{\color{Gray} 4.0} \times \sigma $$

이 때 상위 $${\color{Blue} 2.28}\% $$와 상위 $${\color{Red} 1.07}\% $$의 각 '''표준 편차의 계수'''인 $${\color{Blue} 2.0}$$과 $${\color{Red} 2.3}$$ 따위를 통계학에서는 $$z$$ 값이라고 한다. 지능 지수는 $$z$$ 값의 범위에 따라 결정된다. 특히 백분위 만점(滿點)은 실측상 나올 수 없으며 표에 기재된 $$100.00$$은 극한값이다(대략 $${z \to 4.0}$$[1]).
국제사회에서는 $$z \ge 2.0$$에 해당하는 사람들을 보통 고지능자로 규정하고 있으며, 국내에서 인지도가 있는 멘사에서도 하한 기준이다. 시험 9등급 제도에서 쓰이는 ‘1등급 커트라인’이 당장 $$z = 1.75$$라는 점(표준점수 135점)을 감안했을 때, $$z = 2.0$$(표준점수 140점)은 상당한 기준임을 알 수 있다. 반면에 $$z < 0$$인즉 $$z$$ 값이 음수가 나오는 경우는 평균 이하의 지능 소유자로 규정하며, 이론상 이들도 약 절반의 인구를 차지한다.

2.2. 특수한 기준

보편적인 통계적 방법에서는 $$100$$(상댓값)을 평균으로 두고, 표준 편차를 $$15$$ 또는 $$24$$를 사용한다. 이를 각각 정규분포 $$\Nu \left(100, 15^2 \right)$$ 또는 $$\Nu \left(100, 24^2 \right)$$로 표기한다.
단, 정규분포 $$\Nu \left(100, 15^2 \right)$$과 $$\Nu \left(100, 24^2 \right)$$ 등은 편의상 국제적으로(의사소통을 위하여) 통일화한 기준값일 뿐, (관찰적으로) 필연적인 값이 아니라는 점을 일러둔다. 평균 $$100$$은 이미 표준화를 거친 값으로, 임의로 상정해둔 값이다. 인지도가 있는 멘사에서는 $$\Nu \left(100, 24^2 \right)$$를 사용하고 있다.
이를 토대로 윗 문단에서 소개한 $$z$$ 값이 각각 $${\color{Blue} 2.0}$$과 $${\color{Red} 2.3}$$인 경우를 나타내면 다음 표와 같다.

'''항목'''	'''백분위'''	'''정규분포 별 확률변수의 범위'''
'''항목'''	'''백분위'''	$$\Nu \left(100, 15^2 \right)$$	$$\Nu \left(100, 24^2 \right)$$
평균	$$50.00$$	$$\mathbf{100}$$ $$=100\ {\color{Gray} + \ 0 \times 15} $$	$$\mathbf{100}$$ $$=100\ {\color{Gray} + \ 0 \times 24}$$
상위 $${\color{Blue} 2.28}\% $$	$$97.72$$	$$\mathbf{130}$$ $$=100\ {\color{Blue} + \ 2.0 \times 15} $$	$$\mathbf{148}$$ $$=100\ {\color{Blue} + \ 2.0 \times 24}$$
상위 $${\color{Red} 1.07}\% $$	$$98.93$$	$$\mathbf{135}$$ $$=100\ {\color{Red} + \ 2.3 \times 15} $$	$$\mathbf{156}$$ $$=100\ {\color{Red} + \ 2.3 \times 24}$$
만점(滿點)	$$100.00$$	$$\mathbf{160}$$ $$=100\ {\color{gray} + \ 4.0 \times 15} $$	$$\mathbf{196}$$ $$=100\ {\color{gray} + \ 4.0 \times 24}$$

국내 정식 검사에서는 표준편차(Standard Deviation, SD) $$\sigma = 15$$에 해당하는 '웩슬러(WAIS) 검사'가 표준이다. 그밖에 $$\sigma = 16$$를 쓰는 '스탠포드-비네 검사', $$\sigma = 24$$를 쓰는 '레이븐스 검사' 등이 있다. 멘사에서는 $$\sigma = 24$$를 쓰나 이는 입단 테스트일 뿐 정밀한 수치를 통지해주지 않는다.

2.2.1. 유의 사항

상단 문단의 표를 확인해보면 알겠지만 ^{(표준편차 15)}'''130'''과 ^{(표준편차 24)}'''148'''은 '''같다'''. 같은 아이큐임에도 표준편차가 달라서 18씩이나 차이가 나는데 이건 마치 ^섭씨23도(℃)와 ^화씨74도(℉)처럼 숫자는 다르지만 결국 같은 온도를 나타낸다는 점에서 흡사하다. 특히 언론이나 매체에서 누군가의 IQ가 $$150$$이 넘는다고 말하면 십중팔구 $$\sigma = 24$$를 쓴 것이다.
전세계적으로도 표준편차 $$\sigma = 15$$를 주로 사용한다. $$\sigma = 15$$에서는 $$160$$이라는 수치가 이론상 거의 최댓값이며, 이는 국내에서 2,000명도 안 되는 수치다. 약식검사에서도 이 수치는 거의 나오지 않으며[2] 이 수치가 나오는 사람은 매우 희박하다고 볼 수 있다. 가장 점수 뻥튀기가 심한 $$\sigma = 24$$를 써도 $$200$$을 넘지 못한다.
이렇게 표준편차마다 제각각이기 때문에 그냥 차라리 $$z$$ 값으로 환산해서 소통하는 것이 나을 수도 있겠다.
또한 고지능 단체 중 가장 유명한 멘사의 경우 표준편차 $$\sigma = 24$$를 사용하는데, 멘사 IQ 테스트에서 나오는 최대치의 IQ는 '''156'''이다. 그래서 일부 연예인들이 TV 프로그램에서 자신의 IQ가 '''156'''이라고 주장하는 경우가 있는데, 이는 100% 확률로 표준편차 $$\sigma = 24$$를 사용하는 멘사에서 시험을 보고 자신의 IQ를 말한 것이다. 참고로 $$\sigma = 24$$ 기준 156은 $$\sigma = 15$$ 기준 135에 해당한다.
많은 사람들이 'IQ가 100 미만인 사람은 극소수다', 'IQ 평균은 120이다' 등으로 생각하지만 이론적으로는 평균이 100이니 인구의 대략 50%가 IQ 100 미만이다. IQ 인구비율 그래프는 완전한 대칭이다. 예를 들어 IQ 120 이상과 80 이하의 비율은 같다. 120 이상은 상위 약 9%, 80 이하는 하위 약 9%이다. 한편 아이큐가 선진국을 기준으로 개발된 척도인 만큼 교육과 사고 방식이 다른 후진국에서 측정하는 경우 평균이 80 정도로 나온다. 즉 이론적으로나 현실적으로나 우리의 생각보다 아이큐 100을 넘는 인구는 많지 않다.

2.2.2. 테스트의 맹점

IQ 테스트의 맹점 중 하나는 이론상 30문제 중 30문제를 다 맞히면 IQ 테스트가 만점 처리가 되어 세계 1등으로 처리된다. 동점자에 대한 보정이 없으며 어디까지나 간격 척도라는 점이다. 즉 정규분포표를 기준으로 어느 정도 떨어져 있는지, 또 인구 비율상 몇 %에 속하는지만을 통계적으로 따질 뿐으로, IQ는 비율 척도가 아니기 때문에 절대적인 두뇌의 능력을 측정하는 것이 불가능하다. 즉 상대척도이자 사회과학의 영역인 IQ 수치를 전자기기의 벤치마크 수치처럼 보아서는 안되며, 뇌의 절대적인 능력을 측정하는 것은 신경과학의 영역이다.
특히 검증되지 않은 기관에서 시행하는 IQ 테스트인지 확인해보고 받을 필요가 있다. 해외 선진국에서 시행된다 한들 맹신하지 말 것.

3. 발명

1905년 프랑스의 심리학자 알프레 비네(Alfred Binet)가 세계 최초로 지능검사를 개발하였다. 다만 후술하겠지만 비네는 검사결과를 수량화하는 것에 반대하였다고 한다.
이후 1916년 루이스 터먼(Lewis M. Terman)[3]이 비네검사를 기초로 스탠퍼드-비네 검사를 표준화하면서 지능검사에 지능 지수를 추가했다. 이 검사의 IQ는 (정신연령÷생활연령)×100의 형식으로 나타낼 수 있다. IQ의 정도에 따라 천재를 분류한 것도 터먼과 레타 홀링워스(Leta Hollingworth)가 최초.
인간의 지능을 측정하려는 첫 시도는 1905년 프랑스 심리학자인 알프레 비네와 정신과 의사 테오도르 시몬에 의해 이루어졌다. 그 후 미국 스탠퍼드 대학 심리학자인 루이스 터번이 1916년 저서인 "지능의 측정"에서 지능 지수를 창안했다. 지능 검사는 2세 반부터 가능하며, 보통 6세부터 실시한다. 국내에서는 K-WAIS가 표준이다. 성인용 웩슬러 지능검사(16~64세)와 아동용 웩슬러 지능검사(6~15세), 이 2가지로 나뉜다.

4. 지능 검사 종류

4.1. 약식 검사 및 집단 검사

현대에는 개인별로 지능을 측정하는 검사뿐만 아니라 집단 단위로도 시행할 수 있는 약식 지필식 집단 검사도 개발되었다. 이러한 검사들의 일부는 인터넷으로도 제공되고 있어, 많은 사람들이 스스로 IQ 테스트를 해 보고 희비를 느끼는 계기가 되기도 한다. 물론 이들의 대다수는 지능이 평균 수준인 범재보다는 높아도 역시 별 차이 없는 수준에 불과하다.
집단 검사에 비해 개인 검사의 경우 검사 시간이 길고, 검사 도구에 능숙한 인력을 필요로 하며, 대규모 인원의 검사를 하기에는 쉽지 않기 때문에 집단 검사가 애용된다. 그러나 집단 검사는 검사 과정에서 여러 가지 오염 요인이 많이 포함될 수 있기 때문에, 자신의 IQ를 보다 정확히 측정해보기 위해서는 검증된 개인 검사를 하는 것이 적절하다. 하지만 단일검사조차 몇 만원 정도로 그만큼 비싸다.
약식/집단 IQ 테스트의 정확성을 의심하게 되는 주된 이유 중 하나가 문제 자체가 너무 허술하다는 것이다. 테스트는 유형별로 약 10여 개 내외의 문제가 연달아 나오는데, 예시 문제를 통해 파악한 패턴을 똑같이 반복하기만 하면 되는 경우가 많아 다양한 지적 능력을 검사한다고 보기는 어렵다. 물론 지적장애나 경계선 지능은 이런 패턴조차 읽지 못하기 때문에 걸러낼 수 있지만 정상 지능 이상일 경우에는 이를 쉽게 파악할 수 있어서 자신의 실제 IQ보다 20이상 높게 측정되는 경우도 많다. 그나마 2013년 7월에 운용 종료되었던 네이버 브레인이 다양한 패턴의 문제를 출제하여 어느 정도 객관성이 있지만 이 역시 익숙해지면 자기 IQ를 실제보다 20 정도 높여 표시할 수 있는 건 마찬가지. [4]
IQ를 측정하는 집단 검사 자체의 문제도 있을 수 있지만, 검사를 몇 번 경험해보아 상대적으로 검사에 익숙해져 있거나 집단 검사를 할 때 환경이 제대로 통제되지 않는 탓으로 발생하는 문제도 많으니 너무 검사만 까지는 않도록 하자. 사실 집단검사라는 특성상 신뢰성이 다소 부족한 건 어쩔 수 없다. 따라서 제대로 된 지능검사를 받으려면 저명한 병원에서 비싼 돈을 주고 웩슬러 지능검사를 받는 게 현명하다.
참고로 한국의 경우 징병제를 실시하기 때문에 모든 청년이 군대에 보내지는 과정에서 신검을 받게 되는데 이 과정에서 군복무에 적합한가를 확인하기 위해 신장체중 및 시력, 청력 등과 더불어 인성 및 IQ도 검사한다. 물론 중증 정신이상자나 지적장애인, 보충역 이하로 판정해야 하며 치료도 사실상 불가능한 다른 질병이 없다는 전제 하에서는 무조건 현역 판정을 하고 군에 입대할 것을 통보한다. 다만 병역 기피자를 걸러내는 것이 목적이라 대상자의 진술을 기본적으로 믿지 않기 때문에[5] 간혹 지적장애인이 군의관의 오판으로[6] 정상 판정을 받고 입대했다가 뒤늦게 장정 신체검사[7]에서 걸러내거나 혹은 병역 의무 수행 중에 지휘관이 의뢰하여 재검사 후 지적장애로 판정, 전역하는 경우가 간혹 있다
그리고 또 하나 중요한 것이 '''지능 검사는 처음 실시한 두세번의 검사 결과가 가장 정확'''하다. 그 이상 넘어가면 소위 말하는 문제 풀이 스킬이 생겨버려 지능이 뻥튀기 될 가능성이 높다.

4.2. 웩슬러 지능검사(WAIS-IV)

4.3. 문화 보편적 지능 검사

지능검사가 특정 문화적·사회 경제적 배경을 가진 사람에게 더욱 쉽게 이해되거나, 더욱 쉽게 접근할 수 있는 검사로 이루어졌다는 지적이 있어 이 문제를 해결하기 위해 언어나 수학 공식을 몰라도 인간이라면 (심지어 원숭이도) 직관적으로 풀수 있는 검사들을 만들고자 하는 시도가 계속되어 왔다. 대표적인 것이 Raven Advanced Matrices 검사와 이를 간략화하고 대신 풀이시간을 줄인 FRT(Figure Reasoning Test). FRT의 경우 멘사 입회를 위해 치러야 하는 검사로 많이 알려져 있다.
이러한 검사 역시 웩슬러 지능검사와는 다르게 쉽게 시행, 해석할 수 있는 형태로 구성되어 있어, 인터넷에서 많이 돌아다니곤 한다. 다만 이런 식으로 공유되는 문화 보편적 지능 검사의 경우 대부분은 임의로 문제를 만들어 표준화 과정도 없이 공유하는 경우가 많다. [8]

4.4. 비율 지능과 편차 지능

지능지수에는 2가지 종류가 있는데 하나는 비율지능지수이고 하나는 편차지능지수이다. 비율지능지수는 실제 연령에 비해 정신 연령이 얼마나 높은지로 판단하는 지능지수이고, 편차지능지수는 같은 연령대에서 얼마나 높은 위치에 있느냐에 따른 지능지수이다. 대중매체에서 호도하는 지능지수는 거의 비율지능지수나 표준편차 24를 사용하는 편차지능지수이다. 이는 지능지수가 표준편차 15나 16을 사용하는 편차지능지수에 비해 높은 지능지수가 나오기 때문이다. 비율지능검사는 검사를 받는 사람의 연령대가 높으면 높을수록 부정확한 결과를 도출하기 때문에, 오늘날 지능검사는 대개 편차지능검사를 사용한다.[9]
편차 지능지수에서 정의되는 이론적인 한계는 최소 IQ 0^{(표준편차 15)}에서 최대 IQ 200^{(표준편차 15)}으로, 약 6.66σ인데, 이것은 무려 대략 1,000억 분의 1에 해당한다. 현재 공식적으로 최고의 지능 지수를 지닌 사람은 '''IQ 198^{(표준편차 15)}[10]'''이며, 이것은 약 6.5σ로, 대략 250억명중 가장 똑똑하다는 뜻이다.
한편, 편차 지능이라도 표준편차를 몇으로 설정하는가에 따라 같은 수준의 지능지수라도 큰 차이가 나는 것처럼 보일 수 있다. 예를 들면, 한국 멘사에 가입하려면 지능지수가 148(표준편차 24)이어야 하는데, 이는 병원에서 실시하는 '''웩슬러 지능검사에서의 130(표준편차 15)'''와 같은 수준의 지능지수이다. 그 이유는 둘 모두 평균에서 '''2 시그마''' 떨어진 지수라는 점에서 같기 때문이다. 특히, 지능지수가 높으면 높을수록, 같은 수준의 지능지수를 다른 수준의 지능지수로 오해하게 할 여지가 크다. 알 수 있는 링크

5. 사회적 영향

2007년 행해진 한 연구에서는 메타 분석을 통해 현존하는 IQ와 수입의 상관관계에 대한 연구들을 정리, 분석하였는데, 약 0.25 이상의 상관관계가 나타나고 연구에 따라서는 0.5까지 올라간다.[11]
[image]
학자들과 (대학원생 부터 대학 총장까지) 미식축구 코치의 연봉 비교.
성격심리학의 Big5 성격모형과 연관 지으면 '''개방성'''(Openness)과 IQ는 0.3 정도의 상관관계를 보인다.[12] 개방성이 높으면 새로운 것에 대한 두려움을 적게 느끼는 편이다.
고학력과 종교인 비율이 반비례한다는 미국 통계 결과도 있다. 그리고 당연히 고학력과 지능 지수는 비례한다.
논문(2004)에 따르면, IQ와 리더십 사이에는 .27 정도의 상관관계가 있다.
논문(2007)에 따르면 IQ가 높은 사람은 환자군에서 불안도가 일반인 보다 높았다. 다만 건강한 표본 집단에서 IQ가 높은 사람의 불안도는 일반인보다 낮았다. [13]

5.1. 직업

조던 피터슨이 통계조사한 IQ에 따른 직업 연관성
지능 지수 (표준편차 15)	직업
130 이상	수학자, 철학자, 물리학자, 컴퓨터 프로그래머 등.
120~129	변호사, 의사, 선거형 정치인, 중소기업 경영인, 고위 공무원 등
110~119	간호사, 교사, 애널리스트, 광고 문안 작성자, 세일즈 매니저 등.
105~109	상점 매니저, 회계 서기, 부기 관리자, 신용 조사관, 실험실 테스터, 컴퓨터 운영자, 고객 서비스 담당자 등.
100~104	경찰관, 접수원, 계산원, 일반 사무원, 계량기 판독 요원, 은행 창구 직원, 전기 기술자 등.
90~99	재단사, 재봉사, 경비원, 택시 운전사, 버스 운전사 등.
80~89	용접공, 염색공, 기계공, 조립공, 청소부 등.

'''지능 지수와 직업은 당연하게도 유의미한 상관 관계를 가진다.'''
관련 강의 영상
통계를 내보면 직업에 따라 IQ의 평균값이 다르게 나타난다.다만 이를 가지고 IQ가 직업을 결정한다고 맹신하는 것은 통계의 함정에 빠지는 것으로, 한 개인만을 두고 볼 때 개인의 IQ와 직업의 상관관계는 특정 직업에 종사할 확률이 높다는 것을 나타내는 것이지 반드시 그 직업에 종사할 지는 알 수 없다. 다만 해당 직업의 IQ 평균값에서 멀리 떨어진 IQ를 가진 사람은 직업활동에 굉장히 어려움을 겪는 경우가 많다. 이는 저지능자가 고지능 직업군에서 일할 때 뿐만 아니라 고지능자가 저지능 직업군에서 일할 때도 동일하게 장애 요소가 된다.
IQ와 직업 간의 상관관계는 통계학적으로 당연히 나타나는 현상일 뿐이다. 사실 IQ와 직업간에 존재하는 사회적으로 큰 문제는 고지능자가 어떤 직업을 갖게 되는가에 대한 논의가 아니라 저지능자가 어떻게 직업을 갖게할 것인가에 대한 부분이다. 시대와 기술이 발전할수록 직업은 더욱 높은 지능지수를 요구하며 단순한 일자리들은 기계나 컴퓨터, 인공지능에 의해 빠르게 사라지고 있다.[14] 현대에서 IQ 하위 20%의 시민들은 IQ가 낮다는 이유만으로 현대사회에서 직업을 구하는 데 매우 큰 어려움을 겪으며, 이로 인한 사회문제가 점점 불거지고 있다.
단순히 지능 지수만으로 직업의 선택이 방해받는 것은 당연히 불법이며, 1971년 미국 대법원은 IQ 검사를 취업 전형에 반영하는 행위를 금지시켰다. 하지만 현대의 기업들은 대놓고 지능 지수를 물어보지 않을 뿐 암묵적으로 명문대 출신 지원자들을 우대하고 선천적인 지능지수 능력을 상당히 요구하는 적성검사를 도입 하면서 우회적인 방법으로 자사에 고지능자를 영입하려고 한다.
하지만 미국 경찰에서는 IQ가 너무 높은 지원자는 안받는다고 한다

5.2. 성적

학업 성적과 IQ 사이에는 분명한 양의 상관관계가 있다고 알려져 있지만[15], 알려진 지능 지수 검사법에 의하면 미리 연습만 해도 일반인이 파훼가 가능하기 때문에 의미가 퇴색된다. 알려진 IQ 테스트 방법도 상당히 구식이고 오래 전에 정해진 것이기 때문에 현대인들 기준으로 종합 IQ를 측정하기에는 상당한 시간과 종합적인 측정법이 필요하므로 좌우대칭, 순서 정렬과 같은 단순한 측정법으로는 고지능자라고 정할 수도 없고 인정되지도 않는다. 물론, 가정 환경에 의해 돈으로 배우는 양과 질의 차이가 날 수는 있어도 선천적으로 타고난 고지능자와의 구별은 일반적인 방법으로는 구별이 불가능하다.
더욱 자세한 내용은 고지능자 항목을 참조.

5.3. 생식률

여러 방면에서 연구가 진행된 끝에 개인의 지능 지수가 높을수록 그 개인의 생식률은 낮아진다는 것이 밝혀졌다. 단순히 지능 지수가 그 개인의 생식률을 떨어뜨린다고 보기는 어려우나, 지능 지수로 인한 여러가지 사회적 요인들로 인해 고지능자의 생식률 감소가 두드러지게 된다.

고지능자일수록 소득이 높을 확률이 높고, 높은 소득은 생식률에 악영향을 미친다는 것이 연구로 밝혀졌다.
고지능자일수록 교육받고 싶어하는 열망이 강해 평균 학업연령이 늘어나게 되고, 이는 고지능자의 결혼 시기를 늦춤으로써 생식률에 악영향을 준다.
고지능자일수록 삶에 대해 불만과 불안을 가질 확률이 높고 정신병의 발생빈도도 늘어 자살 등으로 인해 평균생존연령이 낮아 생식률에 악영향을 준다.
교육 수준이 높을수록 피임 기구를 자주, 올바른 방법으로 사용하는 빈도가 늘어나며 고지능자는 교육 수준이 높을 확률이 크다.

특히 고지능 남성보다 고지능 여성의 생식률이 떨어지는 비율이 높다. 또한 이 현상은 국가적으로도 영향을 미쳐서 평균 지능 지수가 높은 국가들은 평균 지능 지수가 낮은 국가들에 비해 생식률이 낮은 경향이 강하다. 고지능자의 낮은 생식률 때문에 점점 고지능자의 비율이 줄어들 수 있다고 우려하는 사람도 있다. 분명 지능 지수는 유전적인 영향이 강하긴 하지만 고지능자의 생식률이 낮은 대신 일반 사람들의 높은 생식률 속에서 또 고지능자들이 태어나기 때문에 고지능자의 낮은 생식률이 오히려 고지능자의 비율을 일정 수준으로 유지해준다는 것이 일반적인 견해다.

2006년도 영화 이디오크러시는 이런 현상을 반영하였다

6. 비판

2012년 발표된 연구 결과에 의해, IQ 테스트로 도출되는 여러 수치들 중 그 어떤 항목도 단일 항목으로 'g factor'를 완전하게 대변할 수 있는 항목은 존재하지 않는다는 것이 밝혀졌다.# 해당 연구는 온라인으로 110,000명 가량이 참여하였고, 테스트를 마무리 하지 않은 사람 등의 불완전한 데이터를 걷어내고도 46,000명의 샘플을 확보한, 여태껏 진행 된 지능 관련 연구 중 가장 대규모의 연구다. 온라인 참가자들에게, 지능과 연관되어 있는 각종 소검사들을 수행하게 한 후, 나이, 인종, 흡연 여부 등등의 생활 습관 같은 데이터를 기입하게 한 뒤, 취합하여 분석하여, 각 소검사 결과 간 상관관계가 존재하는지를 살펴봄으로써, IQ라고 부를 만한 하나의 factor가 드러나는지를 조사한 연구다.[16] 즉, 하나의 지수(Quotient)로 지능을 측정할 수 있다면, 참가자들의 소검사 결과 간 일정한 상관관계가 있어야 한다. 4만 명 이상이 참가한 대규모 검사인 만큼, 소검사 결과가 좋은 참가자들은 대체로 결과가 좋아야 하고, 그렇지 않은 참가자들은 대체로 결과가 나쁘다는 경향성이 뚜렷하게 드러나야 한다. 이러한 경향성이 포착된다면, 그 결과는 'g factor'의 존재를 강력하게 뒷받침 하게 되며, IQ 테스트에 어느 정도의 정당성을 부여할 수 있는 것이다. 연구 결과, 서로 상관관계가 높은 소검사들을 최대한 적은 수의 항목들로 구분했는데, 최소 세 가지[17]의 항목으로, 이 이상으로 지능을 단순화하는 것은 어렵다는 결과가 나왔다.
세 가지 항목 이하로 단순화 할 수 없다는 것은, 단기기억능력, 추론 능력, 언어 능력이 각자 고유의 독립성을 가지는 최소 단위라는 뜻으로 달리 말하면 세 항목 간에 유의미한 상관관계가 존재하지 않는다는 것이다.[18] 이를 검증하기 위해 fMRI를 동원하여 16명의 피검사자들이 소검사를 수행 할 때의 활성화 되는 뇌기능을 스캔한 결과, 각 능력에 해당하는 소검사를 수행 할 때 활성화되는 뇌의 영역이 다르다는 것이 드러났다. 또한, 복합적인 과제 수행에서 뇌의 여러 영역을 동원한다는 것이 드러났는데, 설문 결과를 통해 얻은 나이, 인종, 교육 수준, 생활 습관 등등의 각종 변인을 통제했을 때, '여러 영역을 동원하는 능력', 즉, 'g'가 실존한다는 근거는 없다는 것이 드러났다. 그러므로, 이 연구 결과에 의하면 인간의 지능을 측정하는 'g factor'는 존재하지 않고, 그렇다면 'g'를 일컫는 말인 IQ 역시 큰 의미를 가지지 못한다는 것을 의미한다. 그 결과, 지능검사를 통해 사람의 전반적인 지능을 측정 할 수 있다는 주장은 신뢰를 잃게 되고, 지능 지수의 의미는 말 그대로 '지능 검사를 수행할 수 있는 능력' 정도로 머물게 되며, 어떠한 확장적인 의미도 가지지 못한다는 점을 시사한다.
과학적인 엄밀함에서 벗어나 주변 사례를 예로 들어보자. 사실, '지능 검사의 일종'이라고 치부되는 미국의 SAT나 공직적격성평가, 법학적성시험 등의 각종 적성검사들이 왜 지능 검사가 아니라 지능 검사의 '일종'인지를 생각해본다면 위의 연구 결과는 지극히 상식적인 결과다. 이러한 시험을 보는 이유가 인재 선발 과정에서 효율성을 기하고자 한 것임을 감안할 때, 표준화된 지능검사를 치르게 하면 그만이다. FRT는 해당 시험들에 비하면 훨씬 단순한 검사이며, 심지어 수많은 샘플을 통해 그 robust 함을 검증받았고, IQ를 신봉하는 사람들의 주장에 의하면 반복 수행도 의미가 없으므로, 많은 시간과 인력을 아낄 수 있을 텐데 왜 그렇게 하지 않을까? 학생이나 구직자에게 요구되는 능력은 본질적으로 높은 지능이 아니다. 학업이나 직무를 수행할 역량이 충분한가의 여부를 검사하는 것이 목적이기에 IQ테스트를 적성검사에 그대로 사용하지 않는 것이다.
지능 지수가 개인이 가진 모든 역량을 대변해 주지는 못한다. 위대한 물리학자인 리처드 파인만은 IQ가 고지능자 범주에 속하지 않음에도[19][20] 어린시절 신동이라 불렸으며, 고지능자라 할지라도 성과를 내기 쉽지 않은 물리학 분야에서 큰 업적을 남겼다. 그런데 이는 지능이 무엇인지를 명확하게 규정지을 수 없고 뇌에 대한 연구가 아직 미진한데서 기인하는 문제일 수도 있다. 또한, IQ가 전체재능을 포괄하지 않는다는 것. 다시 말해서 IQ가 재능에 속하는 여러요소들 중 하나일수는 있어도, IQ가 모든 재능을 포괄하는 상위개념은 아니라는 것이다.
지능 지수는 평균치인 100에서 멀어질수록 그 신뢰도가 떨어진다. 비네에 따르면, IQ는 sd 15기준 160까지만 의미가 있고, 그 이후부터는 사실상 통계적인 의미를 가지지 못한다고 한다. 예를 들어 sd 15기준 IQ 160과 180인 두 사람 사이에 지능이 차이가 얼마나 나는지 명확히 측정할 수 없다는 것. 애초에 IQ검사의 본 취지는 검사를 실시하여 정신심리학적 치료를 요하는 대상을 감별하려는 목적이 크기에 이러한 검사를 통해 평가할 수 있는 지능에는 한계가 있다.
각각의 검사들마다 측정하는 방식과 유형이 달라 어떤 검사로 측정했는가에 따라 지능 지수가 일관되지 않게 나타날 수 있다. 이러한 이유로 기네스북에서 IQ는 등재 항목에서 제외되었다. 현재로선 초고지능자로 인정받기 위해서는 최대한 여러 개의 테스트에서 고르게 고득점해야만 한다.
유명인들의 IQ가 잘못 알려져 있는 경우도 더러 있다. 알베르트 아인슈타인의 IQ가 sd15 160이라는 말이 대표적이다. 아인슈타인은 지능검사를 받은 적이 없었고, 만약 있다고 해도 160만큼 높진 않았을 것으로 추정된다. 아인슈타인의 경우, 그의 천재성은 IQ 보다는 그가 가진 뛰어난 논리력과 창의력이 그의 능력을 보다 잘 대변한다고 본다. 물론 뉴턴이나 아인슈타인 같은 경우 일반인들과 차원이 다르게 매우 똑똑했을 가능성도 배제할 순 없다.
마지막으로, 현재 sd15 기준으로 IQ 200 이상인 사람은 전 세계에 단 한 명도 존재하지 않는다. 간혹 sd15와 sd24를 구분해서 인식하지 못해 sd15 기준의 인식으로 sd24 혹은 비율 지능의 수치를 그대로 받아들이는 사람들이 있는데, 이는 명백한 오류이다.

6.1. 지능 검사의 오용

지능 지수 검사의 객관성 논란이 끊이지 않는 건 원래 지능 지수 자체가 고지능자가 아닌 지적장애인을 가려낼 목적으로 만들어낸 개념이기 때문이다. 그러니까 당신의 지능 지수가 얼마나 되든 IQ 테스트를 하는 기관에서는 별 관심이 없다. 사회생활에 문제가 있을 정도가 아니라면 지능 지수를 검사받을 필요가 사실상 없다.
그래서 루이스 터먼은 알프레 비네의 IQ 검사를 보고 감동을 받은 나머지 웅대한 계획을 펼치기에 이른다. 원래 비네가 만들 당시에는 위에도 있듯 인구의 하위 1% 가량 되는, 특수한 학습을 받아야 하는 사람들(즉 지능 수준이 극히 낮은 지적장애인)을 측정해서 그런 사람들을 위한 특수교육을 시켜 사회의 일원으로 편입하기 위해서 만든 IQ 검사였는데[21] IQ검사를 보고 생각한 터먼의 계획이란 모든 사람들에게 IQ 검사를 받게 해서, '''지적장애인이 나오면 지적장애인의 성기능을 상실시켜 불임이 되게 하여 지적장애의 유전을 막아''' 더욱 좋은 미국을 만들자는 일종의 우생학인 것이었다.
참고로 비네는 지능이 고정되지 않았고 변할 수 있는 것이라고 생각한 반면, 터먼은 지능은 변할 수 없는 고정된 수치라고 생각했다. 하지만, 지능은 비네의 주장대로 변할 수 있다.
이 명목 하에 만들어진 '''단종법'''은 미국에서 1920년에 제도화, 1970년 경까지 시행되었으며, 약 200만 명이 넘는 장애인들이 불임이 되어야만 했다. 이후 마지막 검사 이후에서야 위헌 판결이 나 공식적으로 폐지되었다.(히틀러도 이것에 영향을 받아서 수많은 지적장애인들의 성기능을 상실시키거나 수용소에서 살해했다. T-4 프로그램을 보라. 한국도 한때 약간 시행되었다가 논란이 된적이 있다. 賛反(찬반)엇갈린 强制(강제)불임수술 (동아일보 1975.06.30 기사) 히틀러까지 안 가도 현대 유럽 각국의 역사에서 이 "유행"의 흔적을 찾아볼 수 있다. 심지어 스웨덴에서도 '''1976년까지''' 단종법이 시행된 바 있다.
터먼 본인이 주도한 또 다른 연구(고지능자의 인생 추적)에서 IQ가 높다고 해서 사람이 성공하지는 않는다는 결과가 나오기도 했다. 이 연구는 50년 가량 이루어졌다. 또한 지적장애는 유전된다는 증거가 없음도 밝혀져 지적장애인 세대의 지속을 명분으로 단종수술을 할 수는 없게 되었다. 다만 이와 별도로 이들이 자녀를 양육할 능력이 없음을 들어 불임수술이 필요하다는 주장은 계속 나오고 있다.
최근 미국에서 대안우파 및 백인우월주의자의 일부[22], 샘 해리스 같은 과학주의 논객들 사이에서 인종과 지능에 대해서 다시 이야기하려는 움직임을 보이고 있다.[23] 미국 역사상 최대의 논쟁적 도서인 The Bell Curve가 25년 만에 다시 인용되고 있으며 많은 이들이 과학적 인종주의의 재림이 되지 않을까 우려하고 있다.

6.2. 검사 방법의 한계

지능 검사를 여러 번 반복해서 패턴을 파악해 좋은 성적을 얻었다면 그 결과는 오염된 결과이기 때문에 신뢰할만 하지 않다. 단 이런 능력도 지능에 속하는 건 맞다. IQ 116~129 사이 정도면 1회차 풀이를 통해 문제의 패턴을 읽어낸 뒤에는 빠르게 문제를 적어 내는 능력이 있기 때문에 IQ 검사 점수가 초기에는 낮게 나오다가 나중에는 자기 지능보다 높게 나오는 게 일반적이다.[24]
그리고 인터넷에 1위 IQ라고 나돌아다니는 몇몇 사람들 중 마릴린 보스 사반트나 에반겔로스 카치울리스 등의 초월적인 점수들은 엄밀한 표준화 작업을 거치지 않은 실험적인 고도 지능 검사에서 얻어진것이다. 세계 최초의 고지능 검사는 Hoeflin의 Mega test인데 고작 48개의 문제를 7번이나 개정하고 3,000명을 넘어가는 응시자들을 모집했음에도 당시 심리학자들에게 엄청난 비판을 받았다. 이러한 테스트들의 가장 큰 문제는 적은 표본 때문에 외삽법에 너무 의존한다는 것과, 100만 명 중 1명, 혹은 그 이상의 터무니없이 초월적인 수준의 지능을 과연 판별할 수 있는지에 대한 논란이다. 따라서 개정에 따라 규준이 상당히 심하게 오르내리며 검사 사이의 상관계수도 경우에 따라 오히려 음을 나타내는 경우도 빈번하다.

7. 여담

거의 모든 사람들이 고지능을 부러워하지만 고지능과 저지능의 장단점이 있다. 고지능은 머리를 쓰는 일에 유리하며, 저지능은 사교성과 행복도가 높은 편이다.

멘사는 고지능자들이 속한 친목 단체다. 멘사 가입 테스트는 표준편차(SD) 24를 사용하는데, 이 테스트의 결과는 "156 이상, 148 이상, 불합격[25]
이 경우 147 이하에서 자신의 지능지수 표시.
" 뿐이기 때문에 합격한다고 해도 자신의 실제 IQ가 멘사 가입 이상이나 이하라는 것 밖에 알 수 없다. 자세한 내용은 해당 문서 참고.

멘사가 상위 2%라면 상위 100만 분의 1을 위한 메가 소사이어티도 존재한다(해당 사이트). 참고로 메가 소사이어티는 현재 입회가 불가능하다. 원래는 티탄 테스트를 입회용으로 인정했지만 현재 응시가 불가능해짐에 따라 입회 방법이 전무한 유일무이한 고지능 단체가 되겠다. 이보다 더한 기가 소사이어티도 존재한다(상위 10억 분의 1). 기가 소사이어티의 경우 폴 쿠이즈만의 테스트들로 입회가 가능하다. 자세한 내용은 고지능 단체 문서 참고.

지능 지수가 높은 동물을 뽑으라면 일단 영장류에서 보노보, 침팬지, 고릴라등의 사람과 생물들을 뽑고, 나머지 포유류에선 범고래, 돌고래, 코끼리 등이 있으며, 조류에선 까마귀, 앵무새 등의 지능지수가 높다. 사람과 가깝게 지내는 애완동물인 개나 고양이도 그 나름(대로) 지능 지수가 꽤 높은 편이라는 이야기도 있지만, 애완동물의 경우는 검사자들과 의뢰자들의 의도가 포함되어서 상당히 고평가되는 사례가 많아서 신뢰도에 문제가 있다. 이런 연구는 학계에선 거의 안 받아들여지지만 발표, 게재는 가능하기에 일반인들이 보고 덥썩 받아들이는 경우가 있다. 동물 지능지수 평가를 보면 연구자의 평가에 따라 기준점이 변해서, 돼지의 지능지수가 침팬지급으로 묘사된 연구가 있는가 하면, 다람쥐가 개와 고양이를 이긴 연구도 있다. 편향 문서의 1. 설명을 본 다음 2.4.2. 실험자 편향을 읽어보자.

8. 관련 문서

[1] $$\displaystyle \lim_{z \to 4.0} P \left( z=\frac {X-m}{\sigma} \right ) =0$$[2] 난이도가 고루 분포된 40문제를 20분내에 풀어야 나온다. 아무리 어려운 문제라도 1분 내에 답이 나와야 한다.[3] 지능이 고정된 수치라고 생각하고 있었고, 우생학을 지지했다.[4] 다만 이건 웩슬러 지능검사도 마찬가지로, 전문적인 IQ 테스트는 기계적으로 점수를 매기지 않고 전문가가 직접 측정하기에 그나마 객관성이 인정된다.[5] 무조건 믿었다가는 병역 기피를 희망하는 검사 대상자들이 설문지를 이상하게 작성한 걸 보고 줄줄이 4~5급 판정을 때리게 되어버리기 때문이다. 한국군은 군대 가기 싫다는 사람을 강제로 데려가는 징병제이기 때문에 미군이나 자위대와 달리 병역 대상자들의 진술을 FM대로 믿어서는 절대 안 된다.[6] 보통 지적장애 3급으로 걸리는 경우가 많다. 사실 겉으로 보면 일상 생활에는 지장이 없는 사람들이기 때문에 티가 잘 나지 않는다.[7] 군에 입대한 뒤 다시 기초적인 건강 상태를 체크하는 검사. 여기서 통과하면 교육대로 넘어가 훈련을 받고 나머지 기간 동안 복무하게 된다.[8] 정식검사도 기본 패턴은 대부분 비슷하다. 단 난이도가 높고 문제가 서로 공유되는 게 아니고 표준화도 되어 있기 때문에 객관성은 있다고 볼 수 있다. 그리고 패턴 파악하는 능력도 엄밀히 말하면 지능이다.[9] 어린 아이에게는 스탠포드-비네 방식의 비율지능검사를 사용하기도 한다.[10] 그리스의 정신과 의사로, 이름은 에반겔로스 카치울리스.[11] Terman sample처럼 고지능자만 대상으로 한정한 연구도 있는데, 마찬가지로 양의 상관관계가 있다고 나온다. 고지능자 문서 참조바람.[12] Bartels et al. (2012) 파일 [13] 어린 시절부터 이어진 만성적 불안이 오히려 천재를 만든다는 주장도 있다. 자기방어기제에는 주지화라고하는 것이 있는데, 이는 불안한 상황을 이성적인 사고로써 타개하려는 인간의 본능이다. 이러한 과정이 오랜 시간 지속되면 뇌의 시냅스가 발달하여 지능이 높아지는 것이다.[14] 기계가 발전하면서 엔지니어들은 살아남았지만 단순공장직에 종사하던 사람들은 해고당했고, 컴퓨터가 발전하면서 프로그래머가 떠올랐지만 당시에 엘리트 계층이었던 회사계산원들의 일자리는 크게 줄어들었으며 자율주행이 개발되면서 버스와 택시기사들의 일자리가 사라지는 것도 결국 지능지수에 따른 직업선택의 탈락의 연장선에 있다.[15] 고지능자 항목을 보면 알겠지만 지능이 일정 수준 이상으로 높아지면 그 상관도가 급격히 낮아진다. 이유는 해당 항목 참조.[16] 온라인으로 진행되었다는 점이 신뢰도를 떨어뜨릴 수 있다고 생각할 수 있으나, 애당초 참가자들의 지능 지수를 측정하여 줄을 세우고 분포를 조사하는 작업이 의미가 없기 때문에 치팅 등의 부정 행위는 전혀 문제가 되지 않는다. 참가자 한 명의 소검사 결과 간의 상관관계를 살펴보는 연구이기 떄문이다. 오히려 부정행위가 있었다면 높은 점수를 받기 위해 치팅을 하는 참가자들이 생겨나, g factor, 즉 IQ를 정당화하는 결과가 나왔을 것이다[17] 단기기억능력, 추론 능력, 그리고 언어 능력[18] 실제 연구에 포함된 소검사 항목은 12가지며, 각각 다른 지적 능력을 측정한다. 이 12가지 중, 그나마 상관관계가 조금이라도 있는 소검사 결과를 서로 묶은 항목이 세 가지라는 것이다.[19] 122였다.[20] 하지만 이 역시 높은 축에 속하는것이 맞다. 애초에 IQ는 100이 평균이다.[21] 간단한 예로, IQ가 낮은 것은 임상적 개입이 필요한 대상으로 인정되지만 IQ가 높은 것은 임상적 개입이 필요한 대상으로 인정되지 않는 것을 생각해 보면 된다. IQ가 낮은 걸로 2% 안에 드는 사람들인 지적장애인들을 위해서는 국가 차원에서 특수교육 등 여러 가지 지원을 해주는데, IQ가 높은 걸로 2% 안에 드는 사람들에게는(송유근 등 개인 차원이 아니라, IQ 130 이상 고지능자 일반에 대해) 국가 차원에서 그런 지원을 해주지 않는 것을 생각해 보라.[22] 예를 들어 로렌 서던과 스테판 몰리뉴가 세트로 강연을 다녔지만 IQ 이야기가 나오면 로렌 서던은 땅을 바라보는 등 질문에 완전히 회피하는 모습을 보인다.[23] 조던 피터슨은 인종과 IQ와 관련된 질문에 IQ를 (백인) 우익들이 민족과 그룹의 우월성을 뒷받침하기 위해 사용한다고 비판했다. 하지만 IQ검사가 문화 요소를 배제할 수 있고, 성공과 학업성취를 비교적 잘 예측하며, The Bell Curve의 핵심내용 중 하나인 아슈케나즈 유대인과 아시아인 이야기를 해서 사실상 필요한 이야기는 다했다. 물론 이는 심리학 교수로서 할 수 있는 범위 내의 발언이며 같은 내용으로 예전부터 강의도 했었다. 이에 대해서 스테판 몰리뉴같은 극우주의자들은 조던 피터슨이 욕안먹고 책 팔고 강연하려고 가장 중요한 이야기를 빼놓고 도망간다고 불만을 표시한다. 물론 이런 이야기를 직접하면 스테판 몰리뉴처럼 극우주의자, 백인우월주의자 타이틀을 얻는다.[24] 이건 과거 타블로가 풀었던 인과관계 추리 문제의 패턴을 연상하면 쉽다. 처음에는 당황해서 푸는 시간이 1분 이상 걸리는데(비장애인 패턴) 일단 시동이 걸리면 그와 비슷한 문제를 짦게는 20초. 적어도 30초 내에 풀어내는데 이는 1차에 풀어낸다면 멘사 레벨에 속하는 능력이다. 즉 패턴을 읽고 문제를 푸는 능력이 IQ 80~115 사이의 비장애인을 크게 앞서기 때문에 IQ가 결과적으로 과대평가되는 것이다.[25] 이 경우 147 이하에서 자신의 지능지수 표시.