확률과 통계(2009)
1. 개요
이산수학의 조합론 영역과 대학에서 주로 배우는 통계학(기초통계학[1] 포함)의 기초가 되는 과목이다. 단원은 순열과 조합, 확률, 통계 총 3단원으로 구성되어있다. 중학교 수학의 수형도, 수학Ⅱ의 집합의 개념과 ∑라는 기호, [2] 이렇게만 알면 공부하는 데 거슬릴 정도가 아니다. 이처럼 교과서 자체가 독립적이기 때문에 고등학교 1학년이든, 중학생이든, 마음만 먹으면 이 과목을 시작할 수 있다. 다만, 대학 통계학과 비교하기에는 다소 억지적인 내용이 섞여 있다.
2. 상세
2.1. 교과 내용
2.1.1. Ⅰ. 순열과 조합
- 경우의 수: 고등학교 교육 과정에서는 '집합의 또다른 적용 파트'라고 보면 된다. 합의 법칙과 곱의 법칙을 다룬다. 합의 법칙은 집합의 연산법칙처럼 사용해주면 된다. 곱의 법칙은 현재 교과 과정상 서술이 금지된 '곱집합'(카테시안 곱)의 경우의 수를 구하는 것이다. 중학교 2학년 때 한번 보고 넘어온 내용이고 상식적으로 보았을 때 당연한 내용들이기 때문에 무시당하기 쉽지만, 사실 이 부분이 확률과 통계의 전반부에서 가장 중요한 내용이다. 후에 등장할 순열과 조합에 대한 이해에 필수적인 내용이며, 나중에 순열과 조합을 이용해 경우의 수를 계산할 때도 기초적으로 활용되는 아이디어가 이 부분에서 주로 등장하는 노가다하기(...)와 합의 법칙, 곱의 법칙이기 때문. 때문에 이 부분의 문제를 소홀히 넘어가지 말고 합의 법칙, 곱의 법칙이 쓰일 때를 정확히 알고 어떤 때 더하고 어떤 때 곱한다가 당연하게 느껴질 정도로 체화시키려 노력해야 한다.
- 순열과 조합: 확률과 통계의 1라운드 보스. 순열과 조합은 경우의 수를 쉽게 풀어내기 위한 도구라고 보면 된다. 여담이지만 Π(중복순열), H(중복조합) 기호는 한국에서만 쓰이는 출처 불명의 기호로, 외국에서는 이 둘을 아예 쓰지 않는다. 먼저 순열과 조합은 한국수학올림피아드에선 4대 영역 중 하나인 조합론에 해당하는 파트이고, 본래는 이산수학에 속하는 분야이다. 이전 교육과정보다 실제로 언어능력이나 상황 파악이 더 중요해진 이유는, 2009 개정 교육과정에 자연수의 분할과 집합의 분할(제2종 스털링 수)이 추가되었기 때문이다. 이 부분을 잘 공부해놓아야 뒤의 확률 파트를 잘할 수 있기 때문에, 어떻게 보면 확률과 통계 과목에서 가장 중요한 단원이기도 하다. 경우의 수의 대표 유형 중 하나인 '상자에 공을 넣는 가짓수 문제' 유형은 상자와 공의 구분가능 여부에 따라 풀이가 다르다. 서로 같은 혹은 다른 공 n개를 서로 같은 혹은 다른 상자 k개에 분배하는 방법의 수는 다음 표를 참고하자. 그러나 실제로 이 표를 달달 외워봤자 소용없다. 그냥 문제를 많이 풀어보고 체화시키는 게 답이다.
- 이항정리: (1+x)n의 전개식을 조합 기호로 나타내는 방법을 배운다. 개념만 어느정도 알면 문제는 상당히 정형화되어 있어 어렵지만은 않은 파트. 주로 특정 항의 계수를 구하라거나 이항계수의 성질을 이용하여 조합의 합을 구하라는 식으로 문제가 출제된다. 가끔씩 수학 I에서 요구하던 다항식에 대한 창의적인 아이디어를 요구하는 문제들도 나온다.
여담으로 2016학년도 10월 학평에서 처음으로 가/나형 모두 30번 킬러 문제로 순열/조합 파트에서 나왔었는데, 정답률이 처참했었다. 문제를 풀어보면 심하게 어렵지는 않지만, 30번에 확통이라는 이유로 많은 사람들이 거른 것으로 보인다. 만약 평가원에서 이를 갈고 수능 30번에 확통이 킬러로 나온다면.... 정말로 끔찍할 것이다. 여기에서 작정하고 킬러 문제가 제대로 등장하면 감히 미적분이나 공간도형 따위가 범접할 수 없을 정도로 정말로 답이 없기 때문이다.
2.1.2. Ⅱ. 확률
- 확률의 뜻: 1단원을 못한다면 두 번째 헬게이트인 곳. 여기서부터는 개념이 부실하면 큰일나는 부분이다. 사실 통계 단원으로 갈수록 더 그러한 경향이 두드러진다. 실제로 사건은 어떤 한 집합인데 표본 공간의 부분집합의 원소의 개수가 경우의 수이기 때문이다. 확률의 뜻과 정의는 용어 확인만 거치면 된다. 집합 개념과 꽤 유사하기 때문에 수학Ⅱ에서 집합을 제대로 익혔다면 익숙하게 잘 이해할 수 있을 것이다.
이때 확률에서 표본공간의 근원사건들은 모두 같은 정도로 기대되어야 한다. 즉, 확률에서 각각의 경우들은 모두 같은 정도로 기대되어야 한다. 때문에 확률 문제에서는 같은 것이 있어도 다른 것으로 보아 각각의 근원사건들이 기대되는 정도를 같게 해주어야 할 때가 있다. 예를 들어 주머니에 2개의 흰 공, 3개의 검은 공이 있고 이 중 하나의 공을 꺼낸다고 할 때 검은 공이 나올 확률을 구할 때, 같은 색의 공들은 서로 같다고 가정하면, 순열과 조합 단원에서의 관점으로 접근하면 가능한 경우의 수는 검은 공을 뽑거나 흰 공을 뽑는 두 가지이고 구하는 사건의 경우의 수는 이 중 검은 공이 나오는 하나이므로, 구하는 확률이 1/2이라 생각할 수 있지만 실제 확률은 직관적으로 생각해 보아도 3/5임을 알 수 있다. 이는 검은 공이 뽑히는 사건과 흰 공이 뽑히는 사건이 기대되는 정도가 다르기 때문으로, 이를 해결하기 위해서는 각각의 흰 공과 각각의 검은 공을 다르게 보아 각각의 근원사건들이 기대되는 정도를 같게 해주어야 한다. 2개의 흰 공과 3개의 검은 공 중에서 흰 공을 뽑을 사건이 기대되는 정도와 검은 공을 뽑을 사건이 기대되는 정도는 서로 다르지만 흰 공 W1, W2, 검은 공 B1, B2, B3 중에서 특정한 흰 공 또는 검은 공 하나를 뽑을 사건, 예를 들어 W1을 뽑는 사건과 B2를 뽑는 사건이 기대되는 정도는 모두 같기 때문이다.
교육과정 외의 내용으로 기하학적 확률이라는 내용도 여러 개념서에 등장하는데, 이를 이용하면 여러 연속적인 사건의 확률을 계산할 수 있다. 수능이라면 교육과정 외이기 때문에 나올 수 없지만 내신에서는 가끔씩 교과서에서 연습문제나 탐구활동 등에 끼워두는 방식으로 치사하게(...) 서술하는 경우도 있고 학교 수업에서 선생님이 가르쳐 주는 경우도 있기 때문에 이런 경우라면 소홀히 해서는 안된다.
- 조건부확률: 곱셈정리, 조건부확률, 독립시행 등의 상세한 용어가 등장한다. 이때 조건부확률과 곱셈정리, 사건의 독립 개념이 상당히 이해하기 난해하고 문제에 적용하기도 까다롭다. '~할 때', '~라면' 이라는 표현이 등장하면 조건부확률을 떠올리라는 말도 있지만, 이러한 표현은 일반적인 확률 문제에서도 쓰이는 표현이기 때문에 이를 외우는 것은 의미가 없다. 어디까지나 한 번 떠올려보는 것이 좋다는 이야기이지, 공식화시켜서 표현에 풀이법을 대응시키려 하는 순간 문제풀이가 산으로 간다. 또 독립사건과 배반사건 개념을 헷갈려 하는 학생이 상당히 많고 실제로 가끔씩 이를 이용하여 '배반사건은 독립사건이다' 식의 합답형 보기가 등장하기도 하니 혼동이 없도록 주의해야 한다. 참고로 위에 예시로 등장한 '배반사건은 독립사건이다'는 이 표현 그대로 합답형 보기에 등장했을 때는 무조건 거짓이니 바로 가위표 치고 넘어가도록 하자. 실제로 두 사건 A, B가 서로 배반이라면 P(A|B)=P(A∩B)/P(B)=0/P(B)=0이 되어 두 사건 A, B가 독립일 필요충분조건을 만족시키지 못하게 된다. 두 사건이 배반사건이라면 한 사건이 일어났을 때 다른 사건이 일어날 확률은 무조건 0이므로 배반사건은 종속사건이다.
2.1.3. Ⅲ. 통계
- 확률변수와 확률분포: 통계 파트는 용어 정리 학습이나 기호 인식이 더욱 중요한 파트인지라 다소 사회과학과 비슷한 성격을 지니고 있다. 확률분포 파트에서는 이산확률변수와 이항분포, 평균과 분산에 대해서 공부하다 보면 중학교 때 했던 그 바보같은 짓들이 공식 하나로 깔끔하게 해결한다는 것에 허탈감이 들 수도 있다. 여기서는 절대 시그마로 표현된 수열의 합으로 이미지를 기억하면 더 헷갈리니 주의하고, 그냥 우리말로 자동으로 번역할 수 있을 정도로 자신만의 팁을 만드는 것이 좋다. 연속확률변수 및 확률밀도함수 파트는 이전보다 축소된 감이 있다. 여기서 확률밀도함수의 닫힌 구간 [a, b]에 대한 확률 P(a≤X≤b)를 간혹가다 정적분으로 정의하는 참고서가 아직 있다 (특히 수학의 정석이 정적분으로 정의하며 정적분으로 풀이해야 하는 문제들까지 수록했다. 수학의 샘에서는 그냥 참고사항으로만 언급하였다.) 또 이전에는 연속확률변수의 평균과 분산을 구하는 내용을 정적분을 이용해서 다룬 적이 있었지만 미적분Ⅰ이 독립되면서 삭제할 수밖에 없게 되었다. 그러나 바뀐 교육과정 학생들이 이에 대해 다소 아쉬워할 이유는 없다. 그냥 문과 미적분 없던 시절인 구 7차 교육과정의 확률과 통계 단원으로 컴백. 어차피 연속확률변수의 평균과 표준편차도 이산확률변수처럼 E(X²)-{E(X)}²로 분산을 구하고, 확률변수와 확률값을 곱한 것들의 합으로 평균을 구하는 등 메카니즘이 똑같다. 이후 정규분포부터 난이도가 확 떨어지기 때문에 아예 정줄을 놓고 이 파트를 소홀히 하는 사람이 있다. 정규분포 문서를 보면 알겠지만 증명 과정이 고등학교 교육과정을 벗어나 증명을 하지 않고 얼렁뚱땅 넘어가는 부분도 꽤 많다.
- 통계적 추정: 앞 내용과 완전히 다른 방식으로 접근해야 한다. 그냥 다른 과목이 시작되었다고 깔고 가는 게 더 편할 것이다. 겉으로 서술된 것만 보면 이게 뭐야...하며 대뜸 겁을 먹게 되는데 마치 물리Ⅱ 교과서를 보고 데꿀멍 당하는 것과 비슷한 포지션. 그러나 그냥 겁주기용에 불과하고 통계 단원 중에서도 가장 쉬운 파트이다.
2.2. 대학수학능력시험 수학 영역
- 문·이과 공통으로 수능에 10문제씩이나 직접 출제된다.[4] 2단원인 확률과 3단원인 통계는 난이도가 썩 어렵진 않으나, 1단원인 순열과 조합에서 출제자가 난이도를 높게 내고자 한다면 끝도 없이 어려운 수준의 문제를 만들어 낼 수 있기 때문에 비교적 까다로운 편이다.(2017 수능에선 (가)형 9문제 (나)형 8문제가 출제 되었다.)
- 순열과 조합
- 순열과 조합은 수능 문제 기준으로 개념과 문제 풀이 영역이 따로 노는 경우가 굉장히 많고, 가끔가다 난해한 이산수학적인 아이디어를 요구하기 때문에 노가다 영역이냐며 학생들이 치를 떨어한다. 그런데 이산수학 문제는 풀이의 핵심이 아예 그 자체이기 때문에 어쩔 수 없다. 사실상 새로운 교육과정에 들어서면서 공간도형과 쌍두마차를 이루게 된 수능계의 또다른 최종보스이므로 유의하자.
- 일반적으로 조합론은 이론을 발견한 뒤에 적용하는 파트가 아니라, 우리가 평상시 쓰고 있던 생활 속의 셈법을 어거지로 이론화시키면서 탄생된 것이다 보니 "개념 쉽고, 문제 헬파이어"가 연출 되는 것이다. 조합론 자체가 아직까지 개발이 덜 된 이론이기 때문에 문제도 관점을 살짝 틀어만 줘도 굉장히 다양한 풀이가 나온다. 그래서 한국교육과정평가원 측이 수능 문제를 출제할 때, 의도를 명확히 하기 위해 문제 속에 제한 조건을 많이 걸어둔다. 그러다 보니 4점짜리 문제들 수준은 ㅎㅎ.
- 최상위권 학생들을 살펴보면 자잘한 기호를 쓰지 않고 대개 조합기호나 곱셈 법칙만으로 수능 4점짜리 문제를 깔끔하게 풀어낸다. 실제로 문제에서는 외워뒀던 공식들을 무력화시켜버리는 경우가 많다.
- 예전 교육과정 학생들이 배웠던 적분과 통계에서는 공집합을 허용하는 범위 내에서 중복순열 및 중복조합을 배웠는데, 바뀐 교육 과정에는 공집합을 허용하지 않는 범위까지 확장됐다. 이전에 서로 다른 것, 서로 같은 것을 서로 구분하는 것조차 까다로워 했던 이과생은 이제 공집합 여부 조건까지 결합해 4가지 상황 파악을 제대로 구분해야 하기 때문에 더 부담이 커진 셈이다. 물론 1가지 상황밖에 몰라도 됐던 미적분과 통계 기본 출신들은 어려움이 클 수 있다. 그래서인지 1등급 재수생들도 간간이 기출문제를 풀다가 문제에서 시사하는 하나하나의 '단어'나 수식언, '맥락 뜻'을 파악하지 못해 짝대기를 긋는 상황이 종종 생긴다. 사실상 이러한 교육 과정 개정 탓에 제대로 배운 재학생(현역)들만 더 유리한 상황이 되었다.
- 그 밖에 순열과 조합의 경우, 순서쌍 문제처럼 고정된 유형으로 함수의 개수를 구하라는 유형이 있는데. 까다롭게 내면 순열조합 단원 내의 온갖 개념을 다 짬뽕해야 겨우 풀리는 악랄한 문제가 만들어진다. 2017학년도 대학수학능력시험 문/이과 공통 27번 문항이 조합 문제였는데 많은 학생들은 풀고서 틀려버리는 상황이 발생했다.
- 단원의 특성상 문제를 보자마자 '아 이건 중복조합이네'와 같이 곧바로 어떤 단원에서 배웠던 건지 떠올리기가 힘들다. 그래서 아예 직접 세어 보면서 규칙을 찾는 풀이법(일명 NGD Theorem)도 많다.[5] 4점짜리가 이러한 이산수학적인 창의적인 구성법을 요구하기도 한다. 문제가 어려워질수록 빼야 하는 경우의 수가 많아지는데, 어떻게 빼야할 지 당연히 알려줄 리 없기 때문에 그로 인해 고전하는 경우도 많다. 문제를 많이 풀어서 다양한 유형을 접하며 감각을 익혀야 이 단원에 익숙해질 수 있다.
- 가끔 경우의 수 문제로 위장(?)하고 있는 이항정리 문제도 있다. 이항정리는 나중에 통계를 응용한 문제에서도 사용되는데, 거기서는 이전과는 반대로 전개된 것을 합치는 것을 요구한다. 그러니 전개된 것을 합치는 연습도 게을리하지 않길 바란다.
- 확률
- 개념이나 기출을 몇 바퀴 돌린 최상위권 학생들은 확률 용어에 대한 베이스를 제대로 다져놓고 1단원으로 회귀하는 휘황찬란한 공부 루트를 타기도 한다.
- 역대급 확률 문제는 2011학년도 9월 평가원 24번 문항이 있다. 진짜 역대급으로 어려운 확률과 통계 문제였다.
- 조건부 확률 파트에서는 역시나 고난도 문제는 앞의 순열과 조합에서 가져와 확률로 변형시키는 경우가 많다. 아무튼 수능이나 모의고사 문제로는 조건부확률 문제가 가장 많이 출제된다. (물론 2017년도부터는 다를 수도 있겠다. 하지만 조건부확률이 현재까지는 출제빈도가 높으니 잘 알아두도록 하자.)
- 통계
- 통계에서 킬러를 낼 수 있다면, 고정된 확률이 주어지지 않은 독립시행을 이항분포와 짬뽕 시킨 문항 정도이다. 구성을 다 따져 가면서 확률로 변환해야 하기 때문에 실제로 문제 풀 때 꾸준히 연습하지 않으면 털리기 농후한 단원이다. 교육과정 지침상 뒷부분(정규분포~통계적 추정)에서 절대 시험 문제를 어렵게 낼 수 없다는 특징도 있다.
- 앞서 언급했듯이 통계는 살짝 사회과학을 짬뽕시킨 수학같은 부분이기도 하다. 사회문화를 선택한 문과생들은 확통의 통계 단원을 배우고 나면 자료 수집에서의 표본의 대표성의 의미가 무엇인지 알 수 있게 되어 그쪽 문제를 풀기 수월해질 것이다. 불지옥 과목 화학Ⅰ에서는 아예 이 이산확률분포의 성질을 이용해서 동위원소를 찾아내는 아스트랄한 문항을 내기도 한다.
- 연속확률변수의 통곗값을 구할 때, 정적분을 직접적으로 활용하는 문제가 나올 가능성은 적지만 자연계의 경우 부정적분으로 정의된 함수로 간접출제될 수 있으니 참고하길 바란다.
- 통계적 추정 파트는 어렵게 나온 적은 별로 없다. 아주 작정하고 불수능으로 냈던 2011학년도 수능 모비율 문제를 제외하고는 4점짜리 문항도 아주 쉬운 편에 속한다. 그냥 문제를 많이 풀어보기 보다는 정확한 개념의 이해와 암기가 훨씬 중요하다며 짙게 강조하는 파트다.
- 개정 후 첫 평가원 시험이었던 2017학년도 6월 모의평가 이후 모의고사 및 수능에서 등급을 구별짓는 21번, 30번과 달리 크게 어려운 문항은 출제되지 않았고, 이전의 난이도가 높지 않았던 기출문제를 재변형하여 출제하거나, 교과서 예제 수준의 문제가 4점 문항으로 출제되었다.
- 수능 출제 기관인 한국교육과정평가원도 이 과목에서 수학 과목에서의 변별력을 갖출 생각은 없어 보이고, 객관식 21번, 29번, 30번에 배치되는 고난이도 미적분이나 공간도형, 수학 나형의 경우 고난이도 미적분, 수학2 영역에서 변별력 있는 문항을 출제할 것으로 보인다.
2.3. 여담
- 기존 교육과정에서의 고등수학에 있었던 경우의 수(직순열과 기본적인 조합), 적분과 통계에 있었던 중복순열, 원순열, 같은 것이 있는 순열, 중복조합, 이항정리와 기존의 확률(2단원), 통계(3단원)가 합쳐져 한 권으로 구성되어 있다. 문과 입장으로 보면 더 늘어난 셈이다. 집합의 분할, 자연수의 분할 관련 내용이 조합 다음 단원에 추가되었고, 연속확률변수의 평균, 분산 구하는 내용이 사라졌다. 대신 문과 입장에서는 모비율의 추정 파트가 하나 늘어났다. 이 부분은 이과만 배웠던 부분이다.
- 더 이전인 제7차 교육과정 시절에는 이 확률과 통계라는 교과서의 내용 모두가 수학 Ⅰ에 있었다! 다만, 당시 수학Ⅰ은 지수와 로그(現 수학Ⅱ), 행렬(現 고급 수학Ⅰ), 수열(現 수학Ⅱ), 수열의 극한(現 미적분Ⅰ), 지수함수와 로그함수(現 미적분Ⅱ), 순열과 조합(現 확률과 통계), 확률(現 확률과 통계), 통계(現 확률과 통계)로 총 8개의 대단원으로 구성되어 있었으며, 문과생이든 이과생이든 고등학교 2학년 때 배웠다. 여담으로 당시 1학년 때 배우는 수학은 수학10-가/나(10이라는 숫자는 10학년을 의미. 초등학교 6학년부터 중학교/고등학교 없이 카운팅을하면 고1때 10학년이다.)라는 과목명이었는데, 현재의 수학Ⅰ과 수학Ⅱ로 대체되고 있다.
- 한편 7차 당시에도 확률과 통계라는 과목이 별도로 있었으며 수리 가형의 수능 선택 과목이었다. 내용은 분할이 없다는 점과 연속확률변수 부분을 아예 다루지 않았다는 점을 제외하면 지금과 동일하다. 구 7차 교육과정 당시에 문과 고교 내신과목(고3용)으로 많이 채택되었던 선택과목이었는데, 이 과목은 당시 수학Ⅰ에 있던 확률과 통계 단원의 시즌2 취급이었다.(...) (고3 선택과목이었기에 실제 내신 시험출제는 수능 나형 대비용이랍시고 수학Ⅰ 전 부분을 내는 편이었다.) 당시 수학Ⅰ에 있던 확률과 통계 단원과 거의 중복되었기 때문. 이것 때문에 그런지 그 시절 수능에서 과목 선택률은 이산수학과 마찬가지로 매우 낮은 편이었다.[7] 참고로 그 시절 확통 교과서는 국정교과서(천재교육 위탁 출판)였다.
- 순열과 조합 단원인 '조합론' 파트는 세계 수학올림피아드 기준으로 대한민국 사람들이 가장 못하는 영역이라고 한다.
- 위에 올려진 설명대로 개념이 워낙 쉽지만 문제는 헬파이어라서 현우진이 말하길 2017년도 수능 수학에서 수학Ⅱ(2009)나 이 과목만큼 두려움이 가득한 과목은 없을 것이라고 한다.
- 2018학년도 고등학교 1학년부터 적용되는 2015 개정 교육과정에서 개편 작업에 따라 '수포자'를 줄인다는 명분으로 '분할'과 '모비율'이 삭제된다. 즉, 2020학년도 수능시험까지는 유지되며, 이후에는 개정 교육과정이 적용되며 빠지게 된다.
- 기존에 이수한 과목의 개념을 잘 모르면 버벅댈 수 있는 미적분에 비해 앞에서 배운 과목들과의 연관성이 낮다. 사실상 별개의 과목으로 봐도 될 정도이다. 지금까지 그런 문제가 나온 적은 없지만, 앞으로는 기존에 배운 개념을 응용한 문제가 나올 수 있다. 그 이유로 이 과목은 개인차에 따라 점수를 올려줄 수도, 점수를 오히려 깎아먹을 수도 있다.
- 교육과정이 개정될수록 비중이 늘어나는 과목으로 6차 교육과정까지만 해도 확률과 통계는 수학Ⅰ의 일부분이었으며 수능 기준으로 문과 시험에서는 2~3문제, 이과 시험에서는 겨우 1~2문제 나오는 정도의 미미한 비중이었다. 특히 당시 이과 시험에서는 확률과 통계의 최종보스급인 순열과 조합이 아예 출제되지 않았던 사태가 나기도 했다. 7차로 넘어가면서부터 비중이 늘어나더니 2017 수능부터는 문이과 공통으로 30문제 중 10문제가 출제되는 미친 존재감을 자랑하게 되었다.[8]
- 수학이 당연히 그렇지만 특히 이 확통이란 놈은 주관식 문제에서 그 위력이 더욱 강해진다. 객관식은 답이 안 나오면 내가 어디서 개념을 잘못 썼나 어디서 계산을 잘못했나 확인이 가능하지만 주관식에선 답이 네자리가 나오거나 확률에 숫자 곱했는데 분수가 뜨지 않는 이상 그걸 확인할 수가 없으니.[9]
- 각 단원 별로 중복조합의 활용, 조건부확률, 정규분포는 매번 수능이나 모의고사에 4점까지로 출제된다. 이 3개 유형은 반드시 철저하게 공부하고 시험에 임해야 한다. 난이도를 높이고자 할 경우 중복조합의 난이도를 높이고자 하는 경우가 많다. 요즘은 분할과 사건의 독립, 독립시행 같은 유형도 잘나온다. 분할과 사건의 독립은 3점 계산문제로 독립시행은 주로 조건부확률과 엮어서 잘 출제된다.
- 2016학년도 10월 고3 전국연합학력평가 수학 가형 나형모두 30번에 확통이 출제되었다.
- 이 과목을 쉬워하는 학생은 문제를 잘 풀어나가지만, 또 어려워하는 학생은 엄청 막히기도 하는 과목이다.
- 문제의 난이도가 뒤로 갈수록 쉬워진다. 이는 1단원에서도 나타나는데 맨 앞의 경우의 수와 순열이 가장 어렵다. 조합으로 갈수록 순열보다는 덜 힘들고 이항정리로 가면 난이도가 하락한다. 3단원에서도 개념만 잘 이해한다면 앞부분의 확률분포보다 뒷부분의 통계적 추정이 문제를 푸는데 걸리는 시간이 더 짧다. 다만 개념의 난이도는 뒤로 갈수록 어려워진다.[10]
- 확률과 통계의 선이수과목은 수학I, 수학II이다. 교육과정 총론에도 '확률과 통계는 미적분 I이나 미적분 II의 내용을 이해한 학생이 선택하는 것이 바람직하지만, 미적분 I이나 미적분 II를 이수하지 않은 학생도 선택할 수 있는 과목이다.'라고 나와있다. 그래서 정적분을 통해 연속확률분포의 확률밀도함수 $$ f(x) $$, 평균(기댓값) $$ E(X) $$, 분산 $$ V(X) $$[11] , 표준편차 $$ σ(X) $$를 구하는 내용이 없고[12] 큰 수의 법칙을 극한을 이용하여 표현하지 않고 있다. 그래서인지 미적분의 내용은 거의 포함되어 있지 않다. 사실 미적분의 내용을 포함시키더라도 미적분 I의 내용만 이해한 정도라면 충분하다. 미적분 II의 내용은 정규분포에서 나오는 무리수 e 정도 외에는 없다.
[1] '경영통계' 과목 등 각 전공에 커스텀된 기초통계 과목 포함.[2] 미적분Ⅰ을 이수한 학생이 추가로 이수할 수 있는 과정이다.[3] T(n,k)라고도 나타낸다[4] 하지만 평가원 방침에 따라 최대 ±20%정도 비율을 조정할 수 있다. 이 과목에서 나올 수 있는 문제 수는 8~12문제인 셈.(2017학년도와 2018학년도 수능에서 9문제씩 출제)[5] 사실 억지로 공식을 사용하는 것 보다는 그냥 세는 게 나을 때도 있다. 이는 KMO 조합론에서도 많이 쓰이는 테크닉.[6] 주로 지거국 대학들이 그런 경우가 많았다.[7] 사실 선택과목 '확률과 통계'는 '숨은꿀'과목으로 취급받기도 했으나 서울대에서 '미분과적분'을 지정하는 바람에 선택률이 낮아진 것이다. 목표대학이 가형을 지정하는 바람에 나형을 칠 수 없는 중위권 학생[6] 이거나 미적분에 자신 없는 경우 전략적으로 선택하는 경우가 대부분이었고 일부 하위권 학생들이 그냥 대놓고 찍기 위해서 고르는 경우도 있었다. '미분과 적분' 선택자 집단이 거의 고인물이었던 것에 반해 '확률과 통계' 선택자 집단은 수학Ⅰ만 잘해서 전체성적은 떨어지는 경우가 많았다. 또한 가형 선택과목의 '확률과 통계' 문항들은 수학Ⅰ에 나오는 확률통계 4점짜리 유형들을 배점만 낮춰 3점짜리로 내는 경우가 많아서 공부 부담이 적었다. 난이도가 쉬운만큼 표준점수에서 손해를 본다는 말도 있었지만 과목별 최고표준점수는 해마다 달라서 '미분과적분'이 항상 높게 나온것은 아니다. 선택과목 5문항 '확률과 통계'에서는 그렇게 어려운 문제가 많이 나오지도 않았고 킬러 30번을 제외하고는 수학Ⅰ만 잘해도 무난하게 풀 수 있는 난이도였다. 이것은 고인물이 많아서 문제를 어렵게 내도 고득점자가 많이 나오는 '미분과 적분'과의 표준점수 차이를 줄이기 위해 표본 수준이 다소 떨어지는 '확률과 통계' 난이도를 의도적으로 낮춰 '확률과 통계'의 저득점자를 의도적으로 줄였던 것과 다름이 없다.[8] 2017학년도 대학수학능력시험과 2018학년도 대학수학능력시험에서는 9문제가 출제되었다. 이는 출제진들이 미적분을 12문제씩 출제하기에 확통이 한 문제 줄어든것. 20프로 내외에서 조정할 수 있기 때문에 각 과목에서 8~12문항을 출제할 수 있다.[9] 2017학년도 대학수학능력시험 가/나형 공통 27번으로 출제된 문제에서 이는 극명히 드러났는데, 만약 객관식이었으면 낮아봐야 정답률 50%대를 기록했을법한 그렇게 어려운 문항은 아니었으나 주관식으로 출제된 탓에 정답률이 30% 극초반대까지 떨어졌다. 객관식의 예는 2018학년도 수능 가형 18번으로 만약 주관식에 출제되었더라면 2017학년도 27번 정도는 아니더라도 정답률이 50%대 이하로는 떨어졌을 것이다. 하지만 객관식으로 출제되었기에 정답률이 85%에 육박한다.[10] 뒤로 갈수록 문제 수준이 어려워지는 기하와 벡터와 반대의 케이스이다. 개념 난이도로 비교하면 동일한 케이스.[11] 흔히 '제평평제'(제곱의 평균-평균의 제곱)으로 많이 기억하고 있다.[12] $$ [a, b] $$에서 정의된 연속확률분포의
기댓값 $$ E(X) = \displaystyle \int_{a}^{b} xf(x)\,dx $$
분산 $$ V(X) = E(X^{2}) - (E(X))^{2} $$
$$ = \displaystyle \int_{a}^{b} x^{2}f(x)\,dx - (\displaystyle \int_{a}^{b} xf(x)\,dx)^{2} $$
표준편차 $$ σ(X) = \sqrt{V(X)} $$
기댓값 $$ E(X) = \displaystyle \int_{a}^{b} xf(x)\,dx $$
분산 $$ V(X) = E(X^{2}) - (E(X))^{2} $$
$$ = \displaystyle \int_{a}^{b} x^{2}f(x)\,dx - (\displaystyle \int_{a}^{b} xf(x)\,dx)^{2} $$
표준편차 $$ σ(X) = \sqrt{V(X)} $$