기술 통계학
1. 개요
'''기술 통계학'''(descriptive statistics)은 자료를 수집하고 정리해서 표, 도표를 만들거나 요약하여 변동의 크기나 대푯값, 분산, 평균 등을 구하는 것이다.
2. 기술 통계의 시각화
statistical graphics
일반적으로 기술 통계의 결과 데이터는 막대한 분량을 자랑하는 경우가 많다. 이를 돕기 위하여 '''도수분포표'''(frequency distribution table)라는 표 형태의 방법이 존재하는데, 대량의 자료를 하나하나 고스란히 보여주는 것이 아니라 일정한 기준에 따라서 등급(class) 또는 범주(category)로 묶어서 보여주는 것이다. 예컨대 TOEIC 점수를 600~695점, 700~795점, 800~895점 같은 방식으로 설정하고, 각각에 해당하는 응시자의 수를 표기하는 것은 등급의 구간을 편의상 100으로 설정한 도수분포표라고 할 수 있다. 만일 측정에 있어서 명목적인 데이터라면, 예컨대 성별이나 직업, 거주지역 같은 데이터를 활용해야 한다면 등급이라고 부르지 않고 범주(category)라고 부른다.
그러나 경우에 따라서는 표로 만든다고 하더라도 여전히 눈이 빙빙 도는 경우가 있다. 또한 각각의 등급이나 범주를 비교해야 할 때에도 도수분포표로는 한계가 있다. 이 때문에 시각적으로 쌈빡하게 정리해서 보여줄 필요성이 생겼고, 그래서 고안된 것이 이하와 같은 다양한 몸부림(…)들이다. 어느 하나 할 것 없이 전부 다 중요하지만, 각각의 쓰임새는 그것이 다루는 데이터의 특징에 따라서 전부 다르다.
한컴오피스 한글 및 MS 워드에서 이하의 시각화 서비스를 지원하고 있으며, ITQ 및 컴퓨터활용능력 자격증 시험의 단골 주제이기도 하다.
뜻밖일 수 있지만 "백의의 천사" 로 알려진 플로렌스 나이팅게일이 통계자료를 시각화했다는 업적으로 통계학사(史)에서 등장하기도 한다. 크림 전쟁에서 영국군 사망 원인에 대한 통계자료를 도표로 만든 것이 유명하다.
2.1. 막대 그래프와 히스토그램
bar chart & histogram
막대 그래프 문서 참조.
2.2. 선 그래프
(polygonal) line chart
선 그래프 문서 참조.
2.3. 원 그래프
pie chart
원 그래프 문서 참조.
2.4. 상자 수염 그림
상자 수염 그림(box-and-whisker plot, box-and-whisker diagram) 또는 상자 그림(box plot, boxplot)은 다섯 숫자 요약으로 그린, 자료의 특성을 요약하는 그래프이다.
상자 수염 그림 문서 참조.
2.5. 산점도
산점도는 scatter plot, scatterplot, scatter graph, scatter chart, scattergram, scatter diagram 등으로 부른다.
산점도 문서 참조.
3. 관련 문서
- 추론 통계학(inferential statistics)