평균

평균(平均)은 통계학에서 두 가지 서로 연관된 뜻이 있다.

일상에서 평균이라고 부르는 것으로 산술 평균이라고도 한다. 또한 표본 평균과 관련있다. 기하 평균이나 조화 평균과는 구별된다.
확률변수의 기댓값으로 모평균으로 다루어질수있다.

한편 역수의 산술평균의 역수를 조화 평균이라 한다.

평균은 통계학뿐만 아니라 기하학이나 해석학에서도 쓰인다. 이러한 맥락에서 통계학에서는 그 목적에 맞는 다양한 평균들이 고안되었다.

표본 평균은 모평균 같은 중심경향치(center tendency)에 대한 추정량으로 자주 쓰인다. 그러나 중심경향치(center tendency)의 다른 추정량이 쓰이기도 한다.

실수값을 갖는 확률 변수 X에 대해서, 평균은 X의 기댓값이 된다. 기댓값이 존재하지 않는다면 그 확률 변수에는 평균이 없다.

자료 집합에 대한 평균은 단순히 모든 관측값을 더해서 관측값 개수로 나눈 것이다. 일단 자료 집합의 공통성을 이렇게 설명하기로 하면, 관측값이 어떻게 다른지 설명하는 데는 보통 표준편차를 쓴다. 표준편차는 편차들(deviations)의 제곱합(SS)을 평균한 값의 제곱근이다.

평균은 편차 제곱의 합이 최소가 되는 유일한 값이다. 중심경향치(center tendency)을 평균이 아닌 다른 방식으로 측정하는 경우, 편차 제곱의 합을 구해 보면, 평균을 썼을 때 구한 값보다 크다. 이는 왜 통계 보고서에서 보통 평균과 표준편차를 인용하는지를 설명해 준다.

퍼진 정도에 대한 다른 측도로는 평균 편차가 있다. 이것은 (평균에 대한) 절대 편차를 평균한 것과 같다. 평균 편차는 바깥값에 덜 민감하지만, 자료 집합을 합칠 때 다루기 어렵다.

모든 확률 분포가 평균이나 분산으로만 정의되지는 않는다는 점을 주의할 수 있다. 예를 들면 코시 분포 같은 것이 있다.

데이타에대한 n개의 집합에서 평균을 구하는 다양한 방법을 살펴볼 수 있다. 여기서 사용한 기호는 수학기호표를 참고할 수 있다.