최빈값은 데이터 세트에서 가장 자주 나타나는 값입니다. 평균과 중앙값과 달리, 데이터 세트에는 최빈값이 하나 이상 있을 수도 있고 전혀 없을 수도 있습니다.
최빈값 구하기: 3단계 과정
- 데이터 정렬: 계산을 쉽게 하기 위해 값을 가장 작은 것부터 가장 큰 것 순서로 정렬합니다.
- 빈도 세기: 각 값이 몇 번 나타나는지 확인합니다.
- 가장 빈번한 것 확인: 가장 높은 빈도를 가진 값(또는 값들)이 최빈값입니다.
풀이 예제
예제 1: 하나의 최빈값 (단봉형)
데이터 세트: {2, 4, 4, 6, 7, 4, 9}
정렬 후: 2, 4, 4, 4, 6, 7, 9
각 값의 빈도:
- 2 → 1번
- 4 → 3번
- 6 → 1번
- 7 → 1번
- 9 → 1번
최빈값 = 4 (가장 자주 나타남)
예제 2: 두 개의 최빈값 (쌍봉형)
데이터 세트: {1, 2, 2, 3, 5, 5, 7}
각 값의 빈도:
- 1 → 1번
- 2 → 2번
- 3 → 1번
- 5 → 2번
- 7 → 1번
최빈값 = 2와 5 (둘 다 두 번 나타남)
예제 3: 최빈값 없음
데이터 세트: {1, 2, 3, 4, 5}
각 값이 한 번씩만 나타나므로 최빈값이 없습니다.
최빈값을 사용하는 경우
| 상황 | 적절한 측도 |
|---|---|
| 회사의 평균 급여 | 중앙값 |
| 가장 많이 팔린 신발 사이즈 | 최빈값 |
| 시험 점수의 중심 | 평균 또는 중앙값 |
| 공장에서 가장 흔한 결함 유형 | 최빈값 |
그룹화된 데이터에서 최빈값
데이터가 클래스로 그룹화되어 있을 때, 최빈값은 다음 공식으로 추정할 수 있습니다:
최빈값 = L + [(f₁ − f₀) / (2f₁ − f₀ − f₂)] × h
여기서:
- L = 최빈 클래스의 하한값
- f₁ = 최빈 클래스의 빈도
- f₀ = 최빈 클래스 이전 클래스의 빈도
- f₂ = 최빈 클래스 다음 클래스의 빈도
- h = 클래스 폭
이 공식은 도수 분포표에 정리된 데이터를 분석할 때 통계학에서 널리 사용됩니다.