최빈값은 데이터 세트에서 가장 자주 나타나는 값입니다. 평균과 중앙값과 달리, 데이터 세트에는 최빈값이 하나 이상 있을 수도 있고 전혀 없을 수도 있습니다.

최빈값 구하기: 3단계 과정

  1. 데이터 정렬: 계산을 쉽게 하기 위해 값을 가장 작은 것부터 가장 큰 것 순서로 정렬합니다.
  2. 빈도 세기: 각 값이 몇 번 나타나는지 확인합니다.
  3. 가장 빈번한 것 확인: 가장 높은 빈도를 가진 값(또는 값들)이 최빈값입니다.

풀이 예제

예제 1: 하나의 최빈값 (단봉형)

데이터 세트: {2, 4, 4, 6, 7, 4, 9}

정렬 후: 2, 4, 4, 4, 6, 7, 9

각 값의 빈도:

  • 2 → 1번
  • 4 → 3번
  • 6 → 1번
  • 7 → 1번
  • 9 → 1번

최빈값 = 4 (가장 자주 나타남)

예제 2: 두 개의 최빈값 (쌍봉형)

데이터 세트: {1, 2, 2, 3, 5, 5, 7}

각 값의 빈도:

  • 1 → 1번
  • 2 → 2번
  • 3 → 1번
  • 5 → 2번
  • 7 → 1번

최빈값 = 2와 5 (둘 다 두 번 나타남)

예제 3: 최빈값 없음

데이터 세트: {1, 2, 3, 4, 5}

각 값이 한 번씩만 나타나므로 최빈값이 없습니다.

최빈값을 사용하는 경우

상황 적절한 측도
회사의 평균 급여 중앙값
가장 많이 팔린 신발 사이즈 최빈값
시험 점수의 중심 평균 또는 중앙값
공장에서 가장 흔한 결함 유형 최빈값

그룹화된 데이터에서 최빈값

데이터가 클래스로 그룹화되어 있을 때, 최빈값은 다음 공식으로 추정할 수 있습니다:

최빈값 = L + [(f₁ − f₀) / (2f₁ − f₀ − f₂)] × h

여기서:

  • L = 최빈 클래스의 하한값
  • f₁ = 최빈 클래스의 빈도
  • f₀ = 최빈 클래스 이전 클래스의 빈도
  • f₂ = 최빈 클래스 다음 클래스의 빈도
  • h = 클래스 폭

이 공식은 도수 분포표에 정리된 데이터를 분석할 때 통계학에서 널리 사용됩니다.