最頻値とは、データセットの中で最も頻繁に現れる値のことです。平均値や中央値とは異なり、データセットには複数の最頻値が存在する場合も、最頻値がない場合もあります。

最頻値の求め方:3ステップのプロセス

  1. データを並べ替える:カウントしやすいように、値を小さい順から大きい順に並べます。
  2. 頻度を数える:各値が何回現れるかを調べます。
  3. 最も頻繁なものを特定する:最も高い頻度を持つ値(または値)が最頻値です。

解いた例題

例題1:1つの最頻値(単峰型)

データセット:{2, 4, 4, 6, 7, 4, 9}

並べ替え後:2, 4, 4, 4, 6, 7, 9

各値の頻度:

  • 2 → 1回
  • 4 → 3回
  • 6 → 1回
  • 7 → 1回
  • 9 → 1回

最頻値 = 4(最も多く現れる)

例題2:2つの最頻値(双峰型)

データセット:{1, 2, 2, 3, 5, 5, 7}

各値の頻度:

  • 1 → 1回
  • 2 → 2回
  • 3 → 1回
  • 5 → 2回
  • 7 → 1回

最頻値 = 2 と 5(両方とも2回現れる)

例題3:最頻値なし

データセット:{1, 2, 3, 4, 5}

各値が1回しか現れないため、最頻値はありません

最頻値を使う場面

状況 適切な指標
企業の平均給与 中央値
最も売れた靴のサイズ 最頻値
テストの点数の中心 平均値または中央値
工場で最も多い不良品の種類 最頻値

度数分布表における最頻値

データがクラス(階級)にグループ化されている場合、最頻値は次の公式で推定できます:

最頻値 = L + [(f₁ − f₀) / (2f₁ − f₀ − f₂)] × h

ここで:

  • L = 最頻クラスの下限
  • f₁ = 最頻クラスの頻度
  • f₀ = 最頻クラスの前のクラスの頻度
  • f₂ = 最頻クラスの後のクラスの頻度
  • h = クラスの幅

この公式は、度数分布表に整理されたデータを分析する際に統計学で広く使われています。