最頻値とは、データセットの中で最も頻繁に現れる値のことです。平均値や中央値とは異なり、データセットには複数の最頻値が存在する場合も、最頻値がない場合もあります。
最頻値の求め方:3ステップのプロセス
- データを並べ替える:カウントしやすいように、値を小さい順から大きい順に並べます。
- 頻度を数える:各値が何回現れるかを調べます。
- 最も頻繁なものを特定する:最も高い頻度を持つ値(または値)が最頻値です。
解いた例題
例題1:1つの最頻値(単峰型)
データセット:{2, 4, 4, 6, 7, 4, 9}
並べ替え後:2, 4, 4, 4, 6, 7, 9
各値の頻度:
- 2 → 1回
- 4 → 3回
- 6 → 1回
- 7 → 1回
- 9 → 1回
最頻値 = 4(最も多く現れる)
例題2:2つの最頻値(双峰型)
データセット:{1, 2, 2, 3, 5, 5, 7}
各値の頻度:
- 1 → 1回
- 2 → 2回
- 3 → 1回
- 5 → 2回
- 7 → 1回
最頻値 = 2 と 5(両方とも2回現れる)
例題3:最頻値なし
データセット:{1, 2, 3, 4, 5}
各値が1回しか現れないため、最頻値はありません。
最頻値を使う場面
| 状況 | 適切な指標 |
|---|---|
| 企業の平均給与 | 中央値 |
| 最も売れた靴のサイズ | 最頻値 |
| テストの点数の中心 | 平均値または中央値 |
| 工場で最も多い不良品の種類 | 最頻値 |
度数分布表における最頻値
データがクラス(階級)にグループ化されている場合、最頻値は次の公式で推定できます:
最頻値 = L + [(f₁ − f₀) / (2f₁ − f₀ − f₂)] × h
ここで:
- L = 最頻クラスの下限
- f₁ = 最頻クラスの頻度
- f₀ = 最頻クラスの前のクラスの頻度
- f₂ = 最頻クラスの後のクラスの頻度
- h = クラスの幅
この公式は、度数分布表に整理されたデータを分析する際に統計学で広く使われています。