四分位範囲(IQR)はデータセットの中央50%の広がりを測定します。第75パーセンタイル(Q3)と第25パーセンタイル(Q1)の差であり、外れ値によって歪められない頑健な変動性指標です。
公式
IQR = Q3 − Q1
ステップごとの例
データセット: {3, 7, 8, 15, 21, 24, 30, 32, 45}
ステップ1: データを並べ替える(上記ではすでに並べ替え済み)。
ステップ2: 中央値(Q2)を求める。 中央値 = 21(9要素のセットで5番目の値)
ステップ3: Q1を求める — 下半分{3, 7, 8, 15}の中央値。 Q1 = (7 + 8) / 2 = 7.5
ステップ4: Q3を求める — 上半分{24, 30, 32, 45}の中央値。 Q3 = (30 + 32) / 2 = 31
ステップ5: IQRを計算する。 IQR = 31 − 7.5 = 23.5
外れ値の検出にIQRを使用する
一般的なルール: Q1 − 1.5×IQR 未満または Q3 + 1.5×IQR 超の値は外れ値とみなされます。
下限フェンス: 7.5 − 1.5×23.5 = 7.5 − 35.25 = −27.75 上限フェンス: 31 + 1.5×23.5 = 31 + 35.25 = 66.25
データセットのいずれの値もこれらのフェンスの外には該当せず、外れ値はありません。
IQR と標準偏差の比較
以下の場合、標準偏差よりIQRが好まれます:
- データが歪んでいる、または外れ値がある場合
- 中央値に基づく要約が必要な場合(IQRは中央値と組み合わせ、SDは平均と組み合わせる)
- 収入、住宅価格、その他の右に歪んだ分布を分析する場合
どんなデータセットにも当社のIQR計算機をご利用ください。