사분위 범위(IQR)는 데이터 집합의 중간 50%의 분포를 측정합니다. 75번째 백분위수(Q3)와 25번째 백분위수(Q1) 사이의 차이로, 이상값에 의해 왜곡되지 않는 강력한 변동성 측도입니다.
공식
IQR = Q3 − Q1
단계별 예시
데이터 집합: {3, 7, 8, 15, 21, 24, 30, 32, 45}
1단계: 데이터를 정렬합니다(위에서 이미 정렬됨).
2단계: 중앙값(Q2)을 찾습니다. 중앙값 = 21 (9개 요소 집합에서 5번째 값)
3단계: Q1 찾기 — 하위 절반 {3, 7, 8, 15}의 중앙값. Q1 = (7 + 8) / 2 = 7.5
4단계: Q3 찾기 — 상위 절반 {24, 30, 32, 45}의 중앙값. Q3 = (30 + 32) / 2 = 31
5단계: IQR을 계산합니다. IQR = 31 − 7.5 = 23.5
이상값 탐지를 위한 IQR 사용
일반적인 규칙: Q1 − 1.5×IQR 미만 또는 Q3 + 1.5×IQR 초과인 값은 이상값으로 간주합니다.
하한 경계: 7.5 − 1.5×23.5 = 7.5 − 35.25 = −27.75 상한 경계: 31 + 1.5×23.5 = 31 + 35.25 = 66.25
데이터 집합의 어떤 값도 이 경계 밖에 해당하지 않으므로 이상값이 없습니다.
IQR 대 표준 편차
다음 경우에는 표준 편차보다 IQR이 선호됩니다:
- 데이터가 비대칭이거나 이상값이 있는 경우
- 중앙값 기반 요약을 원할 때 (IQR은 중앙값과 쌍을 이루고, SD는 평균과 쌍을 이룹니다)
- 소득, 주택 가격 또는 기타 오른쪽으로 치우친 분포를 분석할 때
모든 데이터 집합에 대해 IQR 계산기를 사용하십시오.