Q.
「四分位範囲(IQR)」の説明として正しいものはどれか。
解説まとめ
正解はCです。四分位範囲(IQR)は、第3四分位数(上位25%の境)から第1四分位数(下位25%の境)を引いた値で、データの中央50%が収まる幅を表します。両端の極端な値を除いた中心部の散らばりを見るため、外れ値の影響を受けにくいのが特徴です。範囲(レンジ)との違いを押さえましょう。
ポイント
範囲が「全体の幅」を見るのに対し、四分位範囲は「真ん中50%の幅」を見ます。上下それぞれ25%を切り落とすことで、外れ値に強い散布度になっている点が核心です。箱ひげ図の箱の長さがこのIQRに対応します。
ワンポイントアドバイス
外れ値が混じっていそうなデータのばらつきを見るときは、範囲よりも四分位範囲を使ってみましょう。中央50%に注目するため、極端な値に振り回されずに散らばりを比較できます。箱ひげ図を読むときは、箱の長さ=IQRだと意識すると解釈が速くなります。
解説詳細
四分位範囲の定義
データを大きさ順に並べて4等分したとき、下から25%の境界が第1四分位数、75%の境界が第3四分位数です。四分位範囲(IQR)はその差(第3四分位数 − 第1四分位数)で、中央50%のデータが収まる幅を表します。上下の極端な値を除外するため、外れ値に強い指標です。
他の選択肢がなぜ誤りか
Aの「最大値−最小値」は範囲(レンジ)の定義であり、両端を使うため外れ値に弱く、IQRとは別物です。Bの「偏差を二乗して平均」は分散の定義です。Dの「合計を個数で割る」は平均値であり代表値です。IQRはあくまで中央50%の幅を表す散布度だと区別してください。