Q.
ヒストグラムが「右に裾が長い(大きい値の側に少数の大きなデータが伸びている)」形のとき、平均値と中央値の大小関係として最も適切なものはどれか。
解説まとめ
正解はDです。右に裾が長い分布では、大きい側に少数の大きな値があり、平均値はそれらに引っ張られて大きくなります。一方、中央値は順位の真ん中なので裾の影響を受けにくく、平均ほど大きくなりません。その結果、平均値 > 中央値 という大小関係になる傾向があります。年収や価格のデータでよく見られる形です。
ポイント
この問題の核心は「分布の歪みと代表値の位置」の対応です。右に裾が長い(正の歪み)と平均が裾側に引っ張られ、中央値より大きくなります。平均と中央値のずれの向きから、分布がどちらに歪んでいるかを逆に推測することもできます。
ワンポイントアドバイス
平均が中央値より明らかに大きいデータを見たら、「右に裾が長い分布かもしれない」と疑ってみましょう。年収や単価のように一部の大きな値があるデータでは、平均だけだと実態より高く見えがちです。そんなときは中央値も併記すると、より実感に近い数字を伝えられます。
解説詳細
右に裾が長い分布と平均・中央値
右に裾が長い分布(正の歪み)では、大きい値の側に少数のデータが長く伸びています。平均はすべての値を使うため、その大きな値に引っ張られて高くなります。中央値は順位の真ん中を見るだけなので裾の影響が小さく、相対的に低いままです。よって平均値 > 中央値となるのが典型です。
他の選択肢がなぜ誤りか
Aの「必ず一致する」は左右対称(正規分布など)のときの話で、裾が偏った分布には当てはまりません。Bの「平均が中央値より小さくなる」は、左に裾が長い(負の歪み)場合の傾向で、右に裾が長い本問とは逆です。Cの「形と無関係」も誤りで、平均と中央値の大小は分布の歪みと明確に対応します。右に裾が長ければ平均 > 中央値です。