Q.
「分散」の説明として最も正しいものはどれか。
解説まとめ
正解はAです。分散は、各データが平均からどれだけ離れているか(偏差)を二乗して、その平均をとった値です。偏差をそのまま平均するとプラスとマイナスが打ち消し合って0になってしまうため、二乗して符号を消してから平均します。ばらつきを表す代表的な指標です。
ポイント
分散の肝は「なぜ二乗するのか」です。偏差の合計はつねに0になるので、そのままでは散らばりを測れません。二乗してマイナスを消すことで、初めてばらつきを数値化できます。ただし二乗したため単位が元の二乗になる、という副作用が次の標準偏差につながります。
ワンポイントアドバイス
分散の式を覚えるときは、「偏差→二乗→平均」という3ステップの順番で覚えてみましょう。手順で覚えておくと、定義を問われても言葉で再現できます。実際に小さなデータで一度計算してみると、二乗する理由が腑に落ちます。
解説詳細
分散の定義と意味
分散は、各データの偏差(値 − 平均)を二乗し、それらを平均した値です。たとえば平均が4で値が2、4、6なら、偏差は−2、0、2、二乗すると4、0、4、平均して 8÷3≒2.67 が分散です。偏差を二乗することで符号が消え、平均から離れた値ほど大きく効くようになります。
他の選択肢がなぜ誤りか
Bの「最大値−最小値」は範囲の定義で、両端しか使わない別の指標です。Cの「並べた真ん中の値」は中央値であり代表値の一種です。Dの「すべてを合計した値」は単なる総和で、ばらつきとは無関係です。分散はあくまで「偏差の二乗の平均」であり、他とは仕組みが異なります。