数Ⅰでデータの分析を習うと、平均のほかに「分散」という単語が出てきます。教科書には分散の式は○○のように載っているため、式の意味を細かく考えていない人もいるのではないでしょうか。今回はその「分散」がどのような値で何を意味するのかを細かく扱っていきます。
ではここで、以下のAクラスとBクラスの数学のテストの結果を見比べてみましょう。A組とB組ではどんな違いがあるか説明してみてください。
出席番号 | A組(数学の点数) | B組(数学の点数) |
1 | 81点 | 100点 |
2 | 75点 | 100点 |
3 | 69点 | 50点 |
4 | – | 50点 |
A組とB組では平均点はどちらも75点です。しかし、A組はみんな平均的に同じような点数が取れている一方で、B組は上位層と下位層とで点数差が開いてしまっているという違いがあります。このように、平均点だけでは一見同じように見える両クラスですが、それぞれ特徴があるのです。この特徴はまさに点数のばらつきで説明ができます。そうです、この「ばらつき」こそが分散の正体なのです。
ではこの「ばらつき」を定量的に評価する方法について考えていきましょう。
まず最初に思い浮かぶのは各生徒の点数の平均との差です。A組ではその差はそれぞれ6点,0点,6点です。つまり1人あたり平均で4点平均点から離れています。B組はどの生徒も平均から25点離れているので、1人あたり平均で25点平均点から離れています。つまり、平均点から平均的に離れた点数を取っているB組のほうがクラス内のばらつきが大きいと言うことができます。
この「ばらつき」の導出方法は一番理解しやすいものだと思いますが、実は分散はこの値ではないのです。いま求めた「ばらつき」の値は絶対平均誤差と言われ、高校数学では習わないのです。
なぜ直感的に最もわかりやすい絶対平均誤差が高校数学で扱われないかというと、式にすると計算が複雑になってしまうからです。「平均との差」は計算に絶対値が含まれるため、数学的な式変形を困難にします。そこで、強引ですが計算を楽にするために用いられるのが「2乗する」という技です。ご存じの通り、2乗をすれば正の値も負の値も正の値になってしまうのです。
実際に計算をするとA組の生徒は平均点との差がそれぞれ6点,0点,6点のため2乗すると、36,0,36です。つまり、1人あたり平均で24のばらつきがあります。ここで注意してほしいのは単位は「点」ではないのです。なぜなら点数を2乗しているからです。この24というのが分散です。B組も同様に計算すると1人あたり平均で625のばらつきがあるため、分散は625です。この計算結果からA組とB組の分散を比較してB組のほうがばらつきが大きい(学力差がある)ことがわかります。
「分散」は「ばらつき」を表す指標
数字が大きいほどばらつきが大きい
複数のデータセットを比較することに意味がある
分散=(平均との点数差の2乗)の1人あたりの平均
コメント