2022年11月20日日曜日

偏差値のトリビア

なんやかんやでもうすぐ2022年も終わり。年が明けると恒例の受験シーズンです。どこの高校は偏差値がいくつだ、どこの大学はいくつだと学生の頃に偏差値に悩まされた人はとても多いと思います。現在学生の方は、まさに今悩まされているかもしれません。

ここで突然ですが偏差値に関するトリビアというか小ネタを紹介。

“100人がテストを受けて「99人が0点で1人が100点だったとき」と「99人が99点で1人が100点だったとき」では、100点を取った人の偏差値はどちらも同じ

大差があっても拮抗していても偏差値が同じというのは奇妙に見えるかもしれませんが、数学的にはどちらも同じです。これが現実です

よくよく考えればスケールファクターが違うだけなので当たり前といえば当たり前なんですが、直感的には納得しづらい方もいるかもしれません。というわけで解説します。

解説

もっと一般化して、「\(a\)点を取った人が\(n_{a}\)人,\(b\)点を取った人が\(n_{b}\)人」という状況を考えてみましょう。ここで、\(n_{a}, n_{b} \geq 1\)とします。

偏差値を求める前に、下準備としていくつかの値を出していきます。文字が多くて難しそうに見えますが、やっていることは中学生〜高校生レベルの文字式です。確率・統計で習う偏差値の求め方をそのまま当てはめているだけなのでお前ならわかる

平均\(A\)

\begin{eqnarray*} A&=&\dfrac{n_{a}a+n_{b}b}{n_{a}+n_{b}} \end{eqnarray*}

\(a\)点を取った人の偏差\(D_{a}\)および\(b\)点を取った人の偏差\(D_{b}\)

\begin{eqnarray*} D_{a}&=&a-A \\ &=&a-\dfrac{n_{a}a+n_{b}b}{n_{a}+n_{b}} \\ &=&\dfrac{n_{b}}{n_{a}+n_{b}}\left(a-b\right) \end{eqnarray*} \begin{eqnarray*} D_{b}&=&b-A \\ &=&b-\dfrac{n_{a}a+n_{b}b}{n_{a}+n_{b}} \\ &=&-\dfrac{n_{a}}{n_{a}+n_{b}}\left(a-b\right) \end{eqnarray*}

分散\(V\)

\begin{eqnarray*} V&=&\dfrac{1}{n_{a}+n_{b}}\left(n_{a}D_{a}^{2}+n_{b}D_{b}^{2}\right) \\ &=&\dfrac{1}{n_{a}+n_{b}}\left(n_{a}\left(\dfrac{n_{b}}{n_{a}+n_{b}}\left(a-b\right)\right)^{2} + n_{b}\left(-\dfrac{n_{a}}{n_{a}+n_{b}}\left(a-b\right)\right)^{2}\right) \\ &=&\dfrac{1}{n_{a}+n_{b}}\left(\dfrac{n_{a}n_{b}^{2}}{\left(n_{a}+n_{b}\right)^{2}}\left(a-b\right)^{2} + \dfrac{n_{a}^{2}n_{b}}{\left(n_{a}+n_{b}\right)^{2}}\left(a-b\right)^{2}\right) \\ &=&\dfrac{n_{a}n_{b}}{\left(n_{a}+n_{b}\right)^{2}}\left(a-b\right)^{2} \end{eqnarray*}

標準偏差\(E\)

\begin{eqnarray*} E&=&\sqrt{V} \\ &=&\sqrt{\dfrac{n_{a}n_{b}}{\left(n_{a}+n_{b}\right)^{2}}\left(a-b\right)^{2}} \\ &=&\dfrac{\sqrt{n_{a}n_{b}}}{n_{a}+n_{b}}\left|a-b\right| \end{eqnarray*}

準備が整ったところで、いよいよ偏差値です。\(a\)点を取った人の偏差値\(T_{a}\)と\(b\)点を取った人の偏差値\(T_{b}\)は次のように求められます。

\begin{eqnarray*} T_{a}&=&10\dfrac{D_{a}}{E}+50\\ &=&10\dfrac{\dfrac{n_{b}}{n_{a}+n_{b}}\left(a-b\right)}{\dfrac{\sqrt{n_{a}n_{b}}}{n_{a}+n_{b}}\left|a-b\right|}+50 \\ &=&10\left(\dfrac{n_{b}\left(a-b\right)}{n_{a}+n_{b}} \cdot \dfrac{n_{a}+n_{b}}{\sqrt{n_{a}n_{b}}\left|a-b\right|}\right)+50 \\ &=& \begin{cases} 10\sqrt{\dfrac{n_{b}}{n_{a}}}+50 & (a \geq b) \\ -10\sqrt{\dfrac{n_{b}}{n_{a}}}+50 & (a < b) \end{cases} \end{eqnarray*} \begin{eqnarray*} T_{b}&=&10\dfrac{D_{b}}{E}+50\\ &=&10\dfrac{-\dfrac{n_{a}}{n_{a}+n_{b}}\left(a-b\right)}{\dfrac{\sqrt{n_{a}n_{b}}}{n_{a}+n_{b}}\left|a-b\right|}+50 \\ &=&10\left(-\dfrac{n_{a}\left(a-b\right)}{n_{a}+n_{b}} \cdot \dfrac{n_{a}+n_{b}}{\sqrt{n_{a}n_{b}}\left|a-b\right|}\right)+50 \\ &=& \begin{cases} -10\sqrt{\dfrac{n_{a}}{n_{b}}}+50 & (a \geq b) \\ 10\sqrt{\dfrac{n_{a}}{n_{b}}}+50 & (a < b) \end{cases} \end{eqnarray*}

というわけで、\(a, b\)がキレイさっぱり消滅してしまいました。

このことから、偏差値は得点人数と得点の大小関係によってのみ決定され、点数そのものは一切影響しないということがわかります。

冒頭の例では、0点が99人/100点が1人なので\(a=0, b=100, n_{a}=99, n_{b}=1\)です。\(a<b\)なので、100点を取った人の偏差値\(T_{b}\)を計算すると・・・

\begin{eqnarray*} T_{b}&=&10 \sqrt{\dfrac{n_{a}}{n_{b}}} + 50 \\ &=&10 \sqrt{\dfrac{99}{1}} + 50 \\ &\simeq&10 \times 9.94987437 + 50 \\ &=&149.4987437 \end{eqnarray*}

偏差値149というわけのわからない値が出てきました。偏差値は理論的には\(-\infty\)から\(+\infty\)までの値を取り得るということは習ったかと思いますが、とはいえ150近い偏差値を取ったことのある人はまずいないんじゃないでしょうか。

なお、今回の結論の「偏差値は得点人数と得点の大小関係によってのみ決定され、点数そのものは一切影響しない」というのは点数が2種類のみ、カッコよく言うとカーディナリティーが2の場合だけ成り立つ話であって、一般的には成り立たないのでご注意ください。

0 件のコメント:

コメントを投稿