ここから本文です

解決済みの質問

知恵コレに追加する

標準偏差の意味がわかりません。 どのように見たらよいですか? 平均と標準偏差(σ...

mariitdlさん

標準偏差の意味がわかりません。
どのように見たらよいですか?
平均と標準偏差(σ)をエクセルで出した場合、データに対して
標準偏差の出た数値をどのように説明したらよいのでしょうか・・・?

  • アバター

違反報告

ベストアンサーに選ばれた回答

pistis_sophia_00さん

標準偏差は、データのばらつきを表す量です

多くのデータを処理する場合、たとえば、100人が受けた試験があった場合を考えます
全十問で、配点が各10点とします。

まず横軸を点数、縦軸をその点数を取った受験生の人数のグラフをイメージしてください

難しすぎず、易しすぎず、うまくできた試験なら、平均点が50点位になります。
さて、Aさんは60点を取りました。これはどれぐらいすごいでしょう?

たとえば、
0点:0人
10点:0人
20点:0人
30点0人
40点:1人
50点:98人
60点:1人
70点:0人
80点:0人
90点:0人
100点:0人
(これで、平均は50点になります)
のとき、60点の一人がAさんです。
これは、Aさんはトップなので、すごいですね。

ところが

0点:5人
10点:10人
20点:10人
30点:10人
40点:10人
50点:10人
60点:10人
70点:10人
80点:10人
90点:10人
100点:5人
(これも、平均は50点です)

この場合、60点を取ったAさんは、一応、平均点よりも上ですが、すごく優秀かというと、そうではないですね。
Aさんよりもいい点を取った人は35人もいます。

最初の例と、二番目の例で何が違うかというと、データのばらつきです。
最初の例は、データが平均の近くに集中しているので、平均から少しでもいい方にずれると、とても優秀な成績になります。
一方、二番目のデータは、非常にばらついているので、平均から少しいいぐらいでは、優秀とは言えません。

そんなわけで、ある一人の結果が、すごくいいのか、それほどでもないのかを評価する場合、平均よりいいか悪いかだけでは判断できないのです。
そんなときに出てくるのが標準偏差です。標準偏差はデータのばらつきを表すので、全体のデータの平均Xと標準偏差σの両方が分かっている場合、たとえ

X-2σ以下:すごく悪い
X-2σ<得点<X-σ:悪い
X-σ<得点<X+σ:普通
X+σ<得点<X+2σ:良い
X+2σ以上:すごく良い

というようにすると、平均点しか使わない場合よりは、だいぶ正しい評価ができるわけです。
たとえば、平均Xが50点、標準偏差σが8点なら、

X-2σ=34点以下:すごく悪い
X-2σ=34点<得点<X-σ=42点:悪い
X-σ=42点<得点<X+σ=58点:普
X+σ=58点<得点<X+2σ=66点:良い
X+2σ=66点以上:すごく良い

なので70点とれば「すごく良い」の評価ですが、平均Xが50点、標準偏差σが22点なら、

X-2σ=6点以下:すごく悪い
X-2σ=6点<得点<X-σ=28点:悪
X-σ=28点<得点<X+σ=72点:普
X+σ=72点<得点<X+2σ=94点:良い
X+2σ=94点以上:すごく良い

となるので、70点では普通という評価になってしまうわけです。

------------------------------
ちなみに、Excelの場合、標準偏差はSTDEVとSTDEVPという二つが用意されています。この区別は以下のようになります。

統計は、たくさんのデータを使うほど、結果が信用できます。
たとえば、ある町の成人男性の調査をしたい場合、本当なら、すべての成人男性を調査すべきですが、それはあまりに大変です。
そこで、普通は、手抜きして、100人位を調査して、もし全部の成人の調査ができたらどうなのかを推定します。

このとき、100人の調査で出した平均値は、全成人を調査した場合の平均値と、よく一致することがわかっています。
(むろん、これは確率論的な話で、いつも一致するわけではありませんが、よく一致する可能性が高いということです)

ところが、100人の調査で出した標準偏差は、全成人を調査した場合の標準偏差と、あまりよく一致しないのです。
全成人を調査した時の標準偏差とよく一致するのは、100人の調査データで計算した普遍標準偏差という量です。

Excelの場合。標準偏差はSTVEDP、普遍標準偏差がSTVEVとなっています
だから、調査対象が、ただしく全部把握できているなら、その全データを使ってSTDEVPで標準偏差を求めます。
調査対象が全部調査できなくて、少ないデータで手抜きして、全部使った場合の標準偏差を推定したいなら、少ないデータでSTVEVを計算して、その値を、手抜きしないで全部のデータを使った場合、こういう標準偏差になるだろう と予想して採用することになります。

  • アバター
  • 違反報告
  • 編集日時:2008/3/4 00:36:54
  • 回答日時:2008/3/4 00:30:43

質問した人からのコメント

  • 感謝とてもわかりやすく勉強になりました!!!
    ありがとうございました。
  • コメント日時:2008/3/4 08:28:52

アバター

この質問・回答は役に立ちましたか?
はい
いいえ

お役立ち度:お役立ち度 5点(5点満点中)16人中 15人が役に立つと評価しています。

ベストアンサー以外の回答

1件中11件)

 

katsuawa1234さん

読んで字の如く、標準(正規)分布からのズレ、偏り差(度合い)です。

分布を比較する場合、標準の分布になるものが、正規分布と呼ばれる、お馴染みのガウス分布で、自然現象の分布では、少数派なのにも関わらず、指数や対数関数等の道具立てが多く、用いると、線形近似でき、簡便なので、広く標準の分布として用いられている。

しかし、ガウス分布を用いるのに、厳密にいえば、分布対象物や事象が、あくまで同じ性質や、同じ試行、つまり繰り返しが可能であり、かつ、分布対象や試行回数や少なくとも、一万回以上可能である場合に限り、有効な比較を与える分布といえる。

そのようにガウス分布が、標準分布として成立する場合には、標準偏差は、標準分布から、バラつき度合(傾り差)を比較することが可能になる。

しかし、純粋に数学的線形分布が、有効な場合というのは、非常に限られた場合なので、そもそも数値的に分布の偏りを比較する意味合いが残され、将来の分布や事象に対して、どれぐらい有効であるかの意味づけ、哲学的考察が必要となる。

例えば、確率的に50%といえば、50%起こるとも起こらないともいえ、結局、わからないと同等になるだろう。たとえ、80%確定的といっても、20%の不確定性が残るのだから、これも、正規分布に沿う等の条件づけが厳密に可能でないかぎり、また同じくわからないことになる。

偏差がわかっても、所詮結果論で、現時点の分布でしかないわけで、確率的数値よりも、なぜ、分布に沿うのか等の疑問や、対象物や、その分布性質等の哲学的考察の方が、充分に必要となるべきであろう。

だから、何をいかに、どう分布をみ、偏りが生まれたかの哲学的考察を、具体的に語るべきである。

どのように数値化したのかが根本問題となるでしょう。

  • アバター