解決済みの質問

標準偏差の意味がわかりません。
どのように見たらよいですか?
平均と標準偏差(σ...
mariitdlさん
標準偏差の意味がわかりません。
どのように見たらよいですか?
平均と標準偏差(σ)をエクセルで出した場合、データに対して
標準偏差の出た数値をどのように説明したらよいのでしょうか・・・?
違反報告
ベストアンサーに選ばれた回答
pistis_sophia_00さん
標準偏差は、データのばらつきを表す量です。
多くのデータを処理する場合、たとえば、100人が受けた試験があった場合を考えます。
全十問で、配点が各10点とします。
まず横軸を点数、縦軸をその点数を取った受験生の人数のグラフをイメージしてください。
難しすぎず、易しすぎず、うまくできた試験なら、平均点が50点位になります。
さて、Aさんは60点を取りました。これはどれぐらいすごいでしょう?
たとえば、
0点:0人
10点:0人
20点:0人
30点0人
40点:1人
50点:98人
60点:1人
70点:0人
80点:0人
90点:0人
100点:0人
(これで、平均は50点になります)
のとき、60点の一人がAさんです。
これは、Aさんはトップなので、すごいですね。
ところが
0点:5人
10点:10人
20点:10人
30点:10人
40点:10人
50点:10人
60点:10人
70点:10人
80点:10人
90点:10人
100点:5人
(これも、平均は50点です)
この場合、60点を取ったAさんは、一応、平均点よりも上ですが、すごく優秀かというと、そうではないですね。
Aさんよりもいい点を取った人は35人もいます。
最初の例と、二番目の例で何が違うかというと、データのばらつきです。
最初の例は、データが平均の近くに集中しているので、平均から少しでもいい方にずれると、とても優秀な成績になります。
一方、二番目のデータは、非常にばらついているので、平均から少しいいぐらいでは、優秀とは言えません。
そんなわけで、ある一人の結果が、すごくいいのか、それほどでもないのかを評価する場合、平均よりいいか悪いかだけでは判断できないのです。
そんなときに出てくるのが標準偏差です。標準偏差はデータのばらつきを表すので、全体のデータの平均Xと標準偏差σの両方が分かっている場合、たとえば
X-2σ以下:すごく悪い
X-2σ<得点<X-σ:悪い
X-σ<得点<X+σ:普通
X+σ<得点<X+2σ:良い
X+2σ以上:すごく良い
というようにすると、平均点しか使わない場合よりは、だいぶ正しい評価ができるわけです。
たとえば、平均Xが50点、標準偏差σが8点なら、
X-2σ=34点以下:すごく悪い
X-2σ=34点<得点<X-σ=42点:悪い
X-σ=42点<得点<X+σ=58点:普通
X+σ=58点<得点<X+2σ=66点:良い
X+2σ=66点以上:すごく良い
なので70点とれば「すごく良い」の評価ですが、平均Xが50点、標準偏差σが22点なら、
X-2σ=6点以下:すごく悪い
X-2σ=6点<得点<X-σ=28点:悪い
X-σ=28点<得点<X+σ=72点:普通
X+σ=72点<得点<X+2σ=94点:良い
X+2σ=94点以上:すごく良い
となるので、70点では普通という評価になってしまうわけです。
------------------------------
ちなみに、Excelの場合、標準偏差はSTDEVとSTDEVPという二つが用意されています。この区別は以下のようになります。
統計は、たくさんのデータを使うほど、結果が信用できます。
たとえば、ある町の成人男性の調査をしたい場合、本当なら、すべての成人男性を調査すべきですが、それはあまりに大変です。
そこで、普通は、手抜きして、100人位を調査して、もし全部の成人の調査ができたらどうなのかを推定します。
このとき、100人の調査で出した平均値は、全成人を調査した場合の平均値と、よく一致することがわかっています。
(むろん、これは確率論的な話で、いつも一致するわけではありませんが、よく一致する可能性が高いということです)
ところが、100人の調査で出した標準偏差は、全成人を調査した場合の標準偏差と、あまりよく一致しないのです。
全成人を調査した時の標準偏差とよく一致するのは、100人の調査データで計算した普遍標準偏差という量です。
Excelの場合。標準偏差はSTVEDP、普遍標準偏差がSTVEVとなっています。
だから、調査対象が、ただしく全部把握できているなら、その全データを使ってSTDEVPで標準偏差を求めます。
調査対象が全部調査できなくて、少ないデータで手抜きして、全部使った場合の標準偏差を推定したいなら、少ないデータでSTVEVを計算して、その値を、手抜きしないで全部のデータを使った場合、こういう標準偏差になるだろう と予想して採用することになります。
-
- この質問・回答は役に立ちましたか?
- はい
- いいえ
お役立ち度:
16人中 15人が役に立つと評価しています。
ベストアンサー以外の回答
- (1件中1〜1件)
katsuawa1234さん
読んで字の如く、標準(正規)分布からのズレ、偏り差(度合い)です。
分布を比較する場合、標準の分布になるものが、正規分布と呼ばれる、お馴染みのガウス分布で、自然現象の分布では、少数派なのにも関わらず、指数や対数関数等の道具立てが多く、用いると、線形近似でき、簡便なので、広く標準の分布として用いられている。
しかし、ガウス分布を用いるのに、厳密にいえば、分布対象物や事象が、あくまで同じ性質や、同じ試行、つまり繰り返しが可能であり、かつ、分布対象や試行回数や少なくとも、一万回以上可能である場合に限り、有効な比較を与える分布といえる。
そのようにガウス分布が、標準分布として成立する場合には、標準偏差は、標準分布から、バラつき度合(傾り差)を比較することが可能になる。
しかし、純粋に数学的線形分布が、有効な場合というのは、非常に限られた場合なので、そもそも数値的に分布の偏りを比較する意味合いが残され、将来の分布や事象に対して、どれぐらい有効であるかの意味づけ、哲学的考察が必要となる。
例えば、確率的に50%といえば、50%起こるとも起こらないともいえ、結局、わからないと同等になるだろう。たとえ、80%確定的といっても、20%の不確定性が残るのだから、これも、正規分布に沿う等の条件づけが厳密に可能でないかぎり、また同じくわからないことになる。
偏差がわかっても、所詮結果論で、現時点の分布でしかないわけで、確率的数値よりも、なぜ、分布に沿うのか等の疑問や、対象物や、その分布性質等の哲学的考察の方が、充分に必要となるべきであろう。
だから、何をいかに、どう分布をみ、偏りが生まれたかの哲学的考察を、具体的に語るべきである。
どのように数値化したのかが根本問題となるでしょう。
質問した人からのコメント
ありがとうございまし