ここから本文です

統計学の問題です。 「標準化した値は、平均値がゼロ、分散が1になる」 このこ...

osr********さん

2009/8/601:00:51

統計学の問題です。
「標準化した値は、平均値がゼロ、分散が1になる」
このことについて証明できる方お願いします。

閲覧数:
44,329
回答数:
1
お礼:
100枚

違反報告

ベストアンサーに選ばれた回答

kil********さん

編集あり2009/8/1202:06:08

よくある誤解なのですが、理屈の順序が逆なんです。
証明とかする類のものではありません。

「標準化した値は、平均値がゼロ、分散(と標準偏差)が1になる」
が先にあるのではありません。

「平均値が0に、分散(と標準偏差)が1になるように、データを変換する作業」
のことを標準化と呼ぶのです。


* 修正
すいません…元々画像を用いていたのですが、
回答を編集したら、画像に不具合が生じました…。
表示されたりされなかったりするので、文章だけで書きなおします。
もし画像が表示されていても、無視してやってください。

例えば、「3、4、5」というn=3のデータがあったとします。
この3つの平均は4で、標準偏差は約0.816になります。

ここで、以下の2つの作業をすると標準化したことになります。

①全てのデータから平均値の値を引く
「3、4、5」のそれぞれから平均値である4を引くと
「-1、0、1」になりますよね。
この3つの平均は、(-1+0+1)÷3=0と、0になります。
まずこれで平均は0になりました。
これは、証明するまでもない事柄です。


②全てのデータを標準偏差で割る
「-1、0、1」のそれぞれを標準偏差0.816で割ると
「-1.22、0、1.22」になります(1.22はおよその数ですが)。
この状態で、標準偏差を算出すると、ほぼ1に近い値が得られます。
(小数点以下を切り捨てた数値で計算しているので、
ピッタリ1にはなりません)

この2ステップの作業を、「標準化」と呼びます。



◆ なぜデータをもとの標準偏差で割ると、標準偏差が1になるか?
ちょっとややこしいですがお付き合いください。
また、一行で数式を表わすと中々見づらいので、
是非お手元で書きながらご確認ください。

標準偏差sの算出式は以下の通りです。
(教科書等でご存知だと思いますが)

s=√((Σ(x-m)^2)/n)

xは各データの値、mは平均値、nはデータ数です。
「^2」とは2乗を意味します。


①が終わった段階では、平均値mは0ですので、
①が終わった段階でのsの算出式は

s=√((Σx^2)/n)と表せます。…式A


ここで、全てのデータに対して、定数aをかけると、
標準偏差はどう変化するでしょうか。
標準偏差の算出式は以下のようになります。
→√((Σ(a*x)^2)/n)

これを変換すると
→√((Σ(a^2)*(x^2)/n)

∑の中の係数は、∑の前に出すことができるので
→√((a^2)*(Σx^2)/n)

さらに、a^2だけルートを外してやると、
→a√(Σ(x^2)/n)となります。

ここで、式Aより、「s=√((Σx^2)/n)」ですので、代入してやると
→「a*s」となります。

このように、全てのデータに定数aをかけると、
標準偏差はもとのa倍になるという性質があります。

従って、全てのデータをもとの標準偏差sで割ると、
(つまり、1/sをかけると)
標準偏差も1/s倍になります。

s*(1/s)=1ですので、全てのデータを
もとの標準偏差sで割ると、標準偏差は1となる訳です。

よくある誤解なのですが、理屈の順序が逆なんです。
証明とかする類のものではありません。...

この回答は投票によってベストアンサーに選ばれました!

あわせて知りたい

この質問につけられたタグ

みんなで作る知恵袋 悩みや疑問、なんでも気軽にきいちゃおう!

Q&Aをキーワードで検索:

Yahoo! JAPANは、回答に記載された内容の信ぴょう性、正確性を保証しておりません。
お客様自身の責任と判断で、ご利用ください。
本文はここまでです このページの先頭へ

「追加する」ボタンを押してください。

閉じる

※知恵コレクションに追加された質問は選択されたID/ニックネームのMy知恵袋で確認できます。

不適切な投稿でないことを報告しました。

閉じる