ここから本文です

データの標準化について質問があります。 機械学習での利用を念頭においた、z-sco...

hor********さん

2018/12/214:25:10

データの標準化について質問があります。
機械学習での利用を念頭においた、z-score normalisationを想定しています。

標準化する際、元のデータが正規分布に従っている必要はあるのでしょうか?

・標準正規化分布へ変換することを目的としていない
・値の単位や意味を揃えて比較することを目的としている
という場合に、正規分布を前提とする必要性が分からずにいます。

正規分布を前提とする記述がいくつかのサイトにあり、しかしその理由が分からずにいます。
https://bellcurve.jp/statistics/course/7801.html
http://st-hakky.hatenablog.com/entry/2017/12/11/200046

よろしくお願いします。

閲覧数:
33
回答数:
2
お礼:
100枚

違反報告

ベストアンサーに選ばれた回答

igu********さん

2018/12/422:57:33

先行回答にも通じる点ですが
>標準化する際、元のデータが正規分布に従っている
>必要はあるのでしょうか?

必要は無いのですが,非正規分布を標準化しても,非正規分布なので意味がない,ということなのです。

以前にも知恵袋で似たような質問がありましたが,では,意味がある標準化はどうするか,という問題に行き着きます。

意外と知られておらず,私の研究室へも問い合わせがあったので,統計解説ページに書きました。

ロバストzスコア:中央値と四分位数で,非正規分布,外れ値を含む標準化
https://biolab.sakura.ne.jp/robust-z-score.html

つまり,中央値と 四分位数を使った標準化もあるのです。

もし正規性に疑問があるデータの標準化ならば,こちらのほうが適切です。

この回答は投票によってベストアンサーに選ばれました!

ベストアンサー以外の回答

1〜1件/1件中

nas********さん

2018/12/214:46:30

そもそもが、標準正規分布への変換をするつもりが無いなら、正規化する必要が無いというか、してはいけないので、正規化することと矛盾するのですが。

あと、いわゆる正規化したデータをつくって終わりではなく、そのあと何らかのデータ処理をすると思いますが、正規化データを要求するデータ処理は、多くの場合、正規化されていないデータを放り込んだ場合、それらしい結果は得られると思いますが、得られた結果そのものが無意味であることもよくあります。

返信を取り消しますが
よろしいですか?

  • 取り消す
  • キャンセル

あわせて知りたい

みんなで作る知恵袋 悩みや疑問、なんでも気軽にきいちゃおう!

Q&Aをキーワードで検索:

Yahoo! JAPANは、回答に記載された内容の信ぴょう性、正確性を保証しておりません。
お客様自身の責任と判断で、ご利用ください。
本文はここまでです このページの先頭へ

「追加する」ボタンを押してください。

閉じる

※知恵コレクションに追加された質問は選択されたID/ニックネームのMy知恵袋で確認できます。

不適切な投稿でないことを報告しました。

閉じる