pythonビギナーです。 テスト点数によるユーザのクラスタリングをしたいのですが、現在、同じユーザでも複数行にまたがっています。

ベストアンサー

1

1人がナイス!しています

言葉が足りず申し訳ありませんでした。 実際にはスーパーの購買データを用いてクラスタリングをする予定です。 なので、買った曜日(上記ですとテストを受けた日)が平日の月ー金であるか、休日の土日であるかはクラスラリングした後のユーザ属性に関わってくるかと思い、変数として入れたいと思っています。(平日に買う確率が高い場合、学生や主婦が考えられる、などといった分析ができるため) 質的変数ですが、LabelEncoderを使い、数値化して使う予定です。 何か、他にご指摘あれば教えていただければと思います・・・。