前処理
つまりなにしたの? まえに、外れ値をクリップする話をしたけど、いきなりクリップする前にリストアップすることにした。 どんな関数? - 入力: Pandas DataFrameのSeries、バイアス(1.5がデフォルト) - 出力: 外れ値判定されたものがTrueのSeries - 処理:…
つまりなにしたの? pandasのデータフレームから1シリーズ(列)を入力すると外れ値をクリップして返してくれる関数を用意した。Irisのデータセットに外れ値を追加して実際に除去してみる例を紹介する。
つまりなにしたの? カテゴリデータを説明変数に含むデータを機械学習に突っ込む時にはよくカテゴリデータをワンホット表現にすることが多い。 今回はそのワンホット表現を作る話。