EnsekiTT Blog

EnsekiTTが書くブログです。

前処理

PythonのPandasで外れ値を四分位範囲を用いてクリップする話

つまりなにしたの? pandasのデータフレームから1シリーズ(列)を入力すると外れ値をクリップして返してくれる関数を用意した。Irisのデータセットに外れ値を追加して実際に除去してみる例を紹介する。

機械学習の前処理でカテゴリデータをワンホット表現にする話

つまりなにしたの? カテゴリデータを説明変数に含むデータを機械学習に突っ込む時にはよくカテゴリデータをワンホット表現にすることが多い。 今回はそのワンホット表現を作る話。