EnsekiTT Blog

EnsekiTTが書くブログです。

前処理

外れ値はクリップではなく、 まずはリストアップしろって話

つまりなにしたの? まえに、外れ値をクリップする話をしたけど、いきなりクリップする前にリストアップすることにした。 どんな関数? - 入力: Pandas DataFrameのSeries、バイアス(1.5がデフォルト) - 出力: 外れ値判定されたものがTrueのSeries - 処理:…

PythonのPandasで外れ値を四分位範囲を用いてクリップする話

つまりなにしたの? pandasのデータフレームから1シリーズ(列)を入力すると外れ値をクリップして返してくれる関数を用意した。Irisのデータセットに外れ値を追加して実際に除去してみる例を紹介する。

機械学習の前処理でカテゴリデータをワンホット表現にする話

つまりなにしたの? カテゴリデータを説明変数に含むデータを機械学習に突っ込む時にはよくカテゴリデータをワンホット表現にすることが多い。 今回はそのワンホット表現を作る話。

スポンサーリンク