EnsekiTT Blog

EnsekiTTが書くブログです。

Python+Pandasでリストワイズ削除とペアワイズ削除で欠損値に対処する話。

こんにちは、えんせきです。
最近目が痒くて仕方ありません。寒いらしいですが、雨が待ち遠しいです。
流石に週末に病院へ行って対処を考えることにしました。

つまりなにしたの?

リストワイズ削除とペアワイズ削除は最近は手軽ながらも機械学習だとあんまり使わない気がする欠損値に対する対処をPythonでやってみた。
f:id:ensekitt:20180308224738j:plain

続きを読む

データ分析における欠損値のパターンの話

こんにちは、えんせきです。
こないだ夜遅くにスマホの電池が切れた状態で自転車で走っていたら、品川で迷いました。
五反田方向に行きたかったのに、大崎で完全に間違った方向に向かって青物横丁を通って大井町に行ってしまってました。

つまりなにしたの?

欠損値にはパターンがあってそれによって対処も変わってくる。というわけで欠損値を自分で作ってみることにした。
欠損値のパターンについてはこれで勉強し直した。

村山 航「欠損データ分析 (missing data analysis) -完全情報最尤推定法と多重代入法-」
http://koumurayama.com/koujapanese/missing_data.pdf

f:id:ensekitt:20180304033809j:plain

続きを読む
クリエイティブ・コモンズ・ライセンス
この 作品 は クリエイティブ・コモンズ 表示 4.0 国際 ライセンスの下に提供されています。