EnsekiTT Blog

EnsekiTTが書くブログです。

Pandas

Pandas.Series.strの文字列処理を全部試した話

つまりなにしたの? Pandas.Series(Pandasの文字列が入った列データ)にはstrという文字列処理を行う関数群がある。 意外と数があってあまり把握できていなかったので、全部実行してみてすぐに思い出せるようにした。

PandasでHTMLのTableタグをひろってDataFrameに突っ込んだ話

つまりなにしたの? いままでそもそもRubyでスクレイピングしてCSVにしてから保存してたり、 BeautifulSoupでちまちまスクレイピングしてたけど、実はPandasでいきなりDataFrameに変換できるらしいので試してみた。

PandasのDataFrameでカテゴリを各カテゴリ毎のTrue/False列に展開した話

つまりなにしたの? PandasのDataFrameで 例えば 「曜日の入った列があった時に、月曜日フラグ列、火曜日フラグ列、…に展開する」 みたいなことをやった。 ユニークなパラメータごとにフラグ列を作るといえばいいのかな。 ベストプラクティスかはわからない…

他人のツイートに度し難いとか言ってたけど自分のツイートも度し難かった話

つまりなにしたの? Twitterには過去の自分のツイート全部ダウンロードする機能があるので、今後何か遊ぶときのためにダウンロードしてPandasでDataframeにしておいた。