EnsekiTT Blog

EnsekiTTが書くブログです。

Python

Chainerで転移学習するときに、新たなデータで既に学習済のところを変更されないように固定する話

つまりなにしたの? 転移学習をすすめるにあたって、最後の層だけ学習して、それ以外の層はそのままにしたい。 1つの手としては、 model(inputs={'data': X}, outputs=['loss3/classifier']) のoutputsを最終層の手前までにして事前にデータを変換してからそ…

Pythonで機械学習をやった時にその予測結果を評価する誤差関数の話

つまりなにしたの? 機械学習だディープラーニングだっ!と予測アルゴリズムを弄くりまわしたくなる気持ちをぐっと抑えて、 構築したアルゴリズムの予測結果を評価するための誤差(Error)の話。 ってことでデータ解析のコンテストとかでもよく使う誤差とその…

Chainerで転移学習できるように重みやバイアスのコピーを1層ずつやってみた話

つまりなにしたの? Caffe model zooのモデルを読み込んで使えるようにはなった。 転移学習のようなことをしようと思ったけど、モデルを好き放題付け替えてみたいと思った時に 自動的にやるスクリプトはちょっと自動過ぎて楽しめないので丁寧に重みとバイア…

犬をモスクと間違えるのは無理があるのでは?と思い、画像の前処理を見直したら間違っていた話

つまりなにしたの? ensekitt.hatenablog.com いくらなんでも、この可愛いイッヌをみてモスクはないだろ?って思ってたんだけど、昨日まで出張で手が回らなかったので、 画像の前処理を今日確認したら、案の定間違っていた話。元記事にも訂正入れます。

Caffe Model ZooのモデルをChainerで読み込んで実行した話

つまりなにしたの? Caffe model zooのモデルを拾ってきてChainerで使ってみることにしたけど、 とりあえず読み込むところと使うところは出来たっぽいので一旦記事にした。 2017年11月23日追記: 画像の前処理を失敗していました。 ensekitt.hatenablog.com

ChainerのExtensionを作って途中経過をツイートするようにした話。

つまりなにしたの? 学習している間、自宅にいるとは限らないので途中経過を適宜ツイート(なんかしらのAPIたたいてレポート飛ばしたい)したいって 思ったのでExtensionを作ってみた。

CIFAR10を混ぜたままChainerのDCGANに突っ込んだら名状しがたい何かが生成された話

つまりなにしたの? 前回、モノクロ画像(MNIST)をDCGANで学習させたし、今度はカラー画像をやろうと思ってCIFAR10を学習させた。 ただ、飛行機と自動車と鳥と猫と鹿と犬とカエルと馬と船とトラックを混ぜたまま入れたせいか、生成されたものはクリーチャー…

PandasでHTMLのTableタグをひろってDataFrameに突っ込んだ話

つまりなにしたの? いままでそもそもRubyでスクレイピングしてCSVにしてから保存してたり、 BeautifulSoupでちまちまスクレイピングしてたけど、実はPandasでいきなりDataFrameに変換できるらしいので試してみた。

PandasのDataFrameでカテゴリを各カテゴリ毎のTrue/False列に展開した話

つまりなにしたの? PandasのDataFrameで 例えば 「曜日の入った列があった時に、月曜日フラグ列、火曜日フラグ列、…に展開する」 みたいなことをやった。 ユニークなパラメータごとにフラグ列を作るといえばいいのかな。 ベストプラクティスかはわからない…

DCGANをChainerのTrainerで学習して100連MNISTガチャを回した話

つまりなにしたの? 高解像度GANができるようになったという話をきいたけど基礎が抜けてるのでDCGANをChainerのTrainerを使って作ってみた。 作ってる途中で公式がDCGANのTrainer使った実装を公開していることを知るものの写経も辞さない構えで作った。

音声生成のHMMの代わりにDeepLearningを適用してみようとしてる話(計算中)

つまりなにしたの? 友人の会社の勉強会にお邪魔して音声生成するために必要なことを勉強しつつ、 DeepNeuralNetworkを無理やり適用する方法を提案してみた。 でも、まだ計算が終わっていないし、なんなら収束しなさそう()

STFT→iSTFTでちゃんと音がもとに戻るのか確認してみた話

つまりなにしたの? 音声データをSTFTして、スペクトログラムを用意してそのスペクトログラムからまた音声データに戻せるのか確認してみた。 一旦スペクトログラムにすればCNNとかと相性が良いから面白いかもなーと試してみた。

他人のツイートに度し難いとか言ってたけど自分のツイートも度し難かった話

つまりなにしたの? Twitterには過去の自分のツイート全部ダウンロードする機能があるので、今後何か遊ぶときのためにダウンロードしてPandasでDataframeにしておいた。

JUMAN++による分かち書きがハイパー時間かかってる話

つまりなにしたの? JUMAN++でMeCabの分かちオプションと同じ結果を出せるスクリプトを用意して、前回と同じように単語間の演算をやってみようと思ったもののまじで終わらない。 今度はナウい単語も使えるはずだぞ!という期待を胸にただひたすら待っている。

OSXでvirtualenv と matplotlibを共存させようとして詰まった。

環境: OS X El Capptan MacBook Pro(Retina, 13-inch, Early 2013) Virtualenvで環境を用意して、pip install matplotlib入れて、 import matplotlib.pyplot as plt plt.plot([1,2,3,4]) plt.show() したら、 RuntimeError: Python is not installed as a fr…

Pythonでちょっと重いループをするときの一工夫

Pythonでループの進行具合を頑張って出してた頃の自分へ https://github.com/noamraph/tqdm を使おう。 こうなる

PyAudio が Virtualenv上でインストール出来ない時に

まずは portaudio がインストールされていることを確認して、されていなかったらインストール brew install portaudio MacPortsでも大丈夫だけどbrewは私の趣味。 次にPortAudioがどこにインストールされたのか探す。 特に設定していなければ /usr/local/Cel…

FreeBSDにpythonを入れる。

入れるだけ。 $ pkg_add -r python おわり。 あっけなく終わってしまいました。

クリエイティブ・コモンズ・ライセンス
この 作品 は クリエイティブ・コモンズ 表示 4.0 国際 ライセンスの下に提供されています。