EnsekiTT Blog

EnsekiTTが書くブログです。

MacでAmazon Musicを流しながら眠る時に、1時間後にPCをスリープさせている話

つまりなにしたの? Macで1時間後にPCをスリープさせる時に使うコマンドをなんか2回調べた気がしたので、aliasを作って簡単に実行できるようにして、ブログにも書くことにした。

Caffe Model ZooのモデルをChainerで読み込んで実行した話

つまりなにしたの? Caffe model zooのモデルを拾ってきてChainerで使ってみることにしたけど、 とりあえず読み込むところと使うところは出来たっぽいので一旦記事にした。

Jupyter Notebookでセルの実行時間をはかるなら%%timeを使おうって話

つまりなにしたの? まだ start = time.time() # 計測したい処理 e_time = time.time() - start print ("e_time:{0}".format(e_time) + "[s]") で消耗してるの?ってことでずっと消耗してたのでJupyter(Ipython)らしい方法を使うようにした話。

僕がJupyter Notebookを使うとき必ず入れているVariable Inspectorの話

つまりなにしたの? Jupyter Notebookを導入した時、真っ先にいれるExtensionsの一つ、Variable Inspectorを紹介する

JupyterLabだとtqdm_notebookはもちろんだが、tqdmも使えず解決できなかった話。

つまりなにしたの? JupyterLabに移行して意気揚々とちょっと長めのループを回そうと思ってtqdmでプログレスバーを表示したらダメだった。

Jupyter NotebookからJupyter Labに移行した話

つまりなにしたの? Jupyter Notebookをずっと使っていたけどJupyter Labが素晴らしいと聞いて乗り換えた。

ChainerのExtensionを作って途中経過をツイートするようにした話。

つまりなにしたの? 学習している間、自宅にいるとは限らないので途中経過を適宜ツイート(なんかしらのAPIたたいてレポート飛ばしたい)したいって 思ったのでExtensionを作ってみた。

CIFAR10を混ぜたままChainerのDCGANに突っ込んだら名状しがたい何かが生成された話

つまりなにしたの? 前回、モノクロ画像(MNIST)をDCGANで学習させたし、今度はカラー画像をやろうと思ってCIFAR10を学習させた。 ただ、飛行機と自動車と鳥と猫と鹿と犬とカエルと馬と船とトラックを混ぜたまま入れたせいか、生成されたものはクリーチャー…

PandasでHTMLのTableタグをひろってDataFrameに突っ込んだ話

つまりなにしたの? いままでそもそもRubyでスクレイピングしてCSVにしてから保存してたり、 BeautifulSoupでちまちまスクレイピングしてたけど、実はPandasでいきなりDataFrameに変換できるらしいので試してみた。

PandasのDataFrameでカテゴリを各カテゴリ毎のTrue/False列に展開した話

つまりなにしたの? PandasのDataFrameで 例えば 「曜日の入った列があった時に、月曜日フラグ列、火曜日フラグ列、…に展開する」 みたいなことをやった。 ユニークなパラメータごとにフラグ列を作るといえばいいのかな。 ベストプラクティスかはわからない…

DCGANをChainerのTrainerで学習して100連MNISTガチャを回した話

つまりなにしたの? 高解像度GANができるようになったという話をきいたけど基礎が抜けてるのでDCGANをChainerのTrainerを使って作ってみた。 作ってる途中で公式がDCGANのTrainer使った実装を公開していることを知るものの写経も辞さない構えで作った。

CSVに疲弊したのでPostgreSQLをインストールした話

つまりなにしたの? 家でCSVのデータを扱ってたけど、サンプリングに疲弊したのでPostgreSQLをローカル環境にインストールして 持ってるデータセットを移そうと思った話。

音声生成のHMMの代わりにDeepLearningを適用してみようとしてる話(計算中)

つまりなにしたの? 友人の会社の勉強会にお邪魔して音声生成するために必要なことを勉強しつつ、 DeepNeuralNetworkを無理やり適用する方法を提案してみた。 でも、まだ計算が終わっていないし、なんなら収束しなさそう()

STFT→iSTFTでちゃんと音がもとに戻るのか確認してみた話

つまりなにしたの? 音声データをSTFTして、スペクトログラムを用意してそのスペクトログラムからまた音声データに戻せるのか確認してみた。 一旦スペクトログラムにすればCNNとかと相性が良いから面白いかもなーと試してみた。

他人のツイートに度し難いとか言ってたけど自分のツイートも度し難かった話

つまりなにしたの? Twitterには過去の自分のツイート全部ダウンロードする機能があるので、今後何か遊ぶときのためにダウンロードしてPandasでDataframeにしておいた。

結果的に嵐を呼ぶ形になった技術書典3に行ってきて思わぬ掘り出し物を見つけた話

つまりなにしたの? 台風の中、予定よりも4時間遅れてアキバに降り立ったえんせきはマイクロサービス系のネタを探しに行った話。 初参加なので雰囲気見ながらフラフラしてていっぱい試し読みさせていただきました。ありがとうございました。

JUMAN++による分かち書きがハイパー時間かかってる話

つまりなにしたの? JUMAN++でMeCabの分かちオプションと同じ結果を出せるスクリプトを用意して、前回と同じように単語間の演算をやってみようと思ったもののまじで終わらない。 今度はナウい単語も使えるはずだぞ!という期待を胸にただひたすら待っている。

JUMAN++で遊んでる時にValueErrorが出ちゃう原因と対策の話

つまりなにしたの? 今までもJUMAN++をPyKNPから呼び出してで遊んでる時にValueErrorが出ていて、禁止文字をいっぱい増やしたらとりあえず回避できていた。 今回Word2vecで遊ぶにあたって禁止文字だらけでも困ってしまうのでその原因を調査し、対策を行った…

先月のWikipediaをWord2Vecに突っ込んで単語を加算減算して遊んでみた話

つまりなにしたの? WikipediaのXMLデータをこないだクリーニングしたのでMeCabで分かち書きにしてWord2Vecを学習してみた。 前回 ensekitt.hatenablog.com をやったので、このデータを使いたい。

Wikipediaのデータを使いましたって書いてある論文は実際どうやって使える状態にしてるのか調べた話

つまりなにしたの? Wikipediaの日本語データを使って学習してる論文を見かけたのでどうやって使える状態にしてるのか調べてみた。 もちろん、本当に今回やった方法でやったのかを論文の筆者に確かめたわけではない。 概ね近い結果が得られる程度にはクリー…

ツイッタラーの日本語に対してマシな結果が出るかと思ってJUMAN++を試したら興味深い違いが出た話

つまりなにしたの? 先日やったツイッタラーのツイートからエンジニア:非エンジニアを分類する要素は何なのか決定木に判別してもらう。のMeCabによる形態素解析だとツイッタラーの度し難い日本語に歯が立たなかったのでJUMAN++に切り替えてやってみた。 こ…

Juman++を試そうと思ったら詰まったので解決方法を模索した話

つまりなにしたの? OSXでJuman++をPythonから呼び出せるようになるまでの手順とつまりどころ(昨年くらいのブログ記事だとだいたい引っかかるっぽい。)の解決方法。 この解決方法はGithubにすでにプルリクエストが飛んでるけどマージされてないみたいなの…

形態素解析曰くツイッタラーの日本語は度し難く、決定木曰くエンジニアは「好き」って表明をあんまりしないらしい話

つまりなにしたの? 前回、「おっぱい」とつぶやいていたら本当にエンジニアなのか決定木に確かめてもらった話の準備をした。 一通りできたので実際にやってみたらエンジニアは「好き」をよく表明しているのかもしれない。みたいな知見が得られた。 もちろん…

「おっぱい」とつぶやいていたら本当にエンジニアなのか決定木に確かめてもらった話(準備編)

つまりなにしたの? Twitterのリストを2種類突っ込むと直近のツイートを引っ張ってきて、形態素解析から名詞を抽出して、2種類のリストを分類できる決定木を作ってみた。 *1 *1:unsplash.com

学習しても予測に使わなきゃ電気代の無駄なんだよ!ってことでTensorFlowのResNetをFlask使ってWebサービスっぽくする話

つまりなにしたの? TensorFlowのModelsにあるResNetを学習できたので学習した分類器をFlaskに組み込んでWebサービスっぽくした。 追記 2017年10月5日 2時00分: 公開しようと思ったけど思った以上にリソースを食うのとセキュリティとかガバガバなのでコード…

機械学習とかのアルゴリズムとデータのロジスティクスの話。3日目(tf.Estimatorのオレオレ解釈訳を添えて)

1日目はなにしたの? データのアルゴリズムとロジスティクスの話をまとめて、 Resnetのロジスティクスを読み解き、データセットの準備の部分まで到達した。 ensekitt.hatenablog.com 2日目はなにしたの? Resnetの学習部分のロジスティクスを読み解き、Resne…

機械学習とかのアルゴリズムとデータのロジスティクスの話。2日目

1日目はなにしたの? データのアルゴリズムとロジスティクスの話をまとめて、 Resnetのロジスティクスを読み解き、データセットの準備の部分まで到達した。 ensekitt.hatenablog.com つまりなにしたの? Resnetのロジスティクス(学習部分)を読み解き、Resn…

機械学習とかDeepLearningのデータのアルゴリズムとロジスティクスの話。

つまりなにしたの? 友達と話したアルゴリズムとデータ自体のロジスティクスの話をまとめておこうと思って書いた。 *1 *1:Photo by unsplash.com

近いうちに使うことになりそうなのでBazelのインストールしてみた話

つまりなにしたの? 諸事情でBazelを使ったほうが便利なことがありそうなのでBazelをUbuntu16.04にインストールしてみた。

「おっ、それDeepLearningでやればいいじゃん!」と言いつつ設備の稟議が通らない会社に現実をつきつける話。

つまりなにしたの? ぶかぴっぴ「ネットの記事で見たんですけど、こんなCPUだけのじゃDeepLearningなんてむりっすよ〜」 じょうぴっぴ「それは大変だ!承認印どーん!」 ってなるためのネットの記事を作ろうと思った。