2017-10-01から1ヶ月間の記事一覧
つまりなにしたの? 家でCSVのデータを扱ってたけど、サンプリングに疲弊したのでPostgreSQLをローカル環境にインストールして 持ってるデータセットを移そうと思った話。
つまりなにしたの? 友人の会社の勉強会にお邪魔して音声生成するために必要なことを勉強しつつ、 DeepNeuralNetworkを無理やり適用する方法を提案してみた。 でも、まだ計算が終わっていないし、なんなら収束しなさそう()
つまりなにしたの? 音声データをSTFTして、スペクトログラムを用意してそのスペクトログラムからまた音声データに戻せるのか確認してみた。 一旦スペクトログラムにすればCNNとかと相性が良いから面白いかもなーと試してみた。
つまりなにしたの? Twitterには過去の自分のツイート全部ダウンロードする機能があるので、今後何か遊ぶときのためにダウンロードしてPandasでDataframeにしておいた。
つまりなにしたの? 台風の中、予定よりも4時間遅れてアキバに降り立ったえんせきはマイクロサービス系のネタを探しに行った話。 初参加なので雰囲気見ながらフラフラしてていっぱい試し読みさせていただきました。ありがとうございました。
つまりなにしたの? JUMAN++でMeCabの分かちオプションと同じ結果を出せるスクリプトを用意して、前回と同じように単語間の演算をやってみようと思ったもののまじで終わらない。 今度はナウい単語も使えるはずだぞ!という期待を胸にただひたすら待っている。
つまりなにしたの? 今までもJUMAN++をPyKNPから呼び出してで遊んでる時にValueErrorが出ていて、禁止文字をいっぱい増やしたらとりあえず回避できていた。 今回Word2vecで遊ぶにあたって禁止文字だらけでも困ってしまうのでその原因を調査し、対策を行った…
つまりなにしたの? WikipediaのXMLデータをこないだクリーニングしたのでMeCabで分かち書きにしてWord2Vecを学習してみた。 前回 ensekitt.hatenablog.com をやったので、このデータを使いたい。
つまりなにしたの? Wikipediaの日本語データを使って学習してる論文を見かけたのでどうやって使える状態にしてるのか調べてみた。 もちろん、本当に今回やった方法でやったのかを論文の筆者に確かめたわけではない。 概ね近い結果が得られる程度にはクリー…
つまりなにしたの? 先日やったツイッタラーのツイートからエンジニア:非エンジニアを分類する要素は何なのか決定木に判別してもらう。のMeCabによる形態素解析だとツイッタラーの度し難い日本語に歯が立たなかったのでJUMAN++に切り替えてやってみた。 こ…
つまりなにしたの? OSXでJuman++をPythonから呼び出せるようになるまでの手順とつまりどころ(昨年くらいのブログ記事だとだいたい引っかかるっぽい。)の解決方法。 この解決方法はGithubにすでにプルリクエストが飛んでるけどマージされてないみたいなの…
つまりなにしたの? 前回、「おっぱい」とつぶやいていたら本当にエンジニアなのか決定木に確かめてもらった話の準備をした。 一通りできたので実際にやってみたらエンジニアは「好き」をよく表明しているのかもしれない。みたいな知見が得られた。 もちろん…
つまりなにしたの? Twitterのリストを2種類突っ込むと直近のツイートを引っ張ってきて、形態素解析から名詞を抽出して、2種類のリストを分類できる決定木を作ってみた。 *1 *1:unsplash.com
つまりなにしたの? TensorFlowのModelsにあるResNetを学習できたので学習した分類器をFlaskに組み込んでWebサービスっぽくした。 追記 2017年10月5日 2時00分: 公開しようと思ったけど思った以上にリソースを食うのとセキュリティとかガバガバなのでコード…
1日目はなにしたの? データのアルゴリズムとロジスティクスの話をまとめて、 Resnetのロジスティクスを読み解き、データセットの準備の部分まで到達した。 ensekitt.hatenablog.com 2日目はなにしたの? Resnetの学習部分のロジスティクスを読み解き、Resne…