EnsekiTT Blog

EnsekiTTが書くブログです。

2017-10-01から1ヶ月間の記事一覧

CSVに疲弊したのでPostgreSQLをインストールした話

つまりなにしたの? 家でCSVのデータを扱ってたけど、サンプリングに疲弊したのでPostgreSQLをローカル環境にインストールして 持ってるデータセットを移そうと思った話。

音声生成のHMMの代わりにDeepLearningを適用してみようとしてる話(計算中)

つまりなにしたの? 友人の会社の勉強会にお邪魔して音声生成するために必要なことを勉強しつつ、 DeepNeuralNetworkを無理やり適用する方法を提案してみた。 でも、まだ計算が終わっていないし、なんなら収束しなさそう()

STFT→iSTFTでちゃんと音がもとに戻るのか確認してみた話

つまりなにしたの? 音声データをSTFTして、スペクトログラムを用意してそのスペクトログラムからまた音声データに戻せるのか確認してみた。 一旦スペクトログラムにすればCNNとかと相性が良いから面白いかもなーと試してみた。

他人のツイートに度し難いとか言ってたけど自分のツイートも度し難かった話

つまりなにしたの? Twitterには過去の自分のツイート全部ダウンロードする機能があるので、今後何か遊ぶときのためにダウンロードしてPandasでDataframeにしておいた。

結果的に嵐を呼ぶ形になった技術書典3に行ってきて思わぬ掘り出し物を見つけた話

つまりなにしたの? 台風の中、予定よりも4時間遅れてアキバに降り立ったえんせきはマイクロサービス系のネタを探しに行った話。 初参加なので雰囲気見ながらフラフラしてていっぱい試し読みさせていただきました。ありがとうございました。

JUMAN++による分かち書きがハイパー時間かかってる話

つまりなにしたの? JUMAN++でMeCabの分かちオプションと同じ結果を出せるスクリプトを用意して、前回と同じように単語間の演算をやってみようと思ったもののまじで終わらない。 今度はナウい単語も使えるはずだぞ!という期待を胸にただひたすら待っている。

JUMAN++で遊んでる時にValueErrorが出ちゃう原因と対策の話

つまりなにしたの? 今までもJUMAN++をPyKNPから呼び出してで遊んでる時にValueErrorが出ていて、禁止文字をいっぱい増やしたらとりあえず回避できていた。 今回Word2vecで遊ぶにあたって禁止文字だらけでも困ってしまうのでその原因を調査し、対策を行った…

先月のWikipediaをWord2Vecに突っ込んで単語を加算減算して遊んでみた話

つまりなにしたの? WikipediaのXMLデータをこないだクリーニングしたのでMeCabで分かち書きにしてWord2Vecを学習してみた。 前回 ensekitt.hatenablog.com をやったので、このデータを使いたい。

Wikipediaのデータを使いましたって書いてある論文は実際どうやって使える状態にしてるのか調べた話

つまりなにしたの? Wikipediaの日本語データを使って学習してる論文を見かけたのでどうやって使える状態にしてるのか調べてみた。 もちろん、本当に今回やった方法でやったのかを論文の筆者に確かめたわけではない。 概ね近い結果が得られる程度にはクリー…

ツイッタラーの日本語に対してマシな結果が出るかと思ってJUMAN++を試したら興味深い違いが出た話

つまりなにしたの? 先日やったツイッタラーのツイートからエンジニア:非エンジニアを分類する要素は何なのか決定木に判別してもらう。のMeCabによる形態素解析だとツイッタラーの度し難い日本語に歯が立たなかったのでJUMAN++に切り替えてやってみた。 こ…

Juman++を試そうと思ったら詰まったので解決方法を模索した話

つまりなにしたの? OSXでJuman++をPythonから呼び出せるようになるまでの手順とつまりどころ(昨年くらいのブログ記事だとだいたい引っかかるっぽい。)の解決方法。 この解決方法はGithubにすでにプルリクエストが飛んでるけどマージされてないみたいなの…

形態素解析曰くツイッタラーの日本語は度し難く、決定木曰くエンジニアは「好き」って表明をあんまりしないらしい話

つまりなにしたの? 前回、「おっぱい」とつぶやいていたら本当にエンジニアなのか決定木に確かめてもらった話の準備をした。 一通りできたので実際にやってみたらエンジニアは「好き」をよく表明しているのかもしれない。みたいな知見が得られた。 もちろん…

「おっぱい」とつぶやいていたら本当にエンジニアなのか決定木に確かめてもらった話(準備編)

つまりなにしたの? Twitterのリストを2種類突っ込むと直近のツイートを引っ張ってきて、形態素解析から名詞を抽出して、2種類のリストを分類できる決定木を作ってみた。 *1 *1:unsplash.com

学習しても予測に使わなきゃ電気代の無駄なんだよ!ってことでTensorFlowのResNetをFlask使ってWebサービスっぽくする話

つまりなにしたの? TensorFlowのModelsにあるResNetを学習できたので学習した分類器をFlaskに組み込んでWebサービスっぽくした。 追記 2017年10月5日 2時00分: 公開しようと思ったけど思った以上にリソースを食うのとセキュリティとかガバガバなのでコード…

機械学習とかのアルゴリズムとデータのロジスティクスの話。3日目(tf.Estimatorのオレオレ解釈訳を添えて)

1日目はなにしたの? データのアルゴリズムとロジスティクスの話をまとめて、 Resnetのロジスティクスを読み解き、データセットの準備の部分まで到達した。 ensekitt.hatenablog.com 2日目はなにしたの? Resnetの学習部分のロジスティクスを読み解き、Resne…

クリエイティブ・コモンズ・ライセンス
この 作品 は クリエイティブ・コモンズ 表示 4.0 国際 ライセンスの下に提供されています。