EnsekiTT Blog

EnsekiTTが書くブログです。

NLP

JUMAN++による分かち書きがハイパー時間かかってる話

つまりなにしたの? JUMAN++でMeCabの分かちオプションと同じ結果を出せるスクリプトを用意して、前回と同じように単語間の演算をやってみようと思ったもののまじで終わらない。 今度はナウい単語も使えるはずだぞ!という期待を胸にただひたすら待っている。

先月のWikipediaをWord2Vecに突っ込んで単語を加算減算して遊んでみた話

つまりなにしたの? WikipediaのXMLデータをこないだクリーニングしたのでMeCabで分かち書きにしてWord2Vecを学習してみた。 前回 ensekitt.hatenablog.com をやったので、このデータを使いたい。

クリエイティブ・コモンズ・ライセンス
この 作品 は クリエイティブ・コモンズ 表示 4.0 国際 ライセンスの下に提供されています。