EnsekiTT Blog

EnsekiTTが書くブログです。

Audio

音声生成のHMMの代わりにDeepLearningを適用してみようとしてる話(計算中)

つまりなにしたの? 友人の会社の勉強会にお邪魔して音声生成するために必要なことを勉強しつつ、 DeepNeuralNetworkを無理やり適用する方法を提案してみた。 でも、まだ計算が終わっていないし、なんなら収束しなさそう()

STFT→iSTFTでちゃんと音がもとに戻るのか確認してみた話

つまりなにしたの? 音声データをSTFTして、スペクトログラムを用意してそのスペクトログラムからまた音声データに戻せるのか確認してみた。 一旦スペクトログラムにすればCNNとかと相性が良いから面白いかもなーと試してみた。

クリエイティブ・コモンズ・ライセンス
この 作品 は クリエイティブ・コモンズ 表示 4.0 国際 ライセンスの下に提供されています。