kindle OCRアプリ開発 ピッチ変更

テキストファイルを音声ファイルに変換する機能を作っています。

変換そのものは簡単だが、音の高さを変えずにピッチを変えるのが難しいです。

ネットで見つけたコードを参考にしたら実現できたが、10秒くらいの音声を変換するのに1分くらいかかっていて実用に耐えません。

処理時間がかかっているのを判別する記述があります。

cProfile.run()

これを使うとどこで時間がかかっているのかがわかるらしいのですが、どうすれば良いかわかりません。

別アプローチで、googleのText-to-Speech有料版を使えばピッチを変更できるらしいです。

元々テキストファイルを音声にするときgoogleのttsを使っているので、そちらのほうが確実だと思われます。

タイトルとURLをコピーしました