AWS の Amazon Poly でコンソールから音声を出力すると、mp3 形式で出力されるのですが、ある用途で利用するには WAVE 形式にする必要があり、変換したいと思います。
形式変換するには、ffmpeg が便利そうなので使ってみます。
(1) 実行ファイルの入手
https://www.ffmpeg.org/実行ファイルが配布されているので、環境に合わせてダウンロードください。今回は、Windows 環境で実行しますので、Windows 用の実行ファイルを入手しました。
(2) mp3 を WAVE 変換する
コマンドラインから実行します。
ffmpeg -i "speech.mp3" -f wav "speech.wav"
-i "speech.mp3"
入力ファイルを指定します
-f wav
出力フォーマットを、wav 形式にします
最後に、出力するファイル名を記述します。
これで `speech.mp3` が、`speech.wav` に変換されました。素晴らしい。
(3) オプションを指定して、少し、細かく制御してみる
ffmpeg -i "speech.mp3" -ac 2 -ar 44100 -acodec pcm_s16le -f wav "speech.wav"
-ac 2ステレオ2チャンネル
-ar 44100
サンプリングレート 44.1kHhz
-acodec pcm_s16le
コーデックの指定、pcm_s16le は、PCM 16bit
この指定で、CD と同じ仕様になるので、ほぼ、どんな環境でも再生できるんじゃないかなぁ?と思います。