FFmpeg を利用して音声ファイルの形式を変換する

Yossy
2023-08-17
2023-08-17

AWS の Amazon Poly でコンソールから音声を出力すると、mp3 形式で出力されるのですが、ある用途で利用するには WAVE 形式にする必要があり、変換したいと思います。

形式変換するには、ffmpeg が便利そうなので使ってみます。

 (1) 実行ファイルの入手

https://www.ffmpeg.org/

実行ファイルが配布されているので、環境に合わせてダウンロードください。今回は、Windows 環境で実行しますので、Windows 用の実行ファイルを入手しました。

(2) mp3 を WAVE 変換する

コマンドラインから実行します。

ffmpeg -i "speech.mp3" -f wav "speech.wav"

-i "speech.mp3"
入力ファイルを指定します

-f wav
出力フォーマットを、wav 形式にします

最後に、出力するファイル名を記述します。
これで `speech.mp3` が、`speech.wav` に変換されました。素晴らしい。

(3) オプションを指定して、少し、細かく制御してみる

ffmpeg -i "speech.mp3" -ac 2 -ar 44100 -acodec pcm_s16le -f wav "speech.wav"
-ac 2
ステレオ2チャンネル

-ar 44100
サンプリングレート 44.1kHhz

-acodec pcm_s16le
コーデックの指定、pcm_s16le は、PCM 16bit

この指定で、CD と同じ仕様になるので、ほぼ、どんな環境でも再生できるんじゃないかなぁ?と思います。