音声ファイルでおすすめの形式は? エンコードやデコード、圧縮や変換について解説

「音声ファイルって種類が多くて選び方が分からない」「どれを使っても同じじゃないの?」など、普段から音声ファイルを使い慣れていない人は、いざというときこのような疑問を感じがちです。
実際、音声ファイルには非常に多くの種類があり、使用する形式によって特徴が大きく異なります。
また、エンコードやデコード、圧縮や変換など、音声や動画を編集していると目にするものの、「何となく理解しているけど上手く説明できない」という人も少なくありません。
この記事では、音声ファイルの形式からエンコードやデコード、圧縮や変換など基礎知識について分かりやすく解説していきます。
これらを理解することで、今まで以上に快適に音声ファイルを利用できるようになりますので、ぜひ参考にしてみてください。

音声ファイルの形式一覧

音声ファイルには非常に多くの種類がありますが、圧縮方法や音質などから次のようにまとめることができます。

形式 拡張子 圧縮方法 音質
AAC .aac 非可逆圧縮 音質は多少劣化する
ATRAC .omg ,oma ,aa3 非可逆圧縮 音質は多少劣化する
HE-AAC .aac 非可逆圧縮 音質は多少劣化する
MP3 .mp3 非可逆圧縮 音質は多少劣化する
Opus .opus 非可逆圧縮 音質は多少劣化する
Vorbis .ogg ,oga 非可逆圧縮 音質は多少劣化する
WMA .wma ,asf 非可逆圧縮 音質は多少劣化する
AAL .omg ,oma ,aa3 可逆圧縮 CDと同等の音質
Apple Lossless .m4a ,mov ,alac 可逆圧縮 CDと同等の音質
FLAC .flac 可逆圧縮 CDと同等の音質
Monkey’s Audio .ape 可逆圧縮 CDと同等の音質
TAK .tak 可逆圧縮 CDと同等の音質
TTA .tta 可逆圧縮 CDと同等の音質
WMA Lossless .wma ,asf 可逆圧縮 CDと同等の音質
AIFF .aiff ,aif ,aifc 可逆圧縮 CDと同等の音質
WAV .wav ,wave 非圧縮 CDと同等の音質

一見して、「非可逆圧縮で多少音質が劣化するもの」「可逆圧縮でCDと同等の音質のもの」「非圧縮でCDと同等の音質のもの」の3種類で良いのではないかと感じてしまうかもしれませんが、それぞれ圧縮率の違いやファイルサイズ、周波数などに違いがあります。
圧縮方法や圧縮率、周波数については以降で確認していきましょう。

非可逆圧縮と可逆圧縮の違い

先の一覧にも記載した通り、音声ファイルの圧縮方法には「非可逆圧縮」「可逆圧縮」「非圧縮」の3種類があります。
まず、非可逆圧縮(ロッシー圧縮)ですが、こちらはエンコードの際によく見られるもので、データを削って圧縮する方法のことです。
データを削るので圧縮率は高くなる(サイズが小さくなる)メリットがある一方で、元のデータに戻せないことや音質が下がるといったデメリットも存在します。
ただし、音質に関しては人間が聞き取れないようなデータを削ることで、音質の劣化を抑えることも可能です。
可逆圧縮(ロスレス圧縮)とは、データを削ってサイズを小さくする非可逆圧縮とは違い、元データを削ることなく圧縮する方法なので、音質は高く、元に戻すことが可能な圧縮方法です。
こちらはPCのZIP形式の圧縮をイメージすると分かりやすいでしょう。
音質が高く、元に戻すことが可能というメリットはありますが、非可逆圧縮と比べて圧縮率は高くないので、サイズをあまり小さくできないというデメリットも存在します。
つまり、元のファイルに戻せないがサイズを小さくできるのが非可逆圧縮で、元に戻せて音質も良いがサイズをあまり小さくできないのが可逆圧縮ということです。
なお、非圧縮はその名の通り圧縮をしないので、音声ファイルのサイズはそのままとなるほか、音質も可逆圧縮と同じです。

周波数による音質の違い

音声ファイルを作成する際、アナログの音源からデータに変換するために、一定の間隔で記録する作業が必要です。
この一定間隔で記録する周期のことを周波数(サンプリング周波数)といい、1秒間に記録する回数を表しています。
つまり、周波数が高ければ高いほどアナログ音源に忠実となるため、音質も良くなるのです。
「それなら周波数が高い方が良いのでは?」と感じてしまいますが、周波数が高いということは、その分記録するデータ量が増えるということでもあるので、音声ファイルのサイズが大きくなり過ぎてしまうという問題もあるのです。
また、音質においては記録する間隔周期を表す周波数(Hz)のほかに、ビットレートも音質に大きな影響を与えます。
ビットレートは、1秒間に記録できるデータ量を指すもので、固定ビットレートと可変ビットレートの2種類があります。
固定ビットレートは、終始同じビットレートですが、可変ビットレートでは音声データ量に応じてビットレートを増減させることが可能です。
可変ビットレートでは、音声データ量が少ない箇所ではビットレートを抑え、逆に音声データ量が多い箇所ではビットレートも高くすることができるので、固定ビットレートよりも音声データのサイズ調整がしやすいといえるでしょう。

エンコード・デコードとは

音声ファイルや動画編集などで目にする「エンコード」「デコード」ですが、どのような処理を指すのかご存知でしょうか。
ここでは、エンコードとデコードそれぞれの解説と、処理を行う意味について解説していきます。

エンコードとは

エンコードは、音声ファイルや動画ファイルだけではなく、PCのデータ変換をはじめさまざまな場所で使われる用語です。
意味は、信号やデータを規則に基づいて変換するもので、符号化や暗号化、記号化する処理を行います。
音声ファイルや動画編集で使われるエンコードとは、データサイズの多い元データの圧縮や形式を変換するために用いられます。

デコードとは

音声データを符号化することをエンコードというのに対し、デコードは符号化された音声ファイルを元に戻す処理のことを指します。
先に触れたように、可逆圧縮であればデコードをすることで元のデータに戻すことが可能ですが、非可逆圧縮の場合には元のデータに戻すことができないので注意が必要です。

エンコードを行う意味

スペックが高いPCで、録音・動画データを個人で楽しむ分にはエンコードをしなくても大きな不都合はありません。
しかし、次のようなシチュエーションでエンコードが必要になります。

・音声データを他の人と共有したいとき
・SNSやWebサイトにアップロードしたいとき
・別のデバイスで音声ファイルを再生したいとき
それぞれの理由については、以降で解説していきます。

音声データを他の人と共有したいとき

音声ファイルを他の人と共有したいとき、エンコードが必要となることが多いです。
エンコードをしていない音声ファイルは容量も大きく、データ送信するのに時間を要します。
また、共有する相手が使用している端末によっては、音声ファイルの形式に対応していなければ再生することもできません。
たとえば、Windowsで広く使用されている音声ファイルの形式(WMA)のデータをエンコードせずにMacのOSを使用している相手に送信しても、受け取った側はそのままで再生することができず、自らエンコード(コンバート)や再生可能なツールを利用する手間がかかります。
共有相手に負担をかけないよう、エンコードをするようにしましょう。

SNSやWebサイトにアップロードしたいとき

SNSやWebサイトに音声ファイルや動画ファイルをアップロードする際にも、エンコードが必要になります。
一般的に、SNSやWebサイトでは、サービスで定められた形式にしなければアップロードすることができません。
仮にアップロードできたとしても、正常に再生できないといった不具合が生じる可能性が高いです。
スマートフォンやアプリで録音や撮影したデータは、そのままアップすることができますが、それらを編集したり加工したりした場合にはエンコードが必要となることもあるので、覚えておくようにしましょう。

別のデバイスで音声ファイルを再生したいとき

音声ファイルや動画ファイルを別のデバイスで再生したいときにも、エンコードが必要となる場合があります。
一般的に、デバイスには対応している形式(拡張子)が定められているので、当然ながら非対応の形式の音声ファイルや動画ファイルは再生することができません。
「音声ファイルを別デバイスに移したのに再生できない」といった際には、対応している形式を確認し、エンコードをするようにしましょう。

エンコード・デコードをする方法

エンコードやデコードを行う方法として一般的なのは、音声ファイルや動画ファイルを編集するソフトやツールである「エンコーダー」を利用することです。
「特別なツールを用意しなければいけないの?」「費用をかけたくない」と考えている人も多いですが、無料のエンコーダーも豊富なので、自身がやりたいことが実現できる機能を実装しているものを選ぶと良いでしょう。
フリーソフトに不安を感じる場合には「Windowsムービーメーカー」のように、オフィシャルなものを選択することで払拭することができます。
Windowsムービーメーカーは、Windows Vista以前まで標準装備されていたもので、標準ではなくなった今でもマイクロソフトのサイトから無料でダウンロードすることが可能です。
もちろんMacにも無料エンコーダーはあり、有名なものには「QuickTime」が挙げられます。
このように、無料でも十分な機能を実装しているエンコーダーは数多く存在するので、最適なものを選んでいくと良いでしょう。

まとめ

音声ファイルには非常に多くの形式があり、それぞれによって圧縮方法や圧縮率、周波数などが異なることから音質にも違いがあります。
圧縮方法に関しては、元に戻すことができない非可逆圧縮と元に戻すことができる可逆圧縮があり、圧縮した際のデータサイズが大きく差があることもポイントです。
それぞれにメリット・デメリットがあるので「これにしておけば間違いない」という形式はないので、使用する形式の特徴を押さえておくようにすると良いでしょう。
また、圧縮や変換にはエンコードやデコードができるエンコーダーを使用しますが、こちらは特別なものではなく、無料でダウンロードできるものも数多く存在します。
使用するエンコーダー選びに悩んだ際には、オフィシャルなものや、変換できる形式の種類が多いもの、やりたいことができる機能を実装しているなど、基準を設けて最適なものを選んでいくと良いでしょう。

SACSCRIBEで面倒な文字起こしを時短しませんか?

クラウド文字起こしプラットフォームSACSCRIBEは初回1時間無料でお試しできるAIの文字起こしサービスです。

無料で1時間文字起こしを体験する