1.

MP3とは | MPEG-1 Audio Layer 3、特許失効済みのデファクト音声圧縮形式

編集
この記事の要点
  • MP3 は MPEG-1 / MPEG-2 Audio Layer III の略で、1993 年に標準化された世界で最も普及した非可逆音声圧縮形式
  • 人間の聴覚特性(マスキング効果)を利用して、可聴域外や聞こえにくい音を間引くことでファイルサイズを 1/10〜1/11 に削減できる
  • 一般的なビットレートは 128 kbps(標準)/ 192 kbps(高音質)/ 320 kbps(最高音質)。VBR(可変ビットレート)にも対応
  • 曲名・アーティスト名・アルバムアートなどのメタ情報は ID3 タグ(v1 / v2)で埋め込み、ファイル先頭または末尾に格納される
  • Fraunhofer IIS とトムソンが保有していた基幹特許は 2017 年 4 月までにすべて満了し、現在は完全にロイヤリティフリーで利用可能
  • マジックナンバーは ID3v2 付きなら 49 44 33("ID3")、タグなしの素フレームは FF FB または FF FA から始まる

概要

MP3 は 1993 年に ISO/IEC 11172-3 として正式に標準化された音声圧縮形式で、ドイツの Fraunhofer IIS(フラウンホーファー集積回路研究所)を中心とした研究グループによって開発されました。正式名称は「MPEG-1 Audio Layer III」または「MPEG-2 Audio Layer III」で、MPEG(Moving Picture Experts Group)が策定した動画圧縮規格のうち、音声トラック部分の Layer III を独立した音声ファイルとして利用したものです。

1990 年代後半から 2000 年代初頭にかけて、Napster や iTunes、iPod の登場と歩調を合わせて爆発的に普及し、CD-DA に代わる音楽配布のデファクトスタンダードとなりました。当時のダイヤルアップ回線でも数分でダウンロードできる軽量さと、CD 並みの音質をバランスさせた点が革命的で、音楽産業のデジタル化を一気に推し進めました。

2017 年 4 月、Fraunhofer IIS とトムソンが保有していた基幹特許がすべて満了し、ライセンス料の支払いなしに自由に利用できるようになりました。これにより OSS プロジェクトでも堂々と MP3 のエンコーダ・デコーダを組み込めるようになり、ffmpeg や Audacity でも標準でサポートされています。

内部構造

MP3 ファイルは、ID3 タグ領域と多数のフレームが連続した構造を持ちます。代表的な ID3v2 ヘッダのマジックバイトは "ID3"(16 進で 49 44 33)で始まり、その後ろにバージョン、フラグ、サイズ、各種フレーム(TIT2=曲名、TPE1=アーティスト、TALB=アルバム、APIC=アルバムアート画像)が並びます。

タグの後ろには実際の音声フレームが続きます。各フレームは 11 ビットの同期ワード(FF F で始まる)、MPEG バージョン、レイヤー、ビットレート、サンプリングレート、チャンネルモード(モノラル / ステレオ / ジョイントステレオ / デュアル)などを含むヘッダと、量子化された MDCT(変形離散コサイン変換)係数を持ちます。

圧縮の核心は心理音響モデルです。人間の耳は大きな音の周辺の小さな音を聞き取れない(同時マスキング)、大きな音の直後の小さな音は聞こえにくい(時間マスキング)といった特性を持ちます。MP3 エンコーダはこの特性をモデル化し、聞こえない / 聞こえにくい周波数成分を粗く量子化することでビット数を節約します。

典型的なビットレートと用途は以下の通りです。

  • 64 kbps:AM ラジオ相当。音声ポッドキャストの下限
  • 128 kbps:FM ラジオ〜CD に近い品質の標準値。一般的な MP3 配信
  • 192 kbps:高音質。普段使いで CD と区別しにくいレベル
  • 256 / 320 kbps:最高音質。オーディオファイル向け
  • VBR (V0〜V9):曲の難しい部分にビットを多く割く可変ビットレート方式

主な用途

MP3 の用途は極めて多岐にわたります。

  • 音楽配信:Amazon Music、Bandcamp などのダウンロード販売で長年の主力
  • ポッドキャスト:Apple Podcasts、Spotify、Google Podcasts のいずれも MP3 を標準コンテナとして採用
  • オーディオブック:Audible や青空朗読でも MP3 配信が一般的
  • カラオケ・BGM:店舗・施設の業務用 BGM プレイヤーは MP3 / WAV を読み込むものが多い
  • 携帯音楽プレイヤー:iPod、ウォークマン、各種 DAP すべてが MP3 をネイティブサポート
  • 車載オーディオ:CD やフラッシュメモリに焼いた MP3 を再生するヘッドユニットは現在も主流
  • ボイスメモ・録音アプリ:スマホの録音アプリが MP3 をデフォルト出力にしているものも多い

関連形式との比較

形式圧縮典型ビットレート互換性備考
MP3非可逆128-320 kbps◎ 最強特許失効済み、業界デファクト
AAC非可逆96-256 kbps同ビットレートで MP3 より高音質。Apple / YouTube が採用
Ogg Vorbis非可逆96-320 kbps完全 OSS。Spotify が長らく採用
Opus非可逆6-510 kbps低ビットレートで最強。Discord / WhatsApp が採用
FLAC可逆800-1100 kbps容量は大きいが音質劣化なし
WAV無圧縮1411 kbps (CD)編集マスター向け

同じ 128 kbps で比較した場合、AAC や Opus は MP3 より明らかに高音質ですが、互換性の面では MP3 が圧倒的にリードしています。古いカーステレオ、業務用機器、組み込みプレイヤーまで含めて再生できる安心感が MP3 の最大の強みです。

編集ツール

MP3 を扱える代表的なツールは以下の通りです。

  • LAME:事実上の標準エンコーダ。lame -V2 input.wav output.mp3 で VBR V2、lame -b 320 input.wav output.mp3 で CBR 320 kbps
  • ffmpegffmpeg -i input.wav -codec:a libmp3lame -b:a 192k output.mp3
  • Audacity:無料の波形編集ソフト。録音・カット・ノイズ除去・書き出しまで一通り対応
  • iTunes / Music.app:CD リッピング設定で MP3 を選択可
  • foobar2000:高機能プレイヤー兼コンバータ(Windows)
  • Mp3tag:ID3 タグ専用エディタ。アルバムアート埋め込みや一括書き換えに便利

注意点

  • 非可逆圧縮なので元には戻せない:マスター音源は WAV や FLAC で保管し、配布用に MP3 を書き出す運用が基本
  • 多重エンコードによる音質劣化:MP3 を読み込んで再度 MP3 で書き出すと音質が累積劣化する。編集中は WAV を使い、最後の 1 回だけ MP3 化する
  • サンプリング周波数の制約:MP3 は 8 / 11.025 / 12 / 16 / 22.05 / 24 / 32 / 44.1 / 48 kHz のみサポート。96 kHz などのハイレゾ素材は WAV や FLAC を選ぶ
  • マルチチャンネル非対応:MP3 はモノ / ステレオのみ。5.1ch サラウンドを扱いたい場合は AAC や AC-3、E-AC-3 を使う
  • ID3 タグの文字化け:ID3v1 は ASCII のみ、ID3v2 でも UTF-8 / UTF-16 / Latin-1 が混在しがち。日本語環境では UTF-8 統一推奨
  • 無音区間の混入:エンコード時に先頭と末尾に短い無音が入る性質があり、ギャップレス再生したい音源(ライブアルバム等)では AAC や Ogg の方が有利

関連リンク

編集
Post Share
子ページ

子ページはありません

同階層のページ
  1. MP3(.mp3)
  2. WAV(.wav)
  3. FLAC(.flac)
  4. AAC(.aac / .m4a)
  5. MP4(.mp4 / .m4v)
  6. MOV(.mov)
  7. WebM(.webm)
  8. MKV(.mkv)
  9. Opus(.opus)
  10. M3U8 / HLS(.m3u8)

最近更新/作成されたページ