2.

WAVとは | Windows標準の無圧縮PCM音声、RIFFコンテナで編集マスター

編集
この記事の要点
  • WAV は Waveform Audio File Format の略で、1991 年に Microsoft と IBM が共同で策定した Windows 標準の音声コンテナ
  • 中身は RIFF(Resource Interchange File Format)コンテナで、ファイル先頭のマジックは 52 49 46 46("RIFF")
  • 通常は無圧縮の PCM(リニア PCM)データを格納するため、音質劣化が一切なく編集・加工に最適
  • CD と同じ 44.1 kHz / 16 bit / ステレオ で 1411 kbps(約 10 MB/分)。ハイレゾ 96 kHz / 24 bit / ステレオでは約 32 MB/分
  • 内部に MP3 や ADPCM などの圧縮データを格納することも仕様上は可能だが、互換性問題が起こりやすいため非推奨
  • 4 GB の壁(32 bit サイズ表現の上限)があり、超長尺・超高サンプリングレートでは RF64 / BWF / W64 など派生フォーマットを使う

概要

WAV は 1991 年に Microsoft と IBM が共同で策定した音声ファイル形式で、Windows 3.1 のマルチメディア拡張機能とともに登場しました。正式名称は「Waveform Audio File Format」で、拡張子は .wav または .wave。コンテナとして RIFF(Resource Interchange File Format)を採用しており、AVI や ANI と兄弟関係にあります。

中身として最も一般的なのは無圧縮の PCM(リニア PCM)データで、サンプリング周波数とビット深度で示されたデジタル波形がそのまま並びます。CD-DA(音楽 CD)と同じ 44.1 kHz / 16 bit / ステレオ を採用することが多く、この場合のビットレートは 1,411 kbps で、約 1 分あたり 10 MB のサイズになります。

音声編集・録音・マスタリングの現場では、ノイズ追加や音質劣化を一切起こさない無圧縮 PCM が大きな利点で、Pro Tools、Logic Pro、Cubase、Studio One、REAPER などすべての主要 DAW で WAV が標準入出力フォーマットになっています。最終配布の段階でだけ MP3 / AAC / FLAC などに変換するワークフローが定着しています。

内部構造

WAV ファイルは RIFF コンテナの構造をそのまま持ちます。先頭 12 バイトは「RIFF ヘッダ」と呼ばれ、以下のように並びます。

52 49 46 46  "RIFF"           - マジックバイト(4 バイト)
xx xx xx xx  ファイルサイズ-8       - リトルエンディアン 4 バイト
57 41 56 45  "WAVE"           - フォーマット ID(4 バイト)

その後ろにいくつかの「チャンク」が続きます。最低限必要なのは fmt チャンクと data チャンクの 2 つです。

  • fmt チャンク:オーディオフォーマット(1=PCM、3=IEEE float、6=A-law、7=μ-law、0xFFFE=拡張)、チャンネル数、サンプリングレート、バイトレート、ブロックアライン、ビット深度を格納
  • data チャンク:実際の波形サンプルが並ぶ領域。データサイズの 4 バイトの後ろに、リトルエンディアン PCM が連続する
  • LIST チャンク:アーティスト名や作品名などのメタ情報(INFO)を任意に格納できる
  • bext チャンク:放送業界用の Broadcast WAV(BWF)で追加されるメタデータ

ファイルサイズが 4 GB を超える場合は WAV では扱えず、後継の RF64 / W64(Sony Sound Forge 発祥)や BWF-64 を使う必要があります。長尺の現場録音や 192 kHz / 32 bit float のハイレゾ素材ではよく遭遇する制約です。

主な用途

  • 音声編集・録音のマスター:DAW、ナレーション録音、フィールドレコーディング、楽曲制作のすべての段階で WAV が編集中の中間ファイル
  • 映像のリップシンク:映像編集ソフト(Premiere Pro、DaVinci Resolve、Final Cut Pro X)が音声を扱う際の標準フォーマット
  • サンプリング音源・効果音:Kontakt、HALion、各種 SFX ライブラリの中身は WAV が中心。Foley、サウンドエフェクト、ドラムサンプルも WAV
  • ゲーム開発:Unity / Unreal Engine の取り込み元素材は WAV、ランタイムでは Vorbis / Opus / ADPCM に変換
  • 業務用 BGM 配信:店舗向け BGM や駅・空港の館内放送は無圧縮 WAV のままサーバー配信されるケースもある
  • 音声 AI の学習データ:音声認識、TTS、声質変換、AI 歌唱合成(NEUTRINO、AIVoice、VITS など)の入出力フォーマット

関連形式との比較

形式圧縮1 分あたり用途
WAV (44.1k/16bit/2ch)無圧縮約 10 MB編集マスター
WAV (96k/24bit/2ch)無圧縮約 32 MBハイレゾ録音
AIFF無圧縮約 10 MBApple 側の同等品。ビッグエンディアン
FLAC可逆約 6 MB配布用ロスレス
MP3 320 kbps非可逆約 2.4 MB配布・配信
Opus 128 kbps非可逆約 1 MB配信・通話

WAV と AIFF は中身がほぼ同じ無圧縮 PCM ですが、バイトオーダー(WAV はリトルエンディアン、AIFF はビッグエンディアン)が異なるだけで、機能面でも互換性でも WAV の方が広く使われています。

編集ツール

  • Audacity:無料のクロスプラットフォーム波形編集ソフト。WAV 録音・カット・エフェクト処理の入門に最適
  • Adobe Audition:プロ向け波形編集。ノイズリダクション、スペクトル編集に強い
  • iZotope RX:放送・映画業界標準の音声修復ツール。WAV 必須
  • Pro Tools / Logic Pro / Cubase / Studio One / REAPER:DAW 各種。WAV を標準フォーマットとして読み書き
  • ffmpegffmpeg -i input.mp3 output.wav で MP3 → WAV、ffmpeg -i input.wav -ar 48000 -ac 2 -sample_fmt s16 output.wav でリサンプリング
  • SoX (Sound eXchange):CLI の老舗音声処理ツール。ピッチシフト、テンポ変更、フィルタリングが豊富

注意点

  • サイズが巨大:1 分で 10 MB、CD 1 枚分(74 分)で約 700 MB。配布用には FLAC や MP3 に変換する
  • 4 GB 制限:32 bit のサイズフィールドのため、約 6 時間(CD 品質)または約 1.5 時間(96 kHz / 24 bit)を超える録音は WAV では保存できない。RF64 / W64 / BWF-64 を使う
  • メタデータ対応が貧弱:曲名・アーティストなどの ID3 相当のタグ機能は弱く、LIST/INFO チャンクに対応していないプレイヤーも多い
  • 圧縮 WAV の互換性問題:WAV の中身を MP3 や ADPCM にした「圧縮 WAV」は再生できない環境がある。圧縮したいなら拡張子も MP3 / FLAC に変える方が安全
  • クリッピング処理が乱暴:16 bit PCM では -32768〜32767 の範囲を超えるとそのまま頭打ちになり、激しい歪みが発生する。録音時にレベル管理を徹底する
  • DC オフセット:マイクや録音機の特性で波形がゼロを中心にしていない場合があり、DAW で DC オフセット除去をかけて補正する

関連リンク

編集
Post Share
子ページ

子ページはありません

同階層のページ
  1. MP3(.mp3)
  2. WAV(.wav)
  3. FLAC(.flac)
  4. AAC(.aac / .m4a)
  5. MP4(.mp4 / .m4v)
  6. MOV(.mov)
  7. WebM(.webm)
  8. MKV(.mkv)
  9. Opus(.opus)
  10. M3U8 / HLS(.m3u8)

最近更新/作成されたページ