近年、YoutTubeやAmazonなどの各プラットフォームが、音量をラウドネス正規化によって管理するようになりました。ラウドネス正規化の知識は、今や音を扱う人にとって無視できない必須項目です。ネット上にラウドネス正規化の情報は溢れていますが、Loudness Integratedを、いくつにすればよいかという話が多いようです。ここではラウドネス正規化の中身を技術的な視点で解説したいと思います。その仕組みと特徴が分かると、使い方も違ってくるかもしれません。
ラウドネス正規化の誕生経緯
デジタル時代に突入した1990年代から2010年代にかけて、音圧競争(ラウドネス・ウォー)という背景がありました。TVをはじめとする音を扱うメディアでは音圧が上がる一方でした。突然の爆音CMにびっくりしたという人も多いと思います。本来ユーザーに快適に見てもらいたいTVにおいて、音で目立つことを優先した結果、不快な現象が蔓延してしまいました。これは世界中で問題となっていたため、1990年代からITU(国際電気通信連合)において、その対策方法を策定していました。2006年に、その内容が勧告され、2011年以降に世界中の放送局等、2015年以降にネットのプラットフォームで採用されていきます。しかし問題が解決したわけではなく、そういう問題がようやく認知され始めたという段階のようです。最終的には視聴者側でボリュームを上げ下げする必要がないのが理想ですが、まだまだ先になりそうです。実際にはラウドネス正規化だけでなく、別のガイドラインも必要です。また作り手の意識問題もあるため、突然解決するようなことはなく、ゆっくりと改善されて行くことになると思います。
ITUが作ったのは物差し
ITUによるドキュメントはネット上で入手、確認ができます。また概要だけでなく、技術的な内容も含んでいるため、様々な検証が可能になります。
ITU (国際電気通信連合 International Telecommunication Union)
- 2006年Rec.ITU-R BS.1770「音声番組のラウドネスとトゥルーピークレベルの測定アルゴリズム」
- 2006年Rec.ITU-R BS.1771「ラウドネスメータとトゥルーピークメータの要求要件」
- 2010年Rec.ITU-R BS.1864「デジタルテレビ番組の国際交換におけるラウドネス運用規準」
1770と1771はバージョンアップされています。ITUは音量計測方法を提案したにすぎません。これをどう活用するかは、各プラットフォームにゆだねられます。
各プラットフォームが基準値を設定
ITUが作ったラウドネス正規化の仕組みを使って音量を測定し、各プラットフォームが基準値を決めて運用します。監視しているのは、多くの場合LUFS-I(Loudness Integrated)とPeak値です。詳細については次回解説しますので、ここではLUFS-Iは平均的な音量で、Peak値(true peak)は最大音量と捉えてください。
各プラットフォームがそれぞれ基準値を設定し、それを上回る音源は音量を基準値まで下げ、基準以下の音源は多くの場合、何もしないという使い方をします。そうすることで爆音のコンテンツを抑制することができ、全体的に音量のバラツキを少なくすることができます。作り手は、音量が意図しない方向にならないように、これらの意味を知っておく必要があります。下記にプラットフォームごとのLUF-I値を載せておきます。
プラットフォーム | 推奨LUF-I(dB) | Peak(true peak) |
---|---|---|
YouTube | -14 LUFS-I | -1.0dBTP |
Spotify | -14 LUFS-I | -1.0dBTP |
Apple Music | -16 LUFS-I | -1.0dBTP |
音楽における音量の基準
商品としての音楽はレコード、CD、最近では音声ファイルが完成品として扱われることが多いです。デジタルメディアの音は0dBが最大音量と決まっています。下図は1段目が32ビットフロートの波形で0dBを超えています。実際、CD等の多くのフォーマットでは0dB以上記録できずカットされるため、2段目のように、0dB以上は平らになってしまいます。そして再生するとクリップしてプチプチと鳴ってしまいます。
そのため絶対に0dBを超えないように調整されます。音圧競争の時代では、なるべく大きな音を詰め込んだ方が良いとされ、可能な限り音圧を上げる努力がされていました。特にポップスやロックでは、過剰なまでの音圧上げがされていました。
True peak
ラウドネス正規化ではTrue peakを扱うので少し解説します。下図はTrue Peakの説明用のスクリーンショットです。
1段目は、サンプリング周波数48000Hzのオリジナルでピークが0dBとなっています。0dBをオーバーしていないので音は歪まないという認識になりそうですが、再生装置による補完、リサンプリング、フォーマット変換など、条件によっては何が起きるか分からない状態でもあります。
2段目は、1段目を倍の96,000Hzにリサンプリングしたものです。赤サンプルが0dB以上となってクリップしているのが確認できます。このようにオーバーサンプリングするとサンプルとサンプルを補完するため、ピークがリサンプリング前よりも大きくなることがよくあります。
3段目は、理想的な波形に近づけたものです。この状態のピークがTrue peakと呼ばれるもので、0dBを超えないようにしておくことが望まれます。
過剰な音圧
下波形は過剰なまでに音圧が上げられた2002年リリースのCD波形です。全体的に最大音量と言える-1dB付近に波形が張り付いているのが確認できます。計測してみると-8dBLUFS-Iでした。音圧を無理に上げれば、本来それほど大きくない音も上がってしまい、大きな音と小さな音の差が少なくなり、常に最大で振幅しようとするため、不自然で、非常に騒々しい音になります。ただ音量感は最大にまで上がり、結果的に爆音に聞こえ目立つことになります。
このような音源を、そのままネットのプラットフォームにアップすると音量はかなり下げられてしまいます。特に迫力を狙って過度に音圧を上げた音源は、狙い通りにならないこともあるので注意が必要です。
上記をYouTubeにアップした場合、以下のような波形に加工されます。6dBほど音量が下げられ、ピークは-6dBぐらいになっています。全体としてはYouTubeの規定通り-14dBLUFS-Iとなっています。振幅としてはオリジナルの約半分まで落とされているわけです。
ナチュラルな音圧
下記波形は上と同じアーティストですが1989年リリースのCDです。比較的ナチュラルなバランスの音源で、-14LUFS-Iからかけ離れていません。ピークは-2dBぐらいはあるので、ここ一番の迫力もあります。何よりもネットにアップしたとき音量もほとんど下げられず、大きくイメージが崩れることはありません。そして上記の迫力を狙った爆音音源よりも、音量が大きく聞こえます。また、おそらくこちらの方が音質的に好ましいという結果になると思います。
ネットでは-14LUFS-Iが多いため、制作時に-14を狙うのもありかもしれませんが、基本的にはTVと同じように多様な番組を扱う上で決められた値なので、音楽の場合は、あまり意識する必要はないと個人的には思っています。むしろ注意すべきは別のところにあって、LUFS-Iがどのような仕組みで計算しているのか知っていることの方が重要です。これについては次回解説します。
コラム「sound&person」は、皆様からの投稿によって成り立っています。
投稿についての詳細はこちら