1982年にCD(Compact Disc)と再生機が発売されました。音声をデジタルデータとして記録する方式ですが重要な仕様としては、時間軸の分解能を示すサンプリング周波数と、音量の分解能を示すビット数があります。
CDはサンプリング周波数が44100Hzで、1秒間に44100サンプル記録することを意味します。これで何ヘルツまでの高い音が記録できるかというナイキスト周波数が決定されます。44100サンプルの場合は22050Hzまで扱うことができます。
ビット数は16ビットなので、-32768 ~ 32767ポイントとなります。これは小さな音から大きな音までどれぐらいの差を記録できるかを決定します。通常はダイナミックレンジとして表します。16ビットの場合は約96dBとなります。
デジタル音声データは、このサンプリング周波数とビット数で音質が決定されます。1982年当時は44100Hz、16ビットが現実的な数値でしたが、現在の技術を使えばサンプリング周波数もビット数も上げられます。ただCDは互換性が重要なので、やたらとスペックを変更することは出来ません。DVDやBlu-rayも同じように、使われているサンプリング周波数とビット数は決まってきます。
- 44100Hz 16bit:CD
- 48000Hz 16/24bit:DVD
- 96000Hz 16/24bit:Blu-ray
- 192000Hz 24/32bit:Blu-ray
48000Hzは、映像コンテンツとしてDVDが出るときに策定されました。放送局で使われてた32000Hzに対して整数比であることが、その理由です。それ以上は倍のスペックとなっています。
気になるのはCDの44100Hzをどのように決定したかということです。とくに100が中途半端な印象を受けます。
■ サンプリング周波数44100Hzが決定された経緯
80年代から謎とされていて、開発者のインタビューでも、はっきり答えてくれないという印象でした。2000年代に入ると、情報がいろいろ開示されて、真相が見えてきました。現在では検索することで、ある程度の情報を得ることが出来ます。以下は以前調べたときのメモをベースにしています。真実からそれほどかけ離れてないと思いますが、技術的な部分、特に計算は推測が入っています。細かい部分なのでインタビュー記事にも載らなかったのだと思います。
CDの仕様決定はソニー社とフィリップス社で行われました。ソニーは1977年にPCMプロセッサー「PCM-1」をすでに発売しており、これらをベースにCDの仕様を決定して行きました。ただ「PCM-1」は44056Hz、13ビット3折線、2chというCDとも違う仕様です。これは記録媒体として業務用VTRを流用したためNTSC規格だと44056Hzになってしまうということです。同じ年にNHKと共同開発したPAL規格の「PAU-1602」というモデルもあり、こちらは44100Hz、16ビット、2chという仕様でCDと全く同じです。CDの仕様はPALをベースにしたと思われます。
もう少し細かく見て行きます。業務用VTRはアナログ機器です。磁気テープにアナログ信号を記録して映像と音を記録します。PCMでは、これを利用して録音するわけです。デジタル録音は高速に膨大な情報を記録する必要があります。1秒間に44100x16ビットx2ch=1411200点/秒の情報量です。デジタルですからON/OFFを記録するわけですが、これを実現するには当時はVTRしかなかったということです。普通のオーディオ磁気テープでは、スピードが追い付かなかったわけです。
次にVTRがどのように磁気テープに記録しているのかを見てみます。テープ自体は1秒間に数十ミリというスピードで動いていますが、そのテープを巻き付けるようにして円柱状のドラムが回転しながら記録再生しています。記録ヘッドはドラム表面にある点のような小さい部分です。ドラム円周上に2点あります。下動画はゆっくり回していますが、実際は数千rpmで高速回転します。テープ面にかなり高速にデータを記入しているのが分かります。
テープを斜めに当てて、回転しながら記録しますので、テープには以下のようなレイアウトで記録されます。斜めの線にPCM録音では音声データを記録しますが、本来は映像信号で画像の走査線に相当します。
テープに記録された中身は以下のようなイメージです。ON/OFFが分かればよいので、最大値と最小値が入っています。
ビデオで使う走査線とは、ブラウン管に映像を投影する際の電子ビームの軌跡であり、テレビ画面では以下のようになっています。1画面を生成するのに525本の走査線が必要になります。これを1秒に30フレーム行います。525線x30フレーム=15750線が1秒間に必要な線数となります。ただし有効走査線は490線となります。
PCM録音では、この走査線1本分に3サンプルx2ch分のデータを記録したようです。そして有効走査線だけを利用することで安定した記録を実現しました。これで計算してみると以下のようになります。
有効走査線490線x30フレームx3サンプル(2ch分)=44100サンプル
この仕様でプロ機材として作り込んでいたため、レコーディングからリリースまで同スペックで行えるメリットは大きく、そのままCDの仕様決定に使ったのだと思われます。フィリップス社はナイキスト周波数20kHz以上をクリアしていれば問題ないということで、数値の中途半端さはあまり気にしなかったようです。すでにPCMプロセッサーで44100Hzを実現していたので、これ以下にはしたくなかったのでしょう。また、これ以上となると価格的にも厳しかったのだと思います。当時の条件の中で、最大限高音質を目指した結果が44100Hzだったのではないかと思います。CDの登場時期が数年遅れていたら、違ったサンプリング周波数になっていたかもしれません。
ビット数についてはフィリップス社が推す14ビットと、ソニーが推す16ビットで、もめたようですが、可能な限りよい音にしたいという思いで、最終的に16ビットに落ち着いたとあります。
■ 44100という数字
意図的かどうかは不明ですが、44100は1~9の整数で割った場合、8だけ小数になってしまいますが、他はきれいに整数になってくれます。7などで割れると「お~!」と思いますね。意外と使い勝手のよい数値のようにも思えます。実際のプログラミング上では、特に便利という訳でもないですが。
コラム「sound&person」は、皆様からの投稿によって成り立っています。
投稿についての詳細はこちら