いつの間にか1周年記念(4月24日で)
別に例外ではないが、例外的ミニディスクスペシャル
ATRACの周波数カット分析
Lab-03

(続)ATRACの周波数カット分析
異なるATRACバージョンでの再生検証

ご注意
 
ここに書かれている方法は、私こと「ぷわりす」が自己責任において行ったものであり、
各メーカーならびに各ホームページ関係者には一切関係有りません。
そのためご質問等がある場合は、私「ぷわりす」にお願いします。
 
また閲覧しているユーザさんが同様のことを行って発生したトラブルについては
私「ぷわりす」ならびに各メーカーには一切責任はありません。
自己責任で行って下さい。

1.はじめに

 ATRACが聞こえない音成分(周波数)をカットして音楽情報を圧縮(高能率符号化)
をしているのはもう皆さんご存じであろう。まぁこれが音楽をダメにしているとか、
歪みだ云々と言われるのはしかたありません。事実ですから。
 しかしこの圧縮において、特に言われるのが高音域の音について、キンキンしている
歪んでいるなどなど。では実際ATRACによってどの辺の高音域成分がカットされているのか?
また、カットされる周波数はどの辺なのかを分析してみたいと思います。

途中注釈がありますのでご注意下さい。


2.準備

・サンプル曲・・・宇多田ヒカル「First Love」より2曲目「Movin' on without you」
・使用ディスク・・・「TDK XA-PRO 60」
・使用デッキ・・・「MZ-1」「DM-9090」「DP-5090(CD Player)」
・サウンドカード・・・SoundTrack128 Ruby + Degital I/Oポート
・アナライズソフト・・・efu氏作成「WaveSpectra」
  


3.データ作成

Step1:CDからMDに録音
 これはいたって普通に録音。DP-5090から光ケーブルを用いてMZ-1およびDM-9090に
デジタル録音。光ケーブルを使用しているのは統一した転送方法にするためです。

Step2:CD、MDの音楽をパソコンに読み込み
 MD機器、CD機器を光ケーブルにてパソコンのサウンドカードに接続。
パソコンのレコーディングソフトを録音状態に、そしてCD、MDを再生状態にして
各音楽をWAVファイルに変換。

Data1:CDデッキ「DP-5090」からCDの音楽情報をWAVファイル化(比較用マスター)
    DP-5090→サウンドカード→WAVファイル

Data2:MZ-1(ATRAC1)によりエンコーディング、デコーディングされたデータ
    DP-5090→MZ-1→サウンドカード→WAVファイル

Data3:DM-9090(ATRAC4.5)によりエンコーディング、デコーディングされたデータ
    DP-5090→DM-9090→サウンドカード→WAVファイル

Step3:参考データとしてCDから直接WAVファイル、そしてMP3ファイルを作成
 参考としてCD-ROMプレイヤーから直接WAVファイルにしたものと、そのデータから
作成したMP3ファイルを作成。

Data4:もろぼし☆らむ氏作成「CD2WAV32」を用いて、WAVファイルを作成
    CD-ROM「JVC-W2010」→(CD2WAV32)→WAVファイル

Data5:データ4をもとに、某IIS利用の某ソフトにてMP3ファイル作成。
    それを再びWAVファイルの変換。
    WAVファイル→(IISのCODEC)→MP3ファイル→COOL96試用版→WAVファイル
 

まぁ手順等はともあれ、各データの特徴です。

Data1:データ1,2,3が同一条件になるようにサンプルしたCD直のデータ
Data2:ATRAC Version1により圧縮されたデータ
Data3:ATRAC Version4.5により圧縮されたデータ
Data4:PCレベルでのCD直のデータ
Data5:MP3データ

※なお、作成された音楽情報(WAVファイル)は音量(dB)など直CDデータとは異なり小さくなってしまいました。
※そのため、直CDデータもサウンドカード経由のWAVファイルと同じレベルにするために、音量を53%にしています。
※しかしスペクトルの形には影響しておらず、同一条件下と言うことで比較しております。
※説明上、dB値などは表示されているものを使用します。


4.各音楽情報を分析(その1:ATRAC)

 各WAVファイルを「WaveSpectra」にてスペクトル分析。サンプルしたタイミングは
曲開始から28秒後付近、「アァッ、アァッ」というコーラス部分、バックでタンバリンが
「シャン」と鳴る一瞬のところです。(このタンバリンは定期的に鳴っているものです)
CDをお持ちの方は是非確認してみて下さい。著作権的にデータをアップすることはありません。
また手動にてターゲットポイントを見つけているので「100%ジャストポイント」ではありません。

Data1:CD直のデータ

Data2:ATRAC Version1により圧縮されたデータ

Data3:ATRAC Version4.5により圧縮されたデータ

もう見たまんまですね。
12kHz付近の山がタンバリンの「シャン」と鳴った時に現れるものです。

 まずData1ですが、これはCDそのものデータですので20kHzまで十分なレベルを保っています。
20kHzを越えた辺りからレベルが落ち込んでいますが、それなりの傾斜です。

 さてさてData2ですが、これはATRAC Version 1エンコーディング、そして
デコーディングされた音楽データのスペクトルです。15kHzを越えた辺りからレベルが落ち、
情報がかなりカットされていることが分かります。15kHz〜22kHzまで-80dBほどありますが、
タンバリンの「シャン」があるためレベルが上がっているだけで、特に高音がない場合は
ほぼ-100dB以下になります。

 そしてData3になりますと、ATRAC Version 4.5エンコーディング、そして
デコーディングされた音楽データのスペクトルです。さすがに改善されているだけあって、
19kHzをちょっと越える辺りまで情報があります。17kHz付近の山、19kHz付近の山も
再現されています。しかし19kHzを越えた途端、レベルが一気に下がります。
かなり急な下がり方をしていますが、無理してこの音域のデータを伸ばすと完璧に
歪みを生みます。19kHz付近もよく見ると密集の度合いが薄いように見えますね。


5.各音楽情報を分析(その2:MP3)

 今話題!?のMP3。正確には「MPEG Audio Layer3」と言いますが、特に説明は
いりませんね。音楽データを10分の1(規格的には1/4〜1/20まで可能)にまでにする
音楽圧縮規格です。よくMDの音質と比較されるので、私も比較してみました。
ここではMP3がMDより優れている、いやMDの方が優れていると言うことではなく、
同じ高能率符号化技術を用いた圧縮方法であるため、高音域成分がどのようになっているのかを
検討するものです。決してMP3を否定および中傷するものではないとご理解下さい。

Data4:PCレベルでのCD直のデータ

Data5:MP3データ

 Data4はWAVファイル化の仕方が異なりますが、CDそのものデータです。
21kHz付近〜が多少異なりますが、全体的には同じものといえるでしょう。

 次にData5のMP3のスペクトルですが、16kHz以降がかなり特徴があるものになってます。
16kHzまではビックリするほどCD直データと同じスペクトルを描いており、CD音質に
迫ると言われるのが伺えます。さて16kHz以降ですが、17kHz19kHz各付近に突出した山が
現れています。そうですタンバリンが「シャン」と鳴ったときの山です。しかもこの山、
CD直データやATARC4.5などに現れる山とレベルが一緒なのです。これにはかなり関心
させられます。
 基本的にMP3の場合、16kHz以降はレベルが-100dB以下でした。しかし高音が鳴った瞬間
16kHz以降に山が発生するのです。つまり高音が無い場合は極力16kHz以下で情報を小さくし、
高音で16kHz以上が必要になったらデータとして取り入れると言う仕組みになっているようです。

MP3のデータは、エンコードソフト(アルゴリズム)によって大きく異なりますので、
違うエンコードプログラムによって作成された音楽データが、今回の同じスペクトル
になるとは限りませんのでご注意下さい。


6.結論及び考察
 
 ATRAC Version 1とVersion 4.5の違いは当たり前というか、流石というか、
この進歩はこの分析により目に見えて分かります。Version 1では15kHz以降は
ほとんど切り捨てられており、データとして残っていても全く耳には聞こえないレベルです。
Version 1ではキンキンする高音はほとんど見受けられません。正しくデータがないのでは
キンキンするところではありませんね。それ以前に全体の情報不足から来るスカスカ感
の方が耳に付きます。

 Version 4.5になると19kHzまで情報があるのでよりCDの音に近づいています。
しかし15kHzからは何となくスペクトルの密集度も薄くなり、多少情報不足感があります。
これがATRACの高バージョンになるとキンキンする高音の正体でしょう。
高音域を伸ばしたものの、高音域の「表現力」は良くなったが、やはり情報量の少なさが
影響して、立ち上がりの速い高音は違和感を感じてしまうのでしょう。
 
 さて特別比較のMP3ですが、意外な再現性に正直驚いています。
16kHzまではスペクトル的には他とほとんど変わりません。でもさすがに16kHz以降は
情報量が128kBであるが故に切り取らざる終えないのが分かります。しかし要所要所では
必要と思われる高音成分を取り入れ、なるべく違和感無く仕上げる工夫もあります。
「MDよりMP3の方が音がいい」と雑誌等で言われる(た?)ことがありますが、
MDもATRAC Version 1では完全に負けています。何せ15kHzから情報が無いのだから。
これではそう言われても仕方ありませんね。でもVersion 4.5では・・・。
まぁこれは比較しても仕方ないのでここまでに。
 

 この結果を見て「なぁーんだ。やっぱりMDはダメなんだ」「音が良くないんだ」と
思われる方もおられると思います。しかし私としては「MDの本当を知ってもらいたい」
この1点にあります。検索でMDのことを記述したページが偶に引っかかりますが、
なかなか良く書けているのもあれば、圧縮について完璧に間違った記述をしている
所もあります。MDに対する考えが依然ATRAC Version 1で止まったままなのです。
MDやATRACを否定するのは結構!でも嘘のまま否定するのは勘弁!と言うことです。

 これからATRACの開発がどのようになっていくのか分かりませんが、比較するのが
無理なぐらいなスペクトルが現れることを期待しつつ、この辺で締めさせてもらいます。

今後は「Type-R」、パイオニアの「ASRAC」やシャープ系ATRACの分析も行ってみようと思います
が、録音機が手元にありましゃぇーーん。購入もしくは録音したディスクを入手次第チェック!


7.分析等に使ったプログラム(LINK)

・efu氏作成、高速リアルタイム スペクトラムアナライザ!「WaveSpectra」
 http://www.ne.jp/asahi/fa/efu/
 
もろぼし☆らむ氏作成、音楽CDからWAVファイルに変換「CD2WAV32」
 
 



テクニカルのメニューへ