HOME > 解説
 
音声合成に使われる用語

【 ADPCM 】

 ADPCM(Adaptive Differential Pulse Code Modulation) は,音声データを圧縮する手法の1つです。音声信号をデジタルデータに置き換えるとき、サンプリングされたデータの1つを見ると、直前のデータと大きな差がありません。直後のサンプリング時の音の強さはある程度予測できるので、PCM のデータから、直前のデータとの差をとり、実測値と予測値との差分だけを量子化(デジタル化)すれば、音質を損なうことなくデータ量を圧縮する ことができます。データを圧縮することで、容量が同じでも、より長時間の録音ができます。これが ADPCM方式 です。非可逆的な圧縮なので、厳密には若干音質が劣化する場合もあり、原音を完全に再現することはできませんが、同一の量子化 bit ( ビット ) 数の場合、PCM よりも ADPCM のほうがはるかに音質は良くなります。しかし、データの予測が必要なので演算量が増加し、録音/再生の回路は複雑になります。ちなみに、現在、PHSの通話には ビットレート 32KbpsのADPCM方式が使われています。
 アローシリーズ音声合成警報器 のADPCMは、量子化幅をサンプリング毎に基本となる量子化幅に合わせて変化させ、3〜4bitのデータに符号化することにより、音声波形の追従性を一層高めたものです。 例えば4bitADPCMの場合、上位1bitが極性(差分の増減)のデータになり、下位3bitで基本となる量子化幅を何倍にするか決定します。この方式はデータ構成が簡単な割に良い音質が得られるとともに、音声の作成が容易であるという長所があります。但し、一概にADPCMといっても他メーカ品との互換性はありませんので注意が必要です。



【 ADM 】

 一定量の量子化幅の増減により音声波形を表すDM( Delta Modulation)方式では追従できない、音声波形が急激に変化する場合に対応するために、サンプリング毎に量子化幅を適応的に変化させながら、1ビットの符号化をするのが ADM(Adaptive Delta Modulation)方式です。量子化する時に、1または0のデータが連続すれば、早く追従するように量子化幅を大きくしていくので、DM方式より元の波形に近いデータが得られます。また、1回のサンプリングで、1bitしか使用しないので、コンパクトなデータになります。



【 ビットレート 】

 ビットレートとは量子化したときの情報量を表すもので、 1秒間の音を録音するのに何ビットのデータ量が必要かを示しています。単位は、bps(bit/second)です。パソコンなどでは、ビットレートではなく、サンプリング周波数で表すことが多いです。アナログデータである音声をデジタルデータに変換する際に、どれだけ細かく分割(符号化)するかを示すものがサンプリング周波数です。
 アローシリーズ音声合成警報器で標準の16kHzの場合 、 1 / 16,000 秒毎に1回データを取り出しています(サンプリング)。また、アローシリーズ音声合成警報器の多くは4bitADPCMを採用しています。
サンプリング1回あたり4bitのデータ量が必要となるので、
16kHz×4bit=64kbps
アローシリーズ音声合成警報器の標準のビットレートは64kbpsとなります。
音声の記憶時間はメモリ(ROM)容量とビットレートで決まり、
合成(録音)時間[秒]=(1.024 (※1) ×メモリ容量[Kbit])÷ビットレート[kbps]
で表され、アローシリーズ音声合成警報器の標準の容量が1 Mbit ( メガビット ) のROMに、ビットレート64kbpsで録音すると、
(1.024×1000kbit)÷64kbps=16秒
よって16秒が標準の録音時間となります。
 同じROM容量の時、ビットレートは低ければ低いほど合成時間が長くなりますが、反面、音声波形への追従性が悪くなり、音質は劣化していきます。

(※1) マイコンは、16進数で数字を扱いますので、10進数に変換するために1.024倍します。



【 ビット 】


 bit ( ビット ) とは、コンピュータなどが扱う2進数のデータの最小単位で、“0”または、“1”の1桁分が1bitです。
アローシリーズ音声合成警報器や電子音警報器では、録音されたデータの容量を表すときと、制御方法を表すときに使います。ビット入力とは、信号線1本に対し、1つの音色が設定されていて、ONされればその音が吹鳴する物です。ビット入力に対して、バイナリ入力は、信号線の本数以上のchを切り替えるために、4本、6本、または8本の信号線(端子)を使い、それぞれを2進数の4、6、または8桁に見立て、同時にONされている信号線からch番号を割り出し吹鳴するものです。



【 PCM 】


 PCM(Pulse Code Modulation)は,アナログの音響信号をデジタルデータで表現するための代表的な 符号化 方式 の1つです 。 アナログ信号を、 A/D 変換することでデジタル化(記録)し、再生するときに D/A 変換してアナログ信号を取り出します。
具体的には、アナログ信号( 音)について、短い一定時間毎に音の強さを測定(サンプリング)し、その強さを量子化 (デジタル化)します。このとき、1秒間に測定する回数のことを サンプリング周波数 、強さを数値化する時の細かさを 量子化 bit数 と言い、データの音質が決定されます。 両者とも大きい方が音質は良くなりますが、データ量は増大します。このデータを圧縮せずに信号レベルをそのままデジタルデータで表したのが PCM です。なお、サンプリング周波数は周波数持性に,量子化ビットはダイナミックレンジに大きく影響します。

 音楽 CDには、サンプリング周波数44.1KHz、量子化16bitのPCMが使われています。パソコンで使われるWAVE形式のPCM録音では、これらの数値を変更することも可能です。アナログ方式では電気信号をそのまま物理量に変換する為、例えば高い周波数の音はカセットテープに記録されにくいなど、記録媒体の特性により本来の量の変化から異なることがあり、記録する内容の範囲に限度があります。しかし、デジタル方式では符号化する為、例えば“10”という数は誰が見ても“10”であるというように記録媒体の特性に直接関係なく記録できるメリットがあります。このような理由で、最近ではCDやDAT、MD、パソコンの音源、携帯電話など、デジタル方式を採用する機器が増えています。このデジタル方式の基本がPCM方式です。

■アナログ音


■PCM形式でデジタル化した音

この様にして音声を数値データに変換して記録する事を《音声分析》といい、アローシリーズ音声合成警報器ではEPROMというメモリーICに記録しています。
また、アローシリーズ音声合成警報器の再生器ではEPROMに記録 されたデータから元の音声を再現しますがこれを《音声合成》といいます。