オムライスの備忘録

数学・統計学・機械学習・プログラミングに関することを記す

【音響解析】分野一覧 #まとめ編

Index

音響と音声と音楽 / Sound・Audio・Music



音には、2 種類の定義がある.

  • 弾性体を伝播する振動 / 音波
  • 音波により引き起こされる聴覚的感覚

純音

だた 1 つの周波数の正弦波 / サイン波からなる音.



複合音

純音以外の音.

(周波数の異なる) 複数の純音 (=正弦波・サイン波) で構成された音を複合音という.

音波

音波は、弾性体 の媒質を伝わる振動である.

音の伝搬

音波は、空気などの媒質の微小な部分 (媒質粒子) が振動し、 その振動が隣接する媒質粒子に次々に伝わることによって、媒質中を伝搬する.



媒質粒子は、それあが存在する位置のごく近傍で振動しているだけで、 媒質粒子そのものが移動して音波を伝播しているわけではない.

音波が伝搬している空間を音場 / Sound Field という.

一般に、媒質粒子の振動方向と波動の伝播方向が同じものを縦波、 媒質粒子の振動方向と波動の伝搬方向が直行しているものを横波という.

縦波

縦波には、ある時間についてみると、媒質粒子が互いに近づいて密度が高くなる点 (密) と 互いに離れて密度が低くなる点 (疎) が存在する.



このような縦波は、疎密波とも呼ばれる.

密になる場所は媒質の圧力が高くなり、疎になる場合は低くなる.

音圧

空気中を伝搬する音は、大気圧  p_{0} を基準として、圧力が高くなったり、低くなったりする.

この圧力の変化分を音圧 (Sound Pressure) といい、媒質粒子の運動速度を粒子速度 (Particale Velocity) という.

音速

音速は媒質によって異なる.

空気の音速に比べて、水の音速は 4 ~ 5 倍、鉄の音速は 15 ~ 20 倍である.

このような媒質中の音の伝版速度は、媒質の弾性率と密度で決まる.

音の知覚

人が音波を受信すると、音の大きさ高さ音色、方向、距離、広がり、響きの長さなど様々な感覚が生じる.

これらのそれぞれを要素感覚 (Elementary Sense) と呼ぶ.

また、人が音波を受けて知覚したものの総称を音像 (Sound Image) と呼ぶ.

音の三要素

  • 音の大きさ : 音圧、音の強さ
  • 音の高さ : 基本周波数
  • 音色 : 周波数特性

音の大きさ

振幅

音の大きさは、波形の振幅より決まる.

しかし、振幅が同じ波形でも、純音より複合音のほうが大きく聞こえる.

音の大きさは、波形を構成するサイン波の振幅の合計によって決定される.

周波数

また、周波数によって感度が異なる.

音の高さ

周期

音の高さは、波形の周期性から決まる.

波形の周期が長くなると、音は低くなり、 波形の周期が短くなると、音は高くなる.

周波数

周期と周波数は、逆数の関係にあるため、周波数特性 (線スペクトル・振幅スペクトル) を観察すると、 周波数が低くなると、音の高さは低くなり、 周波数が高くなると、音の高さは高くなる.

音色

音の大きさと高さ以外の特徴については、すべて音色と定義する.

前処理

アナログ・デジタル変換 / AD 変換

連続値から離散値に変換.

WAVE ファイル

計測した信号データを電子データとして保存.

分析区間

特徴量抽出

短時間フーリエ解析

タスク

Environmental Sound Classification

Sound Event Localization and Detection

Acoustic Novelty Detection

音声解析

音響データである、音声データを解析する.



音楽解析

音響データである、音楽データを解析する.



参考