オムライスの備忘録

数学・統計学・機械学習・プログラミングに関することを記す

【音声解析】タスク一覧 #まとめ編

Index

音声解析

タスク

  • Audio Signal Processing (Source Separation, Denoising, Classification, Recognition)

回帰

Direction of Arrival Estimation

Instance Search / 検索

Audio Dequantization / 逆量子化

音声分類 / Audio Classification

Language Identification / 言語識別

Audio Tagging

  • music tagging
  • acoustic scene classification
  • audio event classification

Semantic Segmentation / 領域分類

DeepFake Detection

Voice Anti-spoofing

Sound Event Detection

Audio declipping

Bird Classification

Vowel Classification

音声生成 / Audio Generation

Speech Synthesis / 音声合成

テキスト、唇の動きなどの他のモダリティから音声を生成するタスク.

Speech Enhancement / 音声強調

PAAPLoss / 2023

Voice Conversion / 音声変換

Text-To-Speech Synthesis / 読み上げ合成

Audio Source Separation / Speaker Separation / 話者分離

Audio captioning

Audio inpainting / 音声修復

Audio Denoising / ノイズ除去

Audio-Visual Synchronization

Audio Editing

AUDIT / 2023

参考

Web サイト