Index
音声解析
音声解析 #まとめ編
タスク #まとめ編
タスク
- Audio Signal Processing (Source Separation, Denoising, Classification, Recognition)
回帰
Direction of Arrival Estimation
Instance Search / 検索
Audio Dequantization / 逆量子化
音声分類 / Audio Classification
Language Identification / 言語識別
Audio Tagging
- music tagging
- acoustic scene classification
- audio event classification
Semantic Segmentation / 領域分類
DeepFake Detection
Voice Anti-spoofing
Sound Event Detection
Audio declipping
Bird Classification
Vowel Classification
音声生成 / Audio Generation
- Generating New Carnatic Music Patterns Using LSTM Neural Networks
Speech Synthesis / 音声合成
テキスト、唇の動きなどの他のモダリティから音声を生成するタスク.
- Speech Synthesis / 音声合成
Speech Enhancement / 音声強調
PAAPLoss / 2023
PAAPLoss: A Phonetic-Aligned Acoustic Parameter Loss for Speech Enhancement
- [2023]
- arxiv.org
Voice Conversion / 音声変換
- Voice Conversion / 音声変換
Text-To-Speech Synthesis / 読み上げ合成
Audio Source Separation / Speaker Separation / 話者分離
Audio captioning
Audio inpainting / 音声修復
Audio Denoising / ノイズ除去
Audio-Visual Synchronization
Audio Editing
AUDIT / 2023
- AUDIT: Audio Editing by Following Instructions with Latent Diffusion Models
- [2023]
- arxiv.org
- audit-demo.github.io
参考
Web サイト
- paperswithcode.com
- paper with code の audio の area のページ