オムライスの備忘録

数学・統計学・機械学習・プログラミングに関することを記す

2022-11-01から1ヶ月間の記事一覧

【深層学習】Trans GAN

Index Index Trans GAN 実装 参考 Web サイト 動画 Trans GAN GAN yhayato1320.hatenablog.com 実装 github.com 公式 参考 TransGAN: Two Pure Transformers Can Make One Strong GAN, and That Can Scale Up [2021] 3 Technical Approach: A Journey Toward…

【時系列解析】Generative Adversarial Network / GAN #まとめ編

Index Index Generative Adversarial Network / GAN Time GAN / 2019 Tad GAN / 2020 参考 Web サイト Generative Adversarial Network / GAN 時系列解析に GAN を用いた手法をまとめる. 時系列解析 深層学習を用いた手法 yhayato1320.hatenablog.com GAN #…

【音声解析】アルゴリズム #まとめ編

Index Index 音声解析におけるアルゴリズム DNN WaveNet / 2016 RNN Deep Speech / 2014 CNN Wav2letter / 2016 wav2vec /2019 wav2vec 2.0 / 2020 wav2vec-U / 2021 Attention ESPnet / 2018 ReazonSpeech / 2023 Whisper / 2022 WhisperX / 2023 Squeezefo…

【深層学習】GPT-J

GPT #まとめ編 yhayato1320.hatenablog.com Index Index GPT-J Hugging Face 参考 Web GPT-J GPT-3 のモデルのひとつ. github.com github Hugging Face huggingface.co Hugging Face 参考 Web A 6 Billion Parameter Autoregressive Language Model 公式パラ…

【音声解析】Speech Synthesis / 音声合成

Index Index Speech Synthesis / 音声合成 アルゴリズム 参考 Web サイト Speech Synthesis / 音声合成 テキスト、唇の動きなどの他のモダリティから音声を生成するタスク. アルゴリズム STATISTICAL PARAMETRIC SPEECH SYNTHESIS [2007] https://www.cs.cmu…

【音声解析】音声区間検出

音声解析 yhayato1320.hatenablog.com Index Index 音声区間検出 ゼロ交差率 (Zero Crossing Rate) 音声パワー (Speech Power) 信号対雑音比 (Signal-to-Noise Ration / SNR) 参考 音声区間検出 音声区間検出 (Voice Activity Detection / VAD) とは、音声認…

【音声解析】高域強調 / プリエンファシス

音声解析 yhayato1320.hatenablog.com Index Index 高域強調 / プリエンファシス 目的 処理内容 参考 高域強調 / プリエンファシス 目的 音声のパワー・大きさ (音圧) は、高域・高周波数帯域になるほど減衰する. そのため、それを補償するために、高域強調…

【音声解析】音韻と音素

音声解析 yhayato1320.hatenablog.com Index Index 音韻と音素 参考 音韻と音素 音声には、様々な情報が含まれているが、 音声認識では音韻 / Phoneme と音素 / Phone という情報を利用する. 音韻とは、ある言語における識別のために必要な最小な単位の集合.…

【音声解析】分析区間・音声フレーム

Index Index 音声フレーム オーバーラップ フレームサイズ フレーム周期 分析窓・窓関数 ノイズが発生する原因 ハミング窓 (Hamming Window) とハニング窓 (Hanning Window) 参考 音声フレーム 音声解析における前処理のひとつ. 音声解析 前処理 yhayato1320…

【音声解析】短時間フーリエ分析 #アルゴリズム編

Index Index 短時間フーリエ分析 フーリエ変換 目的 フーリエ変換が利用できる理由 フーリエ変換の種類 離散フーリエ変換 逆離散フーリエ変換 (Inverse Discrete Fourier Transform / IDFT) 高速フーリエ変換 (Fast Fourier Transform / FFT) スペクトル パ…

【音楽解析】分野一覧 #まとめ編

Index Index 音楽解析 アルゴリズム SingSong / 2023 タスク Music Generation Music Synthesing Msanii / 2023 Chord Recognition / コード認識 Online Beat Tracking Music Compression Visual Vibrometry Dual-Shutter / 2022 サービス・アプリケーション…

【音響解析】WAVE ファイル

音響解析 #まとめ編 yhayato1320.hatenablog.com Index Index WAVE ファイル チャンク RIFF (リフ) チャンク fmt (フォーマット) チャンク / data (データ) チャンク 参考 WAVE ファイル 音データをコンピュータに記録する標準フォーマットには、さまざまな…

【音響解析】音の高さ

音響解析 #まとめ編 yhayato1320.hatenablog.com Index Index 音の高さ 周期 周波数 可聴域 メル尺度 参考 音の高さ 周期 音の高さは、波形の周期性から決まる. 波形の周期が長くなると、音は低くなり、 波形の周期が短くなると、音は高くなる. 周波数 周期…

【音響解析】アナログ・デジタル変換 / AD 変換

音響解析 #まとめ編 yhayato1320.hatenablog.com Index Index アナログ - デジタル変換 / AD 変換 標本化・サンプリング 標本化周期 標本化周波数 標本 (サンプリング) 定理 量子化 性能 量子化精度 bit 参考 アナログ - デジタル変換 / AD 変換 音の波形は…

【音響解析】複合音

音響解析 #まとめ編 yhayato1320.hatenablog.com Index Index 複合音 周期的と非周期的 波形と周波数特性 (振幅スペクトル) 基音・上音 参考 複合音 純音以外の音. (周波数の異なる) 複数の純音 (=正弦波・サイン波) で構成された音を複合音という. 純音 正…

【音響解析】純音

音響解析 #まとめ編 yhayato1320.hatenablog.com Index Index 正弦波 / サイン波 純音 波形と周波数特性 (振幅スペクトル) 参考 正弦波 / サイン波 最も単純な音として、正弦波 / サイン波がある. 時刻 を変数とするサイン関数によって、次のように定義でき…

【音声解析】前処理 #まとめ編

Index Index 前処理 アナログ - デジタル変換 / AD 変換 ディザリング処理 直流成分除去 高域強調 音声フレーム 音声区間検出 参考 前処理 音声解析における前処理を記す. 音声解析 #まとめ編 yhayato1320.hatenablog.com アナログ - デジタル変換 / AD 変換…

【音声解析】タスク一覧 #まとめ編

Index Index 音声解析 タスク 回帰 Direction of Arrival Estimation Instance Search / 検索 Audio Dequantization / 逆量子化 音声分類 / Audio Classification Language Identification / 言語識別 Audio Tagging Semantic Segmentation / 領域分類 DeepF…

【音響解析】音圧・音の強さ・音のレベル

音響解析 yhayato1320.hatenablog.com Index Index 音圧 計算式 単位 音の強さ 音のレベル 音の強さのレベル 音圧レベル 参考 音圧 空気中を伝搬する音は、大気圧 を基準として、圧力が高くなったり、低くなったりする. この圧力の変化分を音圧 (Sound Press…

【線形代数学】分野一覧 #まとめ編

#まとめ編 一覧 yhayato1320.hatenablog.com Index Index 線形代数学 ベクトル 直線 方向ベクトル 法線ベクトル 平面 ベクトル空間 行列 逆行列と正則行列 階数 / Rank 行列式 特異値分解 / Singular Value Decomposition / SVD 線型空間 参考 書籍 動画 線…

【音響解析】分野一覧 #まとめ編

#まとめ編 一覧 yhayato1320.hatenablog.com Index Index 音響と音声と音楽 / Sound・Audio・Music 音 純音 複合音 音波 音の伝搬 縦波 音圧 音速 音の知覚 音の三要素 音の大きさ 振幅 周波数 音の高さ 周期 周波数 音色 前処理 アナログ・デジタル変換 / A…

【金融時系列解析】乖離率 / Deviation Rate #実装編

Index Index 乖離率 / Deviation Rate 実装 参考 乖離率 / Deviation Rate 金融時系列解析における、テクニカル分析の一つ. 乖離率 yhayato1320.hatenablog.com 実装 参考 【Pythonで株式投資】移動平均線乖離率を計算して「買われすぎ・売られ過ぎ」を判定…

【金融時系列解析】乖離率 / Deviation Rate #アルゴリズム編

Index Index 乖離率 / Deviation Rate 計算方法 見方 売買の判断 エンベロープ 実装編 参考 乖離率 / Deviation Rate 金融時系列解析における、テクニカル分析の一つ. テクニカル分析 #まとめ編 yhayato1320.hatenablog.com 計算方法 乖離率は、移動平均線か…

【金融時系列解析】モーメンタム / Momentum

Index Index モーメンタム / Momentum 計算方法 見方 モーメンタム / Momentum 金融時系列解析における、テクニカル分析の一つ. テクニカル分析 #まとめ編 yhayato1320.hatenablog.com 計算方法 計算方法は、現在の価格から一定ぶんの前の価格を引く. モメン…

【テーブル】分野一覧 #まとめ編

#まとめ編 一覧 yhayato1320.hatenablog.com Index Index 深層学習を利用した手法 参考 Web サイト 深層学習を利用した手法 テーブルデータ解析 yhayato1320.hatenablog.com 参考 Web サイト deep-table Revisiting Deep Learning Models for Tabular Data T…

【マルチモーダル】Dual Attention Networks / DANs

Index Index Dual Attention Networks / DANs 参考 Dual Attention Networks / DANs VQA yhayato1320.hatenablog.com 参考 Dual Attention Networks for Multimodal Reasoning and Matching [2016] arxiv.org

【マルチモーダル】Embedding and Similarity Networks

Index Index Embedding and Similarity Networks 参考 Web サイト Embedding and Similarity Networks VSE++ yhayato1320.hatenablog.com Image Text Similarity yhayato1320.hatenablog.com 参考 Learning Two-Branch Neural Networks for Image-Text Match…

【マルチモーダル】Order Embedding

Index Index Order Embedding 参考 Web サイト Order Embedding VSE #まとめ編 yhayato1320.hatenablog.com 参考 Order-Embeddings of Images and Language [2015] arxiv.org Web サイト 論文読み.2 Order-Embeddings of Images And Language (ICLR 2016) qi…

【マルチモーダル】Image Caption

Index Index Image Caption アルゴリズム BRNN CPTR / 2021 Re-ViLM AEC / Affective Explanation Captioning Affection / 2022 参考 Web サイト Image Caption 画像を入力とし、画像を説明するテキストを出力する. マルチモーダル #まとめ編 Vision-Languag…

【マルチモーダル】VSE++

Index Index VSE++ 損失関数 工夫 ソースコード 参考 Web サイト VSE++ VSE は、Image Caption と Visual Question Answering などで利用される考え. VSE #まとめ編 yhayato1320.hatenablog.com Image Caption yhayato1320.hatenablog.com VQA yhayato1320.h…