2022-11-01から1ヶ月間の記事一覧
Index Index Trans GAN 実装 参考 Web サイト 動画 Trans GAN GAN yhayato1320.hatenablog.com 実装 github.com 公式 参考 TransGAN: Two Pure Transformers Can Make One Strong GAN, and That Can Scale Up [2021] 3 Technical Approach: A Journey Toward…
Index Index Generative Adversarial Network / GAN Time GAN / 2019 Tad GAN / 2020 参考 Web サイト Generative Adversarial Network / GAN 時系列解析に GAN を用いた手法をまとめる. 時系列解析 深層学習を用いた手法 yhayato1320.hatenablog.com GAN #…
Index Index 音声解析におけるアルゴリズム DNN WaveNet / 2016 RNN Deep Speech / 2014 CNN Wav2letter / 2016 wav2vec /2019 wav2vec 2.0 / 2020 wav2vec-U / 2021 Attention ESPnet / 2018 ReazonSpeech / 2023 Whisper / 2022 WhisperX / 2023 Squeezefo…
GPT #まとめ編 yhayato1320.hatenablog.com Index Index GPT-J Hugging Face 参考 Web GPT-J GPT-3 のモデルのひとつ. github.com github Hugging Face huggingface.co Hugging Face 参考 Web A 6 Billion Parameter Autoregressive Language Model 公式パラ…
Index Index Speech Synthesis / 音声合成 アルゴリズム 参考 Web サイト Speech Synthesis / 音声合成 テキスト、唇の動きなどの他のモダリティから音声を生成するタスク. アルゴリズム STATISTICAL PARAMETRIC SPEECH SYNTHESIS [2007] https://www.cs.cmu…
音声解析 yhayato1320.hatenablog.com Index Index 音声区間検出 ゼロ交差率 (Zero Crossing Rate) 音声パワー (Speech Power) 信号対雑音比 (Signal-to-Noise Ration / SNR) 参考 音声区間検出 音声区間検出 (Voice Activity Detection / VAD) とは、音声認…
音声解析 yhayato1320.hatenablog.com Index Index 高域強調 / プリエンファシス 目的 処理内容 参考 高域強調 / プリエンファシス 目的 音声のパワー・大きさ (音圧) は、高域・高周波数帯域になるほど減衰する. そのため、それを補償するために、高域強調…
音声解析 yhayato1320.hatenablog.com Index Index 音韻と音素 参考 音韻と音素 音声には、様々な情報が含まれているが、 音声認識では音韻 / Phoneme と音素 / Phone という情報を利用する. 音韻とは、ある言語における識別のために必要な最小な単位の集合.…
Index Index 音声フレーム オーバーラップ フレームサイズ フレーム周期 分析窓・窓関数 ノイズが発生する原因 ハミング窓 (Hamming Window) とハニング窓 (Hanning Window) 参考 音声フレーム 音声解析における前処理のひとつ. 音声解析 前処理 yhayato1320…
Index Index 短時間フーリエ分析 フーリエ変換 目的 フーリエ変換が利用できる理由 フーリエ変換の種類 離散フーリエ変換 逆離散フーリエ変換 (Inverse Discrete Fourier Transform / IDFT) 高速フーリエ変換 (Fast Fourier Transform / FFT) スペクトル パ…
Index Index 音楽解析 アルゴリズム SingSong / 2023 タスク Music Generation Music Synthesing Msanii / 2023 Chord Recognition / コード認識 Online Beat Tracking Music Compression Visual Vibrometry Dual-Shutter / 2022 サービス・アプリケーション…
音響解析 #まとめ編 yhayato1320.hatenablog.com Index Index WAVE ファイル チャンク RIFF (リフ) チャンク fmt (フォーマット) チャンク / data (データ) チャンク 参考 WAVE ファイル 音データをコンピュータに記録する標準フォーマットには、さまざまな…
音響解析 #まとめ編 yhayato1320.hatenablog.com Index Index 音の高さ 周期 周波数 可聴域 メル尺度 参考 音の高さ 周期 音の高さは、波形の周期性から決まる. 波形の周期が長くなると、音は低くなり、 波形の周期が短くなると、音は高くなる. 周波数 周期…
音響解析 #まとめ編 yhayato1320.hatenablog.com Index Index アナログ - デジタル変換 / AD 変換 標本化・サンプリング 標本化周期 標本化周波数 標本 (サンプリング) 定理 量子化 性能 量子化精度 bit 参考 アナログ - デジタル変換 / AD 変換 音の波形は…
音響解析 #まとめ編 yhayato1320.hatenablog.com Index Index 複合音 周期的と非周期的 波形と周波数特性 (振幅スペクトル) 基音・上音 参考 複合音 純音以外の音. (周波数の異なる) 複数の純音 (=正弦波・サイン波) で構成された音を複合音という. 純音 正…
音響解析 #まとめ編 yhayato1320.hatenablog.com Index Index 正弦波 / サイン波 純音 波形と周波数特性 (振幅スペクトル) 参考 正弦波 / サイン波 最も単純な音として、正弦波 / サイン波がある. 時刻 を変数とするサイン関数によって、次のように定義でき…
Index Index 前処理 アナログ - デジタル変換 / AD 変換 ディザリング処理 直流成分除去 高域強調 音声フレーム 音声区間検出 参考 前処理 音声解析における前処理を記す. 音声解析 #まとめ編 yhayato1320.hatenablog.com アナログ - デジタル変換 / AD 変換…
Index Index 音声解析 タスク 回帰 Direction of Arrival Estimation Instance Search / 検索 Audio Dequantization / 逆量子化 音声分類 / Audio Classification Language Identification / 言語識別 Audio Tagging Semantic Segmentation / 領域分類 DeepF…
音響解析 yhayato1320.hatenablog.com Index Index 音圧 計算式 単位 音の強さ 音のレベル 音の強さのレベル 音圧レベル 参考 音圧 空気中を伝搬する音は、大気圧 を基準として、圧力が高くなったり、低くなったりする. この圧力の変化分を音圧 (Sound Press…
#まとめ編 一覧 yhayato1320.hatenablog.com Index Index 線形代数学 ベクトル 直線 方向ベクトル 法線ベクトル 平面 ベクトル空間 行列 逆行列と正則行列 階数 / Rank 行列式 特異値分解 / Singular Value Decomposition / SVD 線型空間 参考 書籍 動画 線…
#まとめ編 一覧 yhayato1320.hatenablog.com Index Index 音響と音声と音楽 / Sound・Audio・Music 音 純音 複合音 音波 音の伝搬 縦波 音圧 音速 音の知覚 音の三要素 音の大きさ 振幅 周波数 音の高さ 周期 周波数 音色 前処理 アナログ・デジタル変換 / A…
Index Index 乖離率 / Deviation Rate 実装 参考 乖離率 / Deviation Rate 金融時系列解析における、テクニカル分析の一つ. 乖離率 yhayato1320.hatenablog.com 実装 参考 【Pythonで株式投資】移動平均線乖離率を計算して「買われすぎ・売られ過ぎ」を判定…
Index Index 乖離率 / Deviation Rate 計算方法 見方 売買の判断 エンベロープ 実装編 参考 乖離率 / Deviation Rate 金融時系列解析における、テクニカル分析の一つ. テクニカル分析 #まとめ編 yhayato1320.hatenablog.com 計算方法 乖離率は、移動平均線か…
Index Index モーメンタム / Momentum 計算方法 見方 モーメンタム / Momentum 金融時系列解析における、テクニカル分析の一つ. テクニカル分析 #まとめ編 yhayato1320.hatenablog.com 計算方法 計算方法は、現在の価格から一定ぶんの前の価格を引く. モメン…
#まとめ編 一覧 yhayato1320.hatenablog.com Index Index 深層学習を利用した手法 参考 Web サイト 深層学習を利用した手法 テーブルデータ解析 yhayato1320.hatenablog.com 参考 Web サイト deep-table Revisiting Deep Learning Models for Tabular Data T…
Index Index Dual Attention Networks / DANs 参考 Dual Attention Networks / DANs VQA yhayato1320.hatenablog.com 参考 Dual Attention Networks for Multimodal Reasoning and Matching [2016] arxiv.org
Index Index Embedding and Similarity Networks 参考 Web サイト Embedding and Similarity Networks VSE++ yhayato1320.hatenablog.com Image Text Similarity yhayato1320.hatenablog.com 参考 Learning Two-Branch Neural Networks for Image-Text Match…
Index Index Order Embedding 参考 Web サイト Order Embedding VSE #まとめ編 yhayato1320.hatenablog.com 参考 Order-Embeddings of Images and Language [2015] arxiv.org Web サイト 論文読み.2 Order-Embeddings of Images And Language (ICLR 2016) qi…
Index Index Image Caption アルゴリズム BRNN CPTR / 2021 Re-ViLM AEC / Affective Explanation Captioning Affection / 2022 参考 Web サイト Image Caption 画像を入力とし、画像を説明するテキストを出力する. マルチモーダル #まとめ編 Vision-Languag…
Index Index VSE++ 損失関数 工夫 ソースコード 参考 Web サイト VSE++ VSE は、Image Caption と Visual Question Answering などで利用される考え. VSE #まとめ編 yhayato1320.hatenablog.com Image Caption yhayato1320.hatenablog.com VQA yhayato1320.h…