オムライスの備忘録

数学・統計学・機械学習・プログラミングに関することを記す

2022-01-01から1年間の記事一覧

【音声解析】分析区間・音声フレーム

Index Index 音声フレーム オーバーラップ フレームサイズ フレーム周期 分析窓・窓関数 ノイズが発生する原因 ハミング窓 (Hamming Window) とハニング窓 (Hanning Window) 参考 音声フレーム 音声解析における前処理のひとつ. 音声解析 前処理 yhayato1320…

【音声解析】短時間フーリエ分析 #アルゴリズム編

Index Index 短時間フーリエ分析 フーリエ変換 目的 フーリエ変換が利用できる理由 フーリエ変換の種類 離散フーリエ変換 逆離散フーリエ変換 (Inverse Discrete Fourier Transform / IDFT) 高速フーリエ変換 (Fast Fourier Transform / FFT) スペクトル パ…

【音楽解析】分野一覧 #まとめ編

Index Index 音楽解析 アルゴリズム SingSong / 2023 タスク Music Generation Music Synthesing Msanii / 2023 Chord Recognition / コード認識 Online Beat Tracking Music Compression Visual Vibrometry Dual-Shutter / 2022 サービス・アプリケーション…

【音響解析】WAVE ファイル

音響解析 #まとめ編 yhayato1320.hatenablog.com Index Index WAVE ファイル チャンク RIFF (リフ) チャンク fmt (フォーマット) チャンク / data (データ) チャンク 参考 WAVE ファイル 音データをコンピュータに記録する標準フォーマットには、さまざまな…

【音響解析】音の高さ

音響解析 #まとめ編 yhayato1320.hatenablog.com Index Index 音の高さ 周期 周波数 可聴域 メル尺度 参考 音の高さ 周期 音の高さは、波形の周期性から決まる. 波形の周期が長くなると、音は低くなり、 波形の周期が短くなると、音は高くなる. 周波数 周期…

【音響解析】アナログ・デジタル変換 / AD 変換

音響解析 #まとめ編 yhayato1320.hatenablog.com Index Index アナログ - デジタル変換 / AD 変換 標本化・サンプリング 標本化周期 標本化周波数 標本 (サンプリング) 定理 量子化 性能 量子化精度 bit 参考 アナログ - デジタル変換 / AD 変換 音の波形は…

【音響解析】複合音

音響解析 #まとめ編 yhayato1320.hatenablog.com Index Index 複合音 周期的と非周期的 波形と周波数特性 (振幅スペクトル) 基音・上音 参考 複合音 純音以外の音. (周波数の異なる) 複数の純音 (=正弦波・サイン波) で構成された音を複合音という. 純音 正…

【音響解析】純音

音響解析 #まとめ編 yhayato1320.hatenablog.com Index Index 正弦波 / サイン波 純音 波形と周波数特性 (振幅スペクトル) 参考 正弦波 / サイン波 最も単純な音として、正弦波 / サイン波がある. 時刻 を変数とするサイン関数によって、次のように定義でき…

【音声解析】前処理 #まとめ編

Index Index 前処理 アナログ - デジタル変換 / AD 変換 ディザリング処理 直流成分除去 高域強調 音声フレーム 音声区間検出 参考 前処理 音声解析における前処理を記す. 音声解析 #まとめ編 yhayato1320.hatenablog.com アナログ - デジタル変換 / AD 変換…

【音声解析】タスク一覧 #まとめ編

Index Index 音声解析 タスク 回帰 Direction of Arrival Estimation Instance Search / 検索 Audio Dequantization / 逆量子化 音声分類 / Audio Classification Language Identification / 言語識別 Audio Tagging Semantic Segmentation / 領域分類 DeepF…

【音響解析】音圧・音の強さ・音のレベル

音響解析 yhayato1320.hatenablog.com Index Index 音圧 計算式 単位 音の強さ 音のレベル 音の強さのレベル 音圧レベル 参考 音圧 空気中を伝搬する音は、大気圧 を基準として、圧力が高くなったり、低くなったりする. この圧力の変化分を音圧 (Sound Press…

【線形代数学】分野一覧 #まとめ編

#まとめ編 一覧 yhayato1320.hatenablog.com Index Index 線形代数学 ベクトル 直線 方向ベクトル 法線ベクトル 平面 ベクトル空間 行列 逆行列と正則行列 階数 / Rank 行列式 特異値分解 / Singular Value Decomposition / SVD 線型空間 参考 書籍 動画 線…

【音響解析】分野一覧 #まとめ編

#まとめ編 一覧 yhayato1320.hatenablog.com Index Index 音響と音声と音楽 / Sound・Audio・Music 音 純音 複合音 音波 音の伝搬 縦波 音圧 音速 音の知覚 音の三要素 音の大きさ 振幅 周波数 音の高さ 周期 周波数 音色 前処理 アナログ・デジタル変換 / A…

【金融時系列解析】乖離率 / Deviation Rate #実装編

Index Index 乖離率 / Deviation Rate 実装 参考 乖離率 / Deviation Rate 金融時系列解析における、テクニカル分析の一つ. 乖離率 yhayato1320.hatenablog.com 実装 参考 【Pythonで株式投資】移動平均線乖離率を計算して「買われすぎ・売られ過ぎ」を判定…

【金融時系列解析】乖離率 / Deviation Rate #アルゴリズム編

Index Index 乖離率 / Deviation Rate 計算方法 見方 売買の判断 エンベロープ 実装編 参考 乖離率 / Deviation Rate 金融時系列解析における、テクニカル分析の一つ. テクニカル分析 #まとめ編 yhayato1320.hatenablog.com 計算方法 乖離率は、移動平均線か…

【金融時系列解析】モーメンタム / Momentum

Index Index モーメンタム / Momentum 計算方法 見方 モーメンタム / Momentum 金融時系列解析における、テクニカル分析の一つ. テクニカル分析 #まとめ編 yhayato1320.hatenablog.com 計算方法 計算方法は、現在の価格から一定ぶんの前の価格を引く. モメン…

【テーブル】分野一覧 #まとめ編

#まとめ編 一覧 yhayato1320.hatenablog.com Index Index 深層学習を利用した手法 参考 Web サイト 深層学習を利用した手法 テーブルデータ解析 yhayato1320.hatenablog.com 参考 Web サイト deep-table Revisiting Deep Learning Models for Tabular Data T…

【マルチモーダル】Dual Attention Networks / DANs

Index Index Dual Attention Networks / DANs 参考 Dual Attention Networks / DANs VQA yhayato1320.hatenablog.com 参考 Dual Attention Networks for Multimodal Reasoning and Matching [2016] arxiv.org

【マルチモーダル】Embedding and Similarity Networks

Index Index Embedding and Similarity Networks 参考 Web サイト Embedding and Similarity Networks VSE++ yhayato1320.hatenablog.com Image Text Similarity yhayato1320.hatenablog.com 参考 Learning Two-Branch Neural Networks for Image-Text Match…

【マルチモーダル】Order Embedding

Index Index Order Embedding 参考 Web サイト Order Embedding VSE #まとめ編 yhayato1320.hatenablog.com 参考 Order-Embeddings of Images and Language [2015] arxiv.org Web サイト 論文読み.2 Order-Embeddings of Images And Language (ICLR 2016) qi…

【マルチモーダル】Image Caption

Index Index Image Caption アルゴリズム BRNN CPTR / 2021 Re-ViLM AEC / Affective Explanation Captioning Affection / 2022 参考 Web サイト Image Caption 画像を入力とし、画像を説明するテキストを出力する. マルチモーダル #まとめ編 Vision-Languag…

【マルチモーダル】VSE++

Index Index VSE++ 損失関数 工夫 ソースコード 参考 Web サイト VSE++ VSE は、Image Caption と Visual Question Answering などで利用される考え. VSE #まとめ編 yhayato1320.hatenablog.com Image Caption yhayato1320.hatenablog.com VQA yhayato1320.h…

【グラフ処理】Graph Embedding

グラフ処理 yhayato1320.hatenablog.com Index Index Graph Embedding 従来のグラフ表現における課題 次元圧縮 グラフ構造に着目した Embedding 手法 ニューラルネットワークを利用した Embedding 手法 / GNN 参考 書籍 Graph Embedding Graph Embedding と…

【深層学習】グラフニューラルネットワーク #まとめ編

Index Index グラフニューラルネットワーク / Graph Neural Network / GNN Graph Embedding 特性 手法・アルゴリズム Graph Neural Network / GNN GGS-NN Vision GNN グラフ畳み込み / Graph Convolutional Network / GCN Graph AutoEncoder Variational Gra…

【データセット】CrowdHuman

Index Index CrowdHuman 参考 CrowdHuman 人間が映り込んでいる画像データセット. データセット #まとめ編 画像データ yhayato1320.hatenablog.com 人間の検出を目的としたデータセット. Training : 15000 Validation : 4370 Test : 5000 www.crowdhuman.org…

【深層学習】Image GPT / iGPT #実装編

Index Index Image GPT ソースコード 実装 実行環境 実行 参考 pre training sampling 参考 Image GPT GPT のアルゴリズムを Image へ適用させた. Image GPT #アルゴリズム編 yhayato1320.hatenablog.com ソースコード openai / image-gpt pre training 不可…

【マルチモーダル】Vision-Language Navigation

Index Index Vision-Language Navigation アルゴリズム OVRL-V2 / 2023 テクニック・工夫 EnvEdit / 2022 参考 Web サイト Vision-Language Navigation 3D 環境内のエージェントに対して、テキストで指示をすることで、行動させるマルチモーダルなタスク. マ…

【画像処理】データ拡張 / Data Augmentation #まとめ編

Index Index データ拡張 / Data Augmentation 画像における Data Augmentation Data Augmentation の手法 画像処理による Data Augmentation Mixup / 2017 Cutout / 2017 SamplePairing / 2018 CutMix / 2019 AugMix / 2019 深層学習を用いた Data Augmentat…

【深層学習】TransTrack

Index Index TransTrack Siamese Network を利用した Tracking by Detection の MOT Query-Key Mechanism を導入した SOT Query-Key Mechanism を MOT へ適用 Transformer (Attention) の導入 Method Architecture Object Detection 実装 参考 Web サイト Tr…

【データセット】画像処理 #まとめ編

Index Index 画像データ 一般 MVImgNet / 2023 PARA / 2022 ドメイン特化 小売・ECサイト 身分証明証 / Lisence MIDV-500 タスク特化 Human Detection 異常検知 / Image Anomaly Detection スレテオ画像 参考 画像データ 画像処理に利用できるデータセットに…