2022-01-01から1年間の記事一覧
Index Index 音声フレーム オーバーラップ フレームサイズ フレーム周期 分析窓・窓関数 ノイズが発生する原因 ハミング窓 (Hamming Window) とハニング窓 (Hanning Window) 参考 音声フレーム 音声解析における前処理のひとつ. 音声解析 前処理 yhayato1320…
Index Index 短時間フーリエ分析 フーリエ変換 目的 フーリエ変換が利用できる理由 フーリエ変換の種類 離散フーリエ変換 逆離散フーリエ変換 (Inverse Discrete Fourier Transform / IDFT) 高速フーリエ変換 (Fast Fourier Transform / FFT) スペクトル パ…
Index Index 音楽解析 アルゴリズム SingSong / 2023 タスク Music Generation Music Synthesing Msanii / 2023 Chord Recognition / コード認識 Online Beat Tracking Music Compression Visual Vibrometry Dual-Shutter / 2022 サービス・アプリケーション…
音響解析 #まとめ編 yhayato1320.hatenablog.com Index Index WAVE ファイル チャンク RIFF (リフ) チャンク fmt (フォーマット) チャンク / data (データ) チャンク 参考 WAVE ファイル 音データをコンピュータに記録する標準フォーマットには、さまざまな…
音響解析 #まとめ編 yhayato1320.hatenablog.com Index Index 音の高さ 周期 周波数 可聴域 メル尺度 参考 音の高さ 周期 音の高さは、波形の周期性から決まる. 波形の周期が長くなると、音は低くなり、 波形の周期が短くなると、音は高くなる. 周波数 周期…
音響解析 #まとめ編 yhayato1320.hatenablog.com Index Index アナログ - デジタル変換 / AD 変換 標本化・サンプリング 標本化周期 標本化周波数 標本 (サンプリング) 定理 量子化 性能 量子化精度 bit 参考 アナログ - デジタル変換 / AD 変換 音の波形は…
音響解析 #まとめ編 yhayato1320.hatenablog.com Index Index 複合音 周期的と非周期的 波形と周波数特性 (振幅スペクトル) 基音・上音 参考 複合音 純音以外の音. (周波数の異なる) 複数の純音 (=正弦波・サイン波) で構成された音を複合音という. 純音 正…
音響解析 #まとめ編 yhayato1320.hatenablog.com Index Index 正弦波 / サイン波 純音 波形と周波数特性 (振幅スペクトル) 参考 正弦波 / サイン波 最も単純な音として、正弦波 / サイン波がある. 時刻 を変数とするサイン関数によって、次のように定義でき…
Index Index 前処理 アナログ - デジタル変換 / AD 変換 ディザリング処理 直流成分除去 高域強調 音声フレーム 音声区間検出 参考 前処理 音声解析における前処理を記す. 音声解析 #まとめ編 yhayato1320.hatenablog.com アナログ - デジタル変換 / AD 変換…
Index Index 音声解析 タスク 回帰 Direction of Arrival Estimation Instance Search / 検索 Audio Dequantization / 逆量子化 音声分類 / Audio Classification Language Identification / 言語識別 Audio Tagging Semantic Segmentation / 領域分類 DeepF…
音響解析 yhayato1320.hatenablog.com Index Index 音圧 計算式 単位 音の強さ 音のレベル 音の強さのレベル 音圧レベル 参考 音圧 空気中を伝搬する音は、大気圧 を基準として、圧力が高くなったり、低くなったりする. この圧力の変化分を音圧 (Sound Press…
#まとめ編 一覧 yhayato1320.hatenablog.com Index Index 線形代数学 ベクトル 直線 方向ベクトル 法線ベクトル 平面 ベクトル空間 行列 逆行列と正則行列 階数 / Rank 行列式 特異値分解 / Singular Value Decomposition / SVD 線型空間 参考 書籍 動画 線…
#まとめ編 一覧 yhayato1320.hatenablog.com Index Index 音響と音声と音楽 / Sound・Audio・Music 音 純音 複合音 音波 音の伝搬 縦波 音圧 音速 音の知覚 音の三要素 音の大きさ 振幅 周波数 音の高さ 周期 周波数 音色 前処理 アナログ・デジタル変換 / A…
Index Index 乖離率 / Deviation Rate 実装 参考 乖離率 / Deviation Rate 金融時系列解析における、テクニカル分析の一つ. 乖離率 yhayato1320.hatenablog.com 実装 参考 【Pythonで株式投資】移動平均線乖離率を計算して「買われすぎ・売られ過ぎ」を判定…
Index Index 乖離率 / Deviation Rate 計算方法 見方 売買の判断 エンベロープ 実装編 参考 乖離率 / Deviation Rate 金融時系列解析における、テクニカル分析の一つ. テクニカル分析 #まとめ編 yhayato1320.hatenablog.com 計算方法 乖離率は、移動平均線か…
Index Index モーメンタム / Momentum 計算方法 見方 モーメンタム / Momentum 金融時系列解析における、テクニカル分析の一つ. テクニカル分析 #まとめ編 yhayato1320.hatenablog.com 計算方法 計算方法は、現在の価格から一定ぶんの前の価格を引く. モメン…
#まとめ編 一覧 yhayato1320.hatenablog.com Index Index 深層学習を利用した手法 参考 Web サイト 深層学習を利用した手法 テーブルデータ解析 yhayato1320.hatenablog.com 参考 Web サイト deep-table Revisiting Deep Learning Models for Tabular Data T…
Index Index Dual Attention Networks / DANs 参考 Dual Attention Networks / DANs VQA yhayato1320.hatenablog.com 参考 Dual Attention Networks for Multimodal Reasoning and Matching [2016] arxiv.org
Index Index Embedding and Similarity Networks 参考 Web サイト Embedding and Similarity Networks VSE++ yhayato1320.hatenablog.com Image Text Similarity yhayato1320.hatenablog.com 参考 Learning Two-Branch Neural Networks for Image-Text Match…
Index Index Order Embedding 参考 Web サイト Order Embedding VSE #まとめ編 yhayato1320.hatenablog.com 参考 Order-Embeddings of Images and Language [2015] arxiv.org Web サイト 論文読み.2 Order-Embeddings of Images And Language (ICLR 2016) qi…
Index Index Image Caption アルゴリズム BRNN CPTR / 2021 Re-ViLM AEC / Affective Explanation Captioning Affection / 2022 参考 Web サイト Image Caption 画像を入力とし、画像を説明するテキストを出力する. マルチモーダル #まとめ編 Vision-Languag…
Index Index VSE++ 損失関数 工夫 ソースコード 参考 Web サイト VSE++ VSE は、Image Caption と Visual Question Answering などで利用される考え. VSE #まとめ編 yhayato1320.hatenablog.com Image Caption yhayato1320.hatenablog.com VQA yhayato1320.h…
グラフ処理 yhayato1320.hatenablog.com Index Index Graph Embedding 従来のグラフ表現における課題 次元圧縮 グラフ構造に着目した Embedding 手法 ニューラルネットワークを利用した Embedding 手法 / GNN 参考 書籍 Graph Embedding Graph Embedding と…
Index Index グラフニューラルネットワーク / Graph Neural Network / GNN Graph Embedding 特性 手法・アルゴリズム Graph Neural Network / GNN GGS-NN Vision GNN グラフ畳み込み / Graph Convolutional Network / GCN Graph AutoEncoder Variational Gra…
Index Index CrowdHuman 参考 CrowdHuman 人間が映り込んでいる画像データセット. データセット #まとめ編 画像データ yhayato1320.hatenablog.com 人間の検出を目的としたデータセット. Training : 15000 Validation : 4370 Test : 5000 www.crowdhuman.org…
Index Index Image GPT ソースコード 実装 実行環境 実行 参考 pre training sampling 参考 Image GPT GPT のアルゴリズムを Image へ適用させた. Image GPT #アルゴリズム編 yhayato1320.hatenablog.com ソースコード openai / image-gpt pre training 不可…
Index Index Vision-Language Navigation アルゴリズム OVRL-V2 / 2023 テクニック・工夫 EnvEdit / 2022 参考 Web サイト Vision-Language Navigation 3D 環境内のエージェントに対して、テキストで指示をすることで、行動させるマルチモーダルなタスク. マ…
Index Index データ拡張 / Data Augmentation 画像における Data Augmentation Data Augmentation の手法 画像処理による Data Augmentation Mixup / 2017 Cutout / 2017 SamplePairing / 2018 CutMix / 2019 AugMix / 2019 深層学習を用いた Data Augmentat…
Index Index TransTrack Siamese Network を利用した Tracking by Detection の MOT Query-Key Mechanism を導入した SOT Query-Key Mechanism を MOT へ適用 Transformer (Attention) の導入 Method Architecture Object Detection 実装 参考 Web サイト Tr…
Index Index 画像データ 一般 MVImgNet / 2023 PARA / 2022 ドメイン特化 小売・ECサイト 身分証明証 / Lisence MIDV-500 タスク特化 Human Detection 異常検知 / Image Anomaly Detection スレテオ画像 参考 画像データ 画像処理に利用できるデータセットに…