オムライスの備忘録

数学・統計学・機械学習・プログラミングに関することを記す

このブログについて

このブログでは、数学・統計学機械学習・プログラミングに関した記事を記していきます. 基本的には、私的な勉強のアウトプット / メモを目的としていますが、できるだけ整理して書いていきます. また、記事ごとのテーマ(「最小二乗法」、「確率」など)は明確にして、 「#アルゴリズム」、「#実装編」のような表記で内容を分割して書いていきます.

まとめページ

記事には「#まとめ編」と題しまして、あるテーマに沿った記事が複数書きましたら、 後から読みやすいようにするために、記事をまとめたページを作成しております.

以下、作成したまとめページです.

理論分野

数学 / 分野一覧 #まとめ編 yhayato1320.hatenablog.com
線形代数 / 分野一覧 #まとめ編 yhayato1320.hatenablog.com

数理最適化

分野一覧 #まとめ編 yhayato1320.hatenablog.com

統計学

統計学・確率 #まとめ編 yhayato1320.hatenablog.com
ベイズ統計学 #まとめ編 yhayato1320.hatenablog.com
回帰分析 #まとめ編 yhayato1320.hatenablog.com

機械学習

分野一覧 #まとめ編 yhayato1320.hatenablog.com
Algorithm / Decision Tree
#まとめ編
yhayato1320.hatenablog.com
Technique / 識別関数
#まとめ編
yhayato1320.hatenablog.com
Technique / データ分割
#まとめ編
yhayato1320.hatenablog.com
Technique / Ensemble Learning
#まとめ編
yhayato1320.hatenablog.com
Technique / Data Augmentation
#まとめ編
yhayato1320.hatenablog.com
Technique / パラメータ推定法
#まとめ編
yhayato1320.hatenablog.com
Technique / モデル評価
#まとめ編
yhayato1320.hatenablog.com
Technique / 類似度
#まとめ編
yhayato1320.hatenablog.com

深層学習

分野一覧 #まとめ編 yhayato1320.hatenablog.com
Skip Layer Connection #まとめ編 yhayato1320.hatenablog.com
Metric Learning / Distance Learning
#まとめ編
yhayato1320.hatenablog.com
Auto Regression Model / 自己回帰モデル
#まとめ編
yhayato1320.hatenablog.com
タスク一覧 #まとめ編 yhayato1320.hatenablog.com
生成モデル #まとめ編 yhayato1320.hatenablog.com

Convolutional Neural Network / CNN

Convolutional Neural Network / CNN #まとめ編 yhayato1320.hatenablog.com
PixelCNN #まとめ編 yhayato1320.hatenablog.com
Darknet #まとめ編 yhayato1320.hatenablog.com

Recurrent Neural Network / RNN

Attention

深層学習
Attention #まとめ編
yhayato1320.hatenablog.com
画像処理
Attention #まとめ編
yhayato1320.hatenablog.com

Transformer

深層学習
Transformer #まとめ編
yhayato1320.hatenablog.com
深層学習
BERT #まとめ編
yhayato1320.hatenablog.com
深層学習
GPT #まとめ編
yhayato1320.hatenablog.com
深層学習
XLM #まとめ編
yhayato1320.hatenablog.com

データ分野

データセット #まとめ編 yhayato1320.hatenablog.com
時系列データセット #まとめ編 yhayato1320.hatenablog.com

系列データ

自然言語処理

自然言語処理 / 分野一覧 #まとめ編 yhayato1320.hatenablog.com
自然言語処理 / 分散表現 #まとめ編 yhayato1320.hatenablog.com
自然言語処理 / 文章生成 #まとめ編 yhayato1320.hatenablog.com
自然言語処理 / LLM #まとめ編 yhayato1320.hatenablog.com
自然言語処理 / Transformer #まとめ編 yhayato1320.hatenablog.com

音響解析

音響解析 / 分野一覧 #まとめ編 yhayato1320.hatenablog.com
音声解析 / 分野一覧 #まとめ編 yhayato1320.hatenablog.com

時系列解析

時系列解析 / 分野一覧 #まとめ編 yhayato1320.hatenablog.com
金融時系列解析 / 分野一覧 #まとめ編 yhayato1320.hatenablog.com

画像処理

画像処理 / 分野一覧 #まとめ編 yhayato1320.hatenablog.com
画像処理 / Attention #まとめ編 yhayato1320.hatenablog.com
画像処理 / タスク一覧 #まとめ編 yhayato1320.hatenablog.com

物体認識 / 画像分類

画像処理 / 物体認識
#まとめ編
yhayato1320.hatenablog.com

物体検出 / Object Detection

画像処理 / 物体検出
#まとめ編 #00
yhayato1320.hatenablog.com
画像処理 / 物体検出
#まとめ編 #01 (#実装編)
yhayato1320.hatenablog.com
機械学習 / 物体検出 #まとめ編 yhayato1320.hatenablog.com
深層学習 / 物体検出
#まとめ編 #00
yhayato1320.hatenablog.com
深層学習 / 物体検出
#まとめ編 #01 (CNN)
yhayato1320.hatenablog.com
深層学習 / 物体検出 / YOLO
#まとめ編
yhayato1320.hatenablog.com
深層学習 / 物体検出
#まとめ編 #02 (Attention)
yhayato1320.hatenablog.com

グラフ / Graph

分野一覧 yhayato1320.hatenablog.com
Graph Embedding yhayato1320.hatenablog.com

テーブル / Tabular

点群処理 / 3D解析

分野一覧 #まとめ編 yhayato1320.hatenablog.com
NeRF #まとめ編 yhayato1320.hatenablog.com

複合データ

  • 動画像処理

動画像処理

時系列解析 x 画像処理



分野一覧 #まとめ編 yhayato1320.hatenablog.com
物体追跡 #まとめ編 yhayato1320.hatenablog.com

3D Video / 4D

時系列解析 x 点群処理

Multi-tile Video / MTV / 2023

  • 3D Video Loops from Asynchronous Input

マルチモーダル

分野一覧 #まとめ編 yhayato1320.hatenablog.com
Vision Language #まとめ編 yhayato1320.hatenablog.com
Natural Language Supervision
#まとめ編
yhayato1320.hatenablog.com
CLIP
#まとめ編
yhayato1320.hatenablog.com

タスク

【マルチモーダル】Dense Captioning

Index

Dense Captioning

アルゴリズム

GRiT / 2022

  • GRiT: A Generative Region-to-text Transformer for Object Understanding

ControlCap / 2024

  • ControlCap: Controllable Region-level Captioning

データセット / ベンチマーク

Visual Genome / 2016

参考

Web ページ

【データセット】Flickr30k

Index

Flickr30k

画像と説明文のマルチモーダルなデータセット.

利用手段

Kaggle Dataset / torch vision でも利用できる.

video を作ってみたよ!

www.kaggle.com

参考

  • From image descriptions to visual denotations: New similarity metrics for semantic inference over event descriptions

  • Flickr30k entities: Collecting region-to-phrase correspondences for richer image-to-sentence models

  • paperswithcode.com

    • paper with code のデータのページ

Web サイト

【深層学習】DINO #まとめ編

Index

DINO

DINO v2 / 2023

Stable-DINO / 2023

Grounding DINO / 2023

GLIP + DINO



  • Grounding DINO: Marrying DINO with Grounded Pre-Training for Open-Set Object Detection

  • 論文まとめ:Grounding DINO: Marrying DINO with Grounded Pre-Training for Open-Set Object Detection

【マルチモーダル】Phrase Grounding

Index

Phrase Grounding

文章中のフレーズ・単語が、画像中のどの領域に対応するかを推定するマルチモーダルのタスク.

アルゴリズム

GLIP / 2021

GLIP v2 / 2022

  • GLIPv2: Unifying Localization and Vision-Language Understanding

参考

【深層学習】Scaleformer

Index

Crossformer

Transormer を利用した、時系列の予測モデル.

いくつかの工夫をしている.

  • Multi Scale Framework
  • Cross-Scale Normalization

参考

  • Scaleformer: Iterative Multi-scale Refining Transformers for Time Series Forecasting
    • [2022]
    • Abstract
    • 3 METHOD
      • 3.2 MULTI-SCALE FRAMEWORK
      • 3.3 CROSS-SCALE NORMALIZATION
    • arxiv.org

【深層学習】Crossformer

Index

Crossformer

Transormer を利用した、時系列の予測モデル.

いくつかの工夫をしている.

  • Dimension Segment Wise (DSW) Embedding
  • Two-Stage Attention (TSA)
    • Cross-Time Stage
    • Cross-Dimension Stage
  • Hierarchical Encoder-Decoder (HED)

参考

  • Crossformer: Transformer Utilizing Cross-Dimension Dependency for Multivariate Time Series Forecasting
    • [2023]
    • Abstract
    • 3 METHODOLOGY
      • 3.1 DIMENSION-SEGMENT-WISE EMBEDDING
      • 3.2 TWO-STAGE ATTENTION LAYER
        • Cross-Time Stage
        • Cross-Dimension Stage
      • 3.3 HIERARCHICAL ENCODER-DECODE
    • openreview.net