オムライスの備忘録

数学・統計学・機械学習・プログラミングに関することを記す

2024-01-01から1年間の記事一覧

【深層学習】DreamBooth

Index Index DreamBooth 参考 Web サイト DreamBooth Text to Image #まとめ編 yhayato1320.hatenablog.com 特定の被写体の画像数枚を拡散モデルに学習させることで、特定の被写体を生成する方法を提案. 特定の被写体をモデルに埋め込みながら、拡散モデルが…

【深層学習】Deep Recurrent Attention Writer / DRAW

Index Index Deep Recurrent Attention Writer / DRAW 参考 Deep Recurrent Attention Writer / DRAW Text to Image #まとめ編 yhayato1320.hatenablog.com 参考 Generating Images from Captions with Attention [2015] arxiv.org

【深層学習】FCOS

Index Index FCOS 参考 Web サイト FCOS 物体検出 #まとめ編 yhayato1320.hatenablog.com 参考 FCOS: Fully Convolutional One-Stage Object Detection [2019] arxiv.org Web サイト 【深層学習】FCOS(物体検出)とは? accum33.com

【深層学習】CondInst

Index Index CondInst 諸定義 従来の手法を instance segmentation に適用する際の課題 この手法の工夫 この手法の狙い Network Architecture Controller Head Conditional Convolution 参考 Web サイト CondInst Instance Segmentation における手法の一つ.…

【深層学習】MAF-YOLO

Index Index MAF-YOLO / 2024 改善点 Macroscopic Architecture Global Heterogeneous Kernel Selection mechanism Multi-Branch Auxiliary FPN Superficial Assisted Fusion / SAF Advanced Assisted Fusion / AAF Re-parameterized Heterogeneous Efficien…

【動画像処理】動画生成 / Video Generation

Index Index 動画生成 / Video Generation タスク Text to Video Image to Video Video Synthesis 参考 動画生成 / Video Generation 動画像処理 #まとめ編 タスク一覧 yhayato1320.hatenablog.com タスク Text to Video Text to Video yhayato1320.hatenabl…

【深層学習】RepLKNet

Index Index RepLKNet 参考 RepLKNet CNN #まとめ編 yhayato1320.hatenablog.com 参考 Scaling Up Your Kernels to 31x31: Revisiting Large Kernel Design in CNNs [2022] 1 Introduction arxiv.org CNNのカーネルサイズは大きくするべきか? ai-scholar.te…

【深層学習】ConvNeXt

Index Index ConvNeXt ConvNeXt V2 / 2023 参考 ConvNeXt CNN #まとめ編 yhayato1320.hatenablog.com ConvNeXt V2 / 2023 ConvNeXt V2: Co-designing and Scaling ConvNets with Masked Autoencoders [2023] arxiv.org ConvNeXt に自己教師あり学習の MAE を…

【深層学習】YOLO v8

Index Index YOLO v8 参考 Web サイト YOLO v8 YOLO #まとめ編 yhayato1320.hatenablog.com 参考 アルゴリズムにおける論文はでていない. Real-Time Flying Object Detection with YOLOv8 [2023] arxiv.org Web サイト Ultralytics YOLOv8: State-of-the-Art…

【深層学習】Dynamic Convolution / CondConv

Index Index Dynamic Convolution / CondConv 参考 Web サイト Dynamic Convolution / CondConv 参考 CondConv CondConv: Conditionally Parameterized Convolutions for Efficient Inference [2019] arxiv.org Dynamic Convolution Dynamic Convolution: At…

【深層学習】GiraffeDet

Index Index GiraffeDet Architecture 参考 GiraffeDet Object Detection CNN を利用した手法 yhayato1320.hatenablog.com Architecture 参考 GiraffeDet: A Heavy-Neck Paradigm for Object Detection [2022] arxiv.org

【深層学習】RTMDet

Index Index RTMDet Architecture 工夫 Large Kernel Depth Wise Convolution Block について Balance of backbone and neck Head Shared detection head Instance segmentation Related Work Rotated object detection / RTMDet-R Dynamic Label Assignment…

【動画像処理】ByteTrack / BYTE

Index Index ByteTrack / BYTE アルゴリズム 検出された物体 (=追跡候補) を高スコアと低スコアに分ける すでに追跡している物体があれば、KF で次フレームにおける物体の位置を予測 参考 Web サイト ByteTrack / BYTE Tracking のアルゴリズムの一つ. 【動…

【深層学習】MobileNet #まとめ編

Index Index MobileNet V1 / 2017 V2 / 2018 V3 / 2019 V4 / 2024 参考 MobileNet Google が研究している実行効率におけるCNNネットワークアーキテクチャの改善手法. CNN #まとめ編 yhayato1320.hatenablog.com V1 / 2017 MobileNet V1 yhayato1320.hatenabl…

【深層学習】Xception

Index Index Xception 参考 Web サイト Xception CNN #まとめ編 yhayato1320.hatenablog.com 参考 Xception: Deep Learning with Depthwise Separable Convolutions [2016] arxiv.org Web サイト 【論文読み】Xception : Deep Learning with Depthwise Separ…

【深層学習】RepVGG

Index Index RepVGG モチベーション 工夫 Model Re-parameterization Winograd Convolution Architecture Training-time Re-param for Plain Inference-time Model 変換1 : Conv + BN -> Conv 変換2 : 1x1 conv, identity mapping -> 3x3 conv 変換3 : 3x3 c…

【深層学習】DyHead

Index Index DyHead 3 つの awareness Architecture 参考 Web サイト DyHead Object Detection #まとめ編 Attention を用いた手法 yhayato1320.hatenablog.com 3 つの awareness Scale-awareness Spatial-awareness Task-awareness Architecture 参考 Dynami…

【機械学習】Smooth L1 Loss

Index Index Smooth L1 Loss 参考 Smooth L1 Loss 機械学習などに利用される誤差関数 / 損失関数のひとつ. 誤差関数 / 損失関数 #まとめ編 yhayato1320.hatenablog.com 物体検出のFast R-CNNに利用されている. Fast R-CNN yhayato1320.hatenablog.com 参考 …

【機械学習】Huber損失 / Huber Loss

Index Index Huber損失 / Huber Loss 参考 Huber損失 / Huber Loss 機械学習などに利用される誤差関数 / 損失関数のひとつ. 誤差関数 / 損失関数 #まとめ編 yhayato1320.hatenablog.com 参考 [損失関数]Huber損失(Huber Loss)/Smooth L1 Lossとは? atm…

【機械学習】二乗平均平方根誤差 / Root Mean Squared Error / RMSE

Index Index 二乗平均平方根誤差 / Root Mean Squared Error / RMSE 参考 二乗平均平方根誤差 / Root Mean Squared Error / RMSE 機械学習などに利用される誤差関数 / 損失関数のひとつ. 誤差関数 / 損失関数 #まとめ編 yhayato1320.hatenablog.com 参考 【…

【機械学習】平均絶対誤差 / Mean Absolute Error / MAE / L1損失 / L1 Loss

Index Index 平均絶対誤差 / Mean Absolute Error / MAE / L1損失 / L1 Loss 参考 平均絶対誤差 / Mean Absolute Error / MAE / L1損失 / L1 Loss 機械学習などに利用される誤差関数 / 損失関数のひとつ. 誤差関数 / 損失関数 #まとめ編 yhayato1320.hatenab…

【深層学習】DINO

DINO #まとめ編 yhayato1320.hatenablog.com Index Index DINO Architecture 工夫点 Contrastive DeNoising Training Query Selection Look Forward Twice 参考 Web サイト DINO DETR の改善手法. DETR yhayato1320.hatenablog.com DETR with Improved deNoi…

【深層学習】GLIP v2

Index Index GLIP v2 Architecture Pre Training Loss Intra-Image Region-Word Alignment Loss Inter-Image Region-Word Contrastive Loss Label Propagation 参考 Web サイト GLIP v2 GLIP の改善手法. GLIP yhayato1320.hatenablog.com Phrase Grounding …

【深層学習】ViLD

Index Index ViLD Architecture Method Image Embedding Text Embedding Region Embedding Train / Loss Text Embedding と Region Embedding の関係 Image Embedding と Region Embedding の関係 Total Loss 参考 Web サイト ViLD Vision and Language know…

【深層学習】D3VAE

Index Index D3VAE 参考 Web サイト D3VAE VAE #まとめ編 yhayato1320.hatenablog.com Diffusion Model #まとめ編 yhayato1320.hatenablog.com 参考 Generative Time Series Forecasting with Diffusion, Denoise, and Disentanglement [2023] arxiv.org Web…

【データセット】CLEVR

Index Index CLEVR 参考 Web サイト 動画 CLEVR Visual Question Answering のデータセット. データセット #まとめ編 yhayato1320.hatenablog.com 参考 CLEVR: A Diagnostic Dataset for Compositional Language and Elementary Visual Reasoning [2016] arx…

【深層学習】Grounding DINO

Index Index Grounding DINO 参考 Web サイト Grounding DINO GLIP + DINO DINO #まとめ編 yhayato1320.hatenablog.com 参考 Grounding DINO: Marrying DINO with Grounded Pre-Training for Open-Set Object Detection [2023] arxiv.org paperswithcode.com…

【深層学習】MDETR

Index Index MDETR Architecture 2 つの Encoder Concat DETR への入力 Training / Loss Contrastive Alignment Loss Object Part Text Part Total Loss 参考 Web サイト MDETR Modulated DETR DETR #まとめ編 yhayato1320.hatenablog.com Phrase Grounding …

【マルチモーダル】Dense Captioning

Index Index Dense Captioning アルゴリズム GRiT / 2022 ControlCap / 2024 データセット / ベンチマーク Visual Genome / 2016 参考 Web ページ Dense Captioning マルチモーダル #まとめ編 Vision-Language yhayato1320.hatenablog.com アルゴリズム GRiT…

【機械学習】Data-Centric AI

機械学習 #まとめ編 yhayato1320.hatenablog.com Index Index Data-Centric AI Bench Mark DataPerf 参考 Data-Centric AI Bench Mark DataPerf DataPerf www.dataperf.org 参考 データ中心のAI: Data-Centric AIによるアプローチ qiita.com