オムライスの備忘録

数学・統計学・機械学習・プログラミングに関することを記す

【深層学習】GLIP #実装編

Index

GLIP

物体検出のおけるラベルの表現を豊かにするために、事前学習を導入した.

Grounded Language-Image Pre-training



前置き

タスク

画像からの物体検出.

ラベルの可変性も確認してみる.

データセット

COCO データセットを利用.

実装

実行

環境の構築に時間がかかる.