オムライスの備忘録

数学・統計学・機械学習・プログラミングに関することを記す

2021-12-01から1ヶ月間の記事一覧

【深層学習】Local Attention

yhayato1320.hatenablog.com Index Index Global Attention 参考 Web サイト Global Attention 注意する対象を、選択することで、計算コストを削減した Attention. 参考 Effective Approaches to Attention-based Neural Machine Translation [2015] Seq2Seq…

【深層学習】Global Attention

yhayato1320.hatenablog.com Index Index Global Attention 参考 Web サイト Global Attention 注意する対象を、選択できる範囲すべてに対して行う Attention. 参考 Effective Approaches to Attention-based Neural Machine Translation [2015] Seq2Seq wit…

【深層学習】Layer Normalization

yhayato1320.hatenablog.com Index Index Layer Normalization 利用しているアーキテクチャ 参考 Layer Normalization DNN (Deep Neural Networks) で、計算コストを短縮する方法として、正規化 / Normalization がある. Batch Normalization では、正規化す…

【深層学習】Post / Pre Normalization

yhayato1320.hatenablog.com Index Index Post / Pre Normalization 利用されているアーキテクチャ 参考 Post / Pre Normalization 機械翻訳のタスクで、Transformer の層を深くする研究にて、2 つの手法が提案されている. Post / Pre Normalization の適応 …

【深層学習】正規化 / Normalization #まとめ編

深層学習手法一覧 yhayato1320.hatenablog.com まとめ編一覧 yhayato1320.hatenablog.com Index Index Batch Normalization Layer Normalization Group Normalization Instance Normalization Conditional Instance Normalization Interpreting Instance Nor…

【深層学習】GPT-3

GPT-3 #まとめ編 yhayato1320.hatenablog.com Index Index GPT-3 とは 参考 書籍 Web サイト GPT-3 とは ネットワークアーキテクチャをスケールアップし、 事前学習するコーパスを大きくすることで、 ファインチューニングを行わずに(Zero-Shot)、 もしくは…

【深層学習】GPT-2

GPT #まとめ編 yhayato1320.hatenablog.com Index Index GPT-2 とは アプローチ 学習データ Byte Pair Encoding (BPE) ネットワークアーキテクチャ 学習済みモデル gpt2-xl-japanese 参考 Web サイト GPT-2 とは 複数のタスク(Multi Task) やドメイン(Multi …

【深層学習】GPT #まとめ編

Index Index GPT GPT-1 / 2018 GPT-2 / 2019 GPT-3 / 2020 GPT-J / 2021 Codex / 2021 GPT-3.5 Series / 2021 Instruct GPT / 2022 Chat GPT / 2023 Contrastive Pre Training / CPT / 2022 SpikeGPT / 2023 GPT-4 HuggingGPT / 2023 FrugalGPT / 2023 特定…

【深層学習】GPT-1

yhayato1320.hatenablog.com Index Index GPT-1 とは 学習の仕組み 教師なし事前学習(Unsupervised Pre-Training) 教師あり学習 ファインチューニング (Supervised Fine-Tuning) ネットワークアーキテクチャ 教師なし事前学習(Unsupervised Pre-Training) 教…

【深層学習】BERT #実装編 #04

この記事の読者 深層学習・ディープラーニングの手法の1つである「BERT」について知りたい. キーワード・知ってると理解がしやすい BERT yhayato1320.hatenablog.com yhayato1320.hatenablog.com Index Index 環境とライブラリ 実装 事前学習モデル 比較検…

【画像処理】物体検出 / Object Detection #まとめ編 #00

#まとめ編 一覧 yhayato1320.hatenablog.com Index Index 物体検出 / Object Detection とは Real Time Object Detection アルゴリズム 画像処理 (+ 機械学習) 物体領域候補の提案 線形分類器を用いた物体検出 集団学習 / Ensemble Learning を用いた物体検…

【深層学習】Transformer #まとめ編

#まとめ編 一覧 yhayato1320.hatenablog.com Index Index Transformer 基本アルゴリズム / 2017 応用アルゴリズム 工夫・テクニック Attention の工夫 Sparse Transformer / 2019 Hyena / 2023 LongNet / 2023 MLM に対する解決 XLNet / 2019 ELECTRA / 2020…

【深層学習】ELECTRA

Transformer #まとめ編 yhayato1320.hatenablog.com Index Index ELECTRA とは 参考 Web サイト ELECTRA とは BERT などの (教師なし) 事前学習 / Pre Training に使われるマスク付き言語モデル /Masked language modeling (MLM) は、大量の計算が必要. そこ…

【金融時系列解析】BERT-GAN

金融時系列解析 #まとめ編 yhayato1320.hatenablog.com Index Index この手法について FinBERT Classifier 参考 Web サイト この手法について 株価の予測にテキスト情報からの感情分析を用いた. 株価の予測に使うアルゴリズムとして GAN を採用. 比較対象し…

【時系列解析】分野一覧 #まとめ編

#まとめ編 一覧 yhayato1320.hatenablog.com Index Index 時系列解析 基本手法 前処理 / クリーニング 確率過程 検定 統計モデル / 確率過程モデル 状態空間モデル 機械学習モデル 金融時系列解析 データセット タスク Regression / Time Series Forecasting…

【金融時系列解析】トリプルバリア法

金融時系列解析 #まとめ編 yhayato1320.hatenablog.com Index Index ボラティリティー / Volatility トリプルバリア法 実装 データの取得 CUSUM フィルタを利用したイベントベースのサンプリング 日次ボラティリティー (標準偏差) の計算 参考 書籍 ボラティ…

【深層学習】PubMedBERT

この記事の読者 深層学習・ディープラーニングの手法の1つである「PubMedBERT」について知りたい. キーワード・知ってると理解がしやすい BERT yhayato1320.hatenablog.com まとめ編 yhayato1320.hatenablog.com Index Index PubMed とは BERT との変更点 …

【深層学習】BlueBERT

この記事の読者 深層学習・ディープラーニングの手法の1つである「BlueBERT」について知りたい. キーワード・知ってると理解がしやすい BERT ELMo yhayato1320.hatenablog.com yhayato1320.hatenablog.com まとめ編 yhayato1320.hatenablog.com Index Index…

【深層学習】SciBERT

この記事の読者 深層学習・ディープラーニングの手法の1つである「SciBERT」について知りたい. キーワード・知ってると理解がしやすい BERT yhayato1320.hatenablog.com まとめ編 yhayato1320.hatenablog.com Index Index SciBERT とは 参考 SciBERT とは …

【深層学習】BERT #まとめ編 #00

Index Index BERT / 2018 アルゴリズム編 実装編 BERT の研究 RoBERTa / 2019 ALBERT / 2019 DistilBERT / 2019 FlauBERT / 2019 Sentence BERT / SBERT / 2019 GAN-BERT / 2020 DeBERTa / 2020 学習するドメインに対する研究 他データ分野への応用 HuBERT /…

【深層学習】RoBERTa

この記事の読者 深層学習・ディープラーニングの手法の1つである「RoBERTa」について知りたい. BERT まとめ編 yhayato1320.hatenablog.com Index Index RoBERTa とは BERT との変更点 Training 動的なマスキング Next Sentence Prediction の廃止 Batch Siz…

【深層学習】BERT #実装編 #00

yhayato1320.hatenablog.com Index Index 実装編 内容 実装編 まとめ 実装編 内容 トークナイザを持ちいて、文章をトークン化して、BERT に入力できるよう形にする. (#01) BERT に入力して、出力を得る. (#02) BERT を利用して、単語の穴埋め (#03) 貪欲法 …

【深層学習】活性化関数 / Activation Function

yhayato1320.hatenablog.com Index Index 活性化関数 / Activation Function とは 深層学習 / DeepLearning での役割 様々な関数 ステップ関数 / 階段関数 Sigmoid / シグモイド関数 Tanh 関数 ReLU 関数 / 2010 GELU 関数 参考 Web サイト 活性化関数 / Act…

【深層学習】3D Patch

紹介手法 ViT を利用した 3D セグメンテーションタスクの研究. Vision Transformer / ViT yhayato1320.hatenablog.com 参考 Convolution-Free Medical Image Segmentation using Transformers 2021 arxiv.org Web サイト Transformerによる医用画像のセグメ…

【深層学習】Vision Transformer / ViT #アルゴリズム編

Transformer #まとめ編 画像処理の手法 yhayato1320.hatenablog.com Index Index Vision Transformer とは Architecture Input Patch Embeddings Class Token Position Embeddings Encoder Normalization Attention MLP Classifier (MLP Head) Pre Training …

【深層学習】SSD / Single Shot MultiBox Detector #アルゴリズム編

この記事の読者 深層学習・ディープラーニングの手法の1つである「SSD / Single Shot MultiBox Detector」について知りたい. キーワード・知ってると理解がしやすい CNN VGG yhayato1320.hatenablog.com Index Index SSD / Single Shot MultiBox Detector …

【深層学習】EfficientNet V2 #実装編

この記事の読者 深層学習・ディープラーニングの手法の1つである「EfficientNet V2」について知りたい. yhayato1320.hatenablog.com Index Index EfficientNet V2 とは Dataset と Task 環境とライブラリ 実装 データの取得 モデル定義 Train Infer 参考 Ef…

【深層学習】EfficientNet #実装編

この記事の読者 深層学習・ディープラーニングの手法の1つである「EfficientNet」について知りたい. キーワード・知ってると理解がしやすい EfficientNet yhayato1320.hatenablog.com yhayato1320.hatenablog.com Index Index EfficientNet とは Dataset と…

【データセット】MNIST #実装編

Index Index MNIST とは 環境とライブラリ 実装 参考 MNIST とは #概念編 yhayato1320.hatenablog.com 環境とライブラリ Google Colabratory (2021/12/06) Python (3.7.12) PyTorch (1.10.0) 実装 Pytorch で、MNIST を利用できるような形式にする. 参考 【P…

【データセット】MNIST #概念編

Index Index MNIST とは 参考 MNIST とは The MNIST database (Modified National Institute of Standards and Technology database) は、 「0」~「9」の手書き数字の画像データセット. Yann LeCun氏/Corinna Cortes氏/Christopher J.C. Burges氏によって…