オムライスの備忘録

数学・統計学・機械学習・プログラミングに関することを記す

【深層学習】DDG-DA

Index

DDG-DA

Data Distribution Generation for Drift Adaptation

Streaming Data

Real Time な時系列データ / Time Series Data.

Streaming Data の分布は、予測できない方法で変化する.

Concept Drift

Concept-Driftとは、アウトプットデータとインプットデータの関係が、時間や外部影響によって変化すること.



この手法では、Concept Drift に対応するために、 データ分布の変換を予測し、予測モデルの性能を向上させる.

最初に、データ分布を予測するために、Predictor を学習する.

次に、学習した Predictor を利用して、Training Sample を生成する.

変数定義

登場人物紹介.

  •  Data^{(t)} : 時刻  t におけるデータ集合
    •  t : timestamp
    • ヒストリカルなデータ集合  Data^{(t-1)},\ \cdots,\ Data^{(1)}
    • 将来のデータ集合  Data^{(t-1)} を予測するのが、目的

  •  X\ =\ \{x^{(1)},\ \cdots,\ x^{(T)} \} : 時系列データ
    •  T : timestamp
    •  x^{(t)}\ \in\ R^{m} : データ  x^{(t)}は、 m 次元のベクトル
    •  x^{(t)}\ =\ \{x_{1},\ \cdots,\ x_{m}\} : データ  x^{(t)} の要素

  •  y\ =\ \{y^{(1)},\ \cdots,\ y^{(T)} \} : 時系列のラベルデータ

  •  Data_{test}^{(t)}\ =\ \{ (x^{(i)},\ y^{(i)}) \}_{i=t\ +\ 1}^{t\ +\ \tau}
    •  (x^{(t)},\ y^{(t)})\ \sim\ p_{t} (x,\ y)

  •  Data_{train}^{(t)}\ =\ \{ (x^{(i)},\ y^{(i)}) \}_{i=t\ -\ k}^{t\ -\ 1}





 \displaystyle \min_{f^{(t)},\ \cdots,\ f^{(t+\tau)}} \displaystyle \sum_{i=t}^{t+\tau}\ loss\ (f^{(i)} (x^{(i)}),\ y^{(i)})


  •  f :  Data_{train} によって学習された予測関数
  •  loss : 損失関数

アルゴリズム



 task^{(t)}\ =\ (D^{(t)}_{train},\ D^{(t)}_{test})

参考

  • DDG-DA: Data Distribution Generation for Predictable Concept Drift Adaptation
    • [2022]
    • Abstract
    • 1 Introduction
    • 2 Background and Related Work
      • 2.1 Streaming Data and Concept Drift
      • 2.2 Related Work
    • 3 Method Design
      • 3.1 Overall Design
      • 3.2 Model Design and Learning Process
    • arxiv.org

Web サイト