オムライスの備忘録

数学・統計学・機械学習・プログラミングに関することを記す

【統計学】Multi Output Regression

Index

Multi Output Regression

変数定義

  •  m 次元の説明変数  x
    •  X_{1},\ \cdots,\ X_{m}
  •  d 次元の目的変数  y
    •  Y_{1},\ \cdots,\ Y_{d}
  •  N 件のデータセット :  D
    •  D\ =\ \{(x^{(1)},\ y^{(1)}),\ \cdots,\ (x^{(N)},\ y^{(N)}) \}
  • 回帰関数  h
    •  m 次元から  d 次元への写像
    •  h\ :\ \Omega_{X_{1}}\ \times\ \cdots\ \times\ \Omega_{X_{m}}\ \rightarrow\ \Omega_{Y_{1}}\ \times\ \cdots\ \times\ \Omega_{Y_{d}}

Problem Transformation Methods

Multi Output 形式の問題をSingle Target (Output) の問題に変換する手法.

各目的変数のための予測モデルを構築し、最後に  d 個の予測を連結する手法.

これらの手法の欠点として、目的変数の間の関係が無視されること.

Single Target Method

 d 個の Single Target Model で構成されている.

つまり、学習に利用されるデータセットの形式としては、ある目的変数ごとになるので、以下のようになる.

 D_{i}\ =\ \{(x^{(1)},\ y^{(1)}_{i}),\ \cdots,\ (x^{(N)},\ y^{(N)}_{i})\ |\ i\ \in\ \{1,\ \cdots,\ d\} \}



各目的変数は、個別に予測され、目的変数の間で潜在的な関連を利用することができない.

この手法は、Multi Target Method を Single Target Method に変換しているため、 よく利用される単変数 (Single Target Method) のアルゴリズムをそのまま利用できる.

参考

  • A survey on multi-output regression