オムライスの備忘録

数学・統計学・機械学習・プログラミングに関することを記す

【機械学習】判別分析 / Discriminate Analysis

Index

判別分析 / Discriminate Analysis とは

機械学習アルゴリズムのひとつ.

複数のクラス (群) があるとき、将来観測されたデータが、
その中ののどのクラス (群) へ属するかを予測することを目的とし、
既にどのクラス (群) に属するのかわかっているデータに基づいて
判別方式を構成する手法を判別分析 / Discriminate Analysisと呼ぶ.

統計的判別分析は、1930 年代に フィッシャー (R. A. Fisher) によって
基本的な考え方が紹介され、その後 マハラノビス (P. C. Mahalanobis) などの
研究によって、形を整えるようになった.

フィッシャーの線形判別

2 群判別を中心に、
観測されたデータの情報を (標本) 平均ベクトルと (標本) 分散共分散行列に集約して、
線形結合によって、判別方式を構成する統計的判別法について考える.

ある常緑樹は、葉の形状によって大きく 2 つの品種 A, B に分けられるとする.

そこで、葉に長さ  x_1 (cm) と葉の幅  x_2 (cm) の 2 つの特性 (変数) に着目して、
どちらの品種か不明なデータが採られたとき、どのデータが A, B どちらの品種であるかを判別する方式の構築を試みる.

参考