2021-01-23

【機械学習】線形基底関数モデル / Liner Basis Function Models

データサイエンスデータサイエンス-機械学習

こんな方におすすめ
機械学習でも必要な「線形基底関数モデル」の基本的な内容について知りたい

「これから、機械学習やディープラーニングの学習をしたいから、その基本となる線形回帰モデルの理解を深めたい」という方に向けた記事.

キーワード・知ってると理解がしやすい

線形回帰モデル
行列

Index

Index
線形基底関数モデルとは
線形回帰モデル
- 単変数の線形回帰モデル
- 多変数の線形回帰モデル
線形基底関数モデル
基底関数
参考

線形基底関数モデルとは

一般的なデータ解析のモデルの１つである線形回帰モデルを一般化して、どのような関数でも適用できるような形式.

回帰分析 #まとめ編
- yhayato1320.hatenablog.com

基底関数を線形に結合しているだけ、最終的な関数 (回帰方程式) が、線形になるわけではない.

非線形への拡張もあり得る.

線形回帰モデル

単変数の線形回帰モデル

データ解析で基本的なモデルである線形回帰モデルは以下のように定式化できる.

$\displaystyle{ y\ =\ ax\ +\ b}$

$x$ : 入力（説明変数）
$y$ : 出力（目的変数）
$a,\ b$ : パラメータ

散布されたデータに対して、線形回帰モデルを適用したイメージ図.

回帰分析
- 基本的なアルゴリズム
- yhayato1320.hatenablog.com

多変数の線形回帰モデル

単変数の線形回帰モデルを多変数の線形回帰モデルに一般化した場合も考える.

実際にデータ解析をするときに入力（説明変数）が１種類（１次元）である場合は少なく、多変量になるとことが多い.

$\displaystyle{ y\ =\ w_{0}\ +\ w_{1} x_{1}\ +\ \cdots +\ w_{D} x_{D} }$

$D$ : 説明変数の次元（種類）
$x_{n}\ (n:\ 1,\ \cdots\ ,\ D)$ : 入力（説明変数）
$y$ : 出力（目的変数）
$w_{n}\ (n:\ 0,\ \cdots\ ,\ D)$ : パラメータ

単変数のモデルも $a\ =\ w_1\ ,b\ =\ w_0$ とすると上の式の $D\ =\ 1$ の式と同様になる.

$\displaystyle{ y\ =\ w_1x_1\ +\ w_0 }$

重回帰
- yhayato1320.hatenablog.com

線形基底関数モデル

さらに変数への写像関数を一般化（拡張）する.

写像関数を一般化するために、基底関数を導入する.

$\displaystyle{ y\ =\ w_{0}\ +\ w_{1} \phi_{1}(\mathbb{x})\ +\ \cdots +\ w_{D} \phi_{D}(\mathbb{x}) }$

$D$ : 説明変数の次元（種類）
: 入力ベクトル（説明変数）
- $\mathbb{x}\ =\ (x_1,\ \cdots,\ x_D)$
$y$ : 出力（目的変数）
$w_{n}\ (n:\ 0,\ \cdots\ ,\ D)$ : パラメータ
$\phi_{n}\ (n:\ 1,\ \cdots\ ,\ D)$ : 基底関数

基底関数 $\phi_n$ を $\phi_n(\mathbb{x})\ =\ x_n\ \ (n\ :\ 1,\ \cdots,\ D)$ とすることで、多変量の線形回帰モデルの式になる.

そして、さらに数式をコンパクトにするために以下のように数式を解釈する.

$\displaystyle{ y\ =\ w_{0}\ +\ w_{1} \phi_{1}(\mathbb{x})\ +\ \cdots +\ w_{D} \phi_{D}(\mathbb{x}) \\ \ \ \ =\ w_{0} \cdot\ 1\ +\ w_{1} \phi_{1}(\mathbb{x})\ +\ \cdots +\ w_{D} \phi_{D}(\mathbb{x}) \\ \ \ \ \ \ \ \ \ \ (\phi_{0}(\mathbb{x})\ =\ 1) \\ \ \ \ =\ w_{0} \cdot\ \phi_{0}(\mathbb{x})\ +\ w_{1} \phi_{1}(\mathbb{x})\ +\ \cdots +\ w_{D} \phi_{D}(\mathbb{x}) \\ \ \ \ =\ \sum_{j=0}^{D}w_{j}\phi_{j}(\mathbb{x}) \\ \ \ \ =\ \mathbb{w}^{T} \mathbb{\phi} (\mathbb{x}) }$

: パラメータベクトル
- $\mathbb{w}\ =\ (w_0,\ \cdots,\ w_D)$
: 基底関数ベクトル (特徴ベクトルと呼ぶ)
- $\mathbb{\phi}\ =\ (\phi_0(\mathbb{x}),\ \cdots,\ \phi_D(\mathbb{x}))$

パターン認識・機械学習の応用場面では、元のデータに対して何らかの前処理・特徴量抽出の処理をすることが多い.

それらの処理の出力を特徴ベクトル $\mathbb{\phi}$ と考えられる.

パラメータ $w_{n}\ (n:\ 0,\ \cdots\ ,\ D)$ に関しては、線形なので「線形モデル」という.

基底関数

さらなる応用としては基底関数に非線形な関数を用いることで、関数の表現の幅を豊かにする.

基底関数として使われる関数.

多項式

$\displaystyle{\phi_j(x)\ =\ x^{j}}$

スプライン関数

入力空間を分割して、入力の値によって関数が変わる.

ガウス基底関数

$\displaystyle{\phi_j(x)\ =\exp \left\{ - \frac{(x - \mu_{j})^{2}}{2s^{2}} \right\}}$

シグモイド基底関数

$\displaystyle{\phi_j(x)\ =\sigma \left\{ \frac{x - \mu_{j}}{s} \right\}}$
$\sigma$ はロジスティックシグモイド関数

フーリエ基底関数

三角関数展開

参考

多変量解析入門
- 3 非線形回帰モデル
  - 3.2 基底関数に基づくモデル
  - 3.3 基底展開法
- 多変量解析入門――線形から非線形へ
  - 作者:小西貞則
  - 岩波書店
  Amazon
ガウス過程と機械学習
- 1 線形回帰モデル
  - 1.3 線形回帰モデル
- ガウス過程と機械学習 (機械学習プロフェッショナルシリーズ)
  - 作者:持橋大地,大羽成征
  - 講談社
  Amazon
パターン認識と機械学習
- 3 線形回帰モデル
  - 3.1 線形基底関数モデル
- パターン認識と機械学習上
  - 作者:C.M. ビショップ
  - 丸善出版
  Amazon
Machine Learning A Probabilistic Perspective
- 16 Adaptive basis function models
  - 16.1 Introduction

2021-01-18

【統計学】期待値と分散

データサイエンスデータサイエンス-統計学

こんな方におすすめ
機械学習でも必要な「期待値」と「分散」の基本的な内容について知りたい.
確率 #まとめ編
- yhayato1320.hatenablog.com

Index

Index
期待値
分散
- 定義
- 共分散
参考

期待値

確率分布 $p(x)$ ( $f(x)$ と表現されることも )

確率変数 $f(x)$ ( $X$ と表現されることも )

定義

確率変数 $f(x)$ の、確率分布 $p(x)$ の下での、平均値を $f(x)$ の

期待値(Expectation)と呼び、 $E[f]$ ( もしくは、 $E[X]$ )と書く.

確率変数 / 確率分布
- yhayato1320.hatenablog.com
平均
- 代表値のひとつ
- yhayato1320.hatenablog.com

確率分布 $p(x)$ が離散分布のときは、以下で与えられる.

$\begin{align} E[f] &= \displaystyle \sum_{x} p(x)\ f(x) \\ (E[X] &=\ ) \end{align}$

確率分布 $p(x)$ が連続分布のときは、以下で与えられる.

$\begin{align} E[f] &= \displaystyle \int p(x)\ f(x)\ dx \\ (E[X] &=\ ) \end{align}$

どちらの場合も、確率分布や確率密度から得られた有限個の $N$ 点を用いて、

期待値はこれらの点での有限和で近似できる.

$\begin{align} E[f] &\simeq \displaystyle \frac{1}{N} \sum_{n=1}^{N} f(x_n) \\ (E[X] &=\ ) \end{align}$

これは、

$\begin{align} E[f] &\simeq \displaystyle \frac{1}{N} \sum_{n=1}^{N} f(x_n) \\ &= \displaystyle \sum_{n=1}^{N} \frac{1}{N}\ f(x_n) \end{align}$

と変形でき、この式から、 $p(x)\ =\ \displaystyle \frac{1}{N}$ を前提にしている.

つまり、どの確率変数も同様に発生する確率を持つことを前提にしているのである.

多変数関数の期待値を考える.

この場合は、どの変数について平均をとるかを示す添字をつける.

$E_{x}[ f(x, y) ]$

条件付き期待値

条件付き確率 (分布) についても 条件付き期待値 を考えることができる.

$E_{x}[ f | y ]\ =\ \displaystyle \sum_{x} p(x | y)\ f(x)$

条件付き確率
- yhayato1320.hatenablog.com

計算例

サイコロを例とする.

サイコロを転がすと以下の表に応じた金額が貰える.

しかし、サイコロには特殊な細工がされて出る確率が操作されている.（下表）

サイコロ目	1	2	3	4	5	6
金額	100万	200万	300万	300万	200万	100万
確率	1/12	2/12	3/12	3/12	2/12	1/12

貰える金額の期待値を算出するために、このサイコロの確率分布 $p(x)$ を考える.

確率分布は離散分布ということが分かる.

また、サイコロの出目を $x$ としたときの貰える金額の関数 $f(x)$ は以下のように表せる.

$f(x)\ = \left\{ \begin{array}{l} 100万\ (x=1のとき) \\ 200万\ (x=2のとき) \\ 300万\ (x=3のとき) \\ 300万\ (x=4のとき) \\ 200万\ (x=5のとき) \\ 100万\ (x=6のとき) \end{array} \right.$

貰える金額の期待値 $E[f$ ]は

$\displaystyle{ E[f]\ = \sum_{x} p(x)\ f(x)\ (x=1,2, \cdots ,6) \\ \ \\ \ \ \ \ \ \ \ \ = p(1) \times f(1) + p(2) \times f(2) + p(3) \times f(3) + \\ \ \ \ \ \ \ \ \ \ \ \ \ \ p(4) \times f(4) + p(5) \times f(5) + p(6) \times f(6) \\ \ \\ \ \\ \ \ \ \ \ \ \ \ = 1/12 \times 100万 + 2/12 \times 200万 + 3/12 \times 300万 + \\ \ \ \ \ \ \ \ \ \ \ \ \ \ 3/12 \times 300万 + 2/12 \times 200万 + 1/12 \times 100万 \\ \ \\ \ \\ \ \ \ \ \ \ \ \ = 233.3333333万 }$

と計算できる.

つまり、このサイコロを１回振ったときに貰える金額の期待値は233万になる.

もしこのサイコロを１回振るのに200万を払わなければならないのだとすると、確率的には得になるし、300万だとすると損になる.

このような計算で宝くじの期待値も計算できる.

分散

定義

確率変数 $f(x)$ の 分散(Variance)は、期待値が $E[f$ ] のとき、以下のように定義される.

$\begin{align} var[f] &= E\ [\ (\ f(x) - E[\ f(x)\ ]\ )^{2}\ ] \\ (\ V(X)\ &=\ ) \end{align}$

と定義され、 $f(x)$ がその平均値 $E[ f(x)$ ] の周りでどれくらいばらつくかの尺度となる.

2 乗を展開すると、分散は $f(x)$ と、 $f(x)^{2}$ を使って、

$var[f]\ =\ E[f(x)^{2}]\ -\ E[f(x)]^{2}$

と書くこともできる.

共分散

2 つの確率変数 $x$ と $y$ の共分散は、

$\begin{align} cov [x,\ y]\ &=\ E_{x,\ y} [ \{ x\ -\ E[x] \}\{ \{ y\ -\ E[y] \} ] \\ &= E_{x,\ y} [ xy ]\ -\ E[x]E[y] \end{align}$

と定義され、 $x$ と $y$ が同時に変動する度合いを表している.

$x$ と $y$ が独立なら共分散は 0 になる.

参考

統計学入門
- 5 確率変数
  - 5.2 確率変数の期待値と分散
- 統計学入門 (基礎統計学Ⅰ)
  - 東京大学出版会
  Amazon
現代数理統計学の基礎
- 1 確率
  - 1.1 事象と確率
  - 1.2 条件付き確率と事象の独立性
- 2 確率分布と期待値
  - 2.1 確率変数
  - 2.2 確率関数と確率密度関数
  - 2.3 期待値
- 現代数理統計学の基礎共立講座数学の魅力
  - 作者:久保川達也,新井仁之,小林俊行,斎藤毅,吉田朋広
  - 共立出版
  Amazon
パターン認識と機械学習
- 1.2 確率論
  - 1.2.2 期待値と分散
- パターン認識と機械学習上
  - 作者:C.M. ビショップ
  - 丸善出版
  Amazon

2020-08-30

opencv ノイズ除去

Servey

2020/08/30

参考

アルゴリズム

Non-local Means Denoising
- 画像中の小領域(例えば5x5) を設定
- 画像中の別の場所に同じようなパッチ(小領域)が存在する可能性は高いということを前提とする(注目画素の周辺にある可能性が高い)
- これらの似ているパッチ(小領域)を使って画素の平均をとる
- ある画素に対して周囲に小さな小領域を定義し，画像中から似ているパッチを見つけ，似ているパッチの平均値を出力画像の対応する画素の画素値とします
- カラー画像のノイズ除去を行う場合は，画像をCIELAB色空間へと変換してからL成分とAB成分に対して独立してノイズ除去を適用します

パラメータ

opencv (cv2.fastNlMeansDenoisingColored)
- h : フィルタの強さを決定するパラメータ．hの値が大きいとノイズをより消せますが，画像の詳細な部分も失ってしまいます(10であればOK)．
- hForColorComponents : カラー画像用のフィルタの強さを決定するパラメータ(hと同様10はOK)．
- templateWindowSize : テンプレートとなるウィンドウの大きさ．奇数でなければならない(7が推奨されている)．
- searchWindowSize : 探索ウィンドウの大きさ．奇数でなければならない(21が推奨されている)．

2020-08-29

「最近のポケモンはデジモンっぽいのか、ディープラーニングに聞いてみた」をよんで

2020/08/23

参考

最近のポケモンはデジモンっぽいのか、ディープラーニングに聞いてみた

モチベーション

画像系 / スコアリングタスク / 表現学習まわりで同様のタスクをやっていた
重要な項目を抽出して、理解をまとめたい

key-word

CNN
Gard-CAM
フィルターの可視化と中間層の抽出
- utkuozbulak/pytorch-cnn-visualizations
  - 可視化手法一覧とその論文リンク一覧

内容

タスク
- 画像認識で分類問題
- ポケモン or デジモン
手法
- DeepLearning / CNN
- ImageNetで事前学習済みのVGG16
精度
- デジモンの正解率は90%
- ポケモンは正解率が82%
結果
- 最近のポケモンは、どちらかというとデジモン
- 「4,7,8」世代が特にデジモン
Grad-CAMによる貢献領域の可視化
- 最近のポケモンはどのへんがデジモンっぽいのか？
フィルターの可視化と中間層の抽出

「Grad-CAM」

日本一詳しくGrad-CAMとGuided Grad-CAMのソースコードを解説してみる(Keras実装)
- Grad-CAMの論文

2020-08-28

Edge Detection の学習(U-Net)にopen data を使用したい

Servey

2020/08/24

「edge detection document dataset」

MIDV-500: a dataset for identity document analysis and recognition on mobile devices in video stream
- paper
  - arxiv
- dataset 「MIDV-500」についての説明
  - 身分証明書のデータセット
  - スマホで撮影した画像や動画
DeepDeSRT: Deep Learning for Detection and Structure Recognition of Tables in Document Images
- paper
- 文書画像の表の認識について
- データセット ICDAR 2013 を使用

「MIDV-500」

midv500 · PyPI
- pip
- midv-500 / midv-2019

「midv-2019」

MIDV-2019: Challenges of the modern mobile-based document OCR
- paper
  - arxiv
- dataset 「MIDV-2019」についての説明
  - MIDV-500 の強化版
  - 身分証明書のデータセット
  - 高画質になり、証明などの環境もバリエーションを持たせた

「edge detection table dataset」

Table Detection, Information Extraction and Structuring using Deep Learning
- article
  - URL
- 様々な論文の紹介も
TableNet: Deep Learning model for end-to-end Table detection and Tabular data extraction from Scanned Document Images
- paper
  - arxiv
- 2020/01
- データセット
  - ICDAR 2013
  - Marmot Table datasets
DeepDeSRT
Graph Neural Networks
CGANs and Genetic Algorithms

「ICDAR 2013」

table edge detection のチャレンジ / 大会?
メインのサイト
- xml data 仕様
新しいサイト

「ICDAR 2013 table competition dataset」

ICDAR 2013 Table Competition

「python ICDAR 2013 Table Competition xml」

xml データのパースを誰かやってないかと思ってみてみた
TableBank: Table Benchmark for Image-based Table Detection and Recognition
- paper
  - URL
- テーブルの検出 / 認識
- 2020

2020-08-27

ICDAR 2013 Table Competition

Servey

2020/08/26

モチベーション

table のデータセットを使いたかったが、仕様や種類があったのでまとめたい

サイト

ICDAR 2013 Table Competition
- メイン
- このコンペは「 table detection or location」と「table structure recognition」のふたつのコンペに分かれている
- 以下のデータが取得可能
  - 2013-11-23 : icdar2013-competition-dataset-with-gt.zip
    - The ground-truthed competition dataset
  - 2013-04-05 : competition-dataset-20130405.zip
    - The competition dataset
- Ground-truthed datasets of PDF tables
  - 以下のデータが取得可能
    - eu-dataset-20130324.zip
    - us-gov-dataset-20130324.zip
ICDAR 2013 Table Competition -- Dataset Format
- データフォーマット
- entrants are only required to return its rectangular bounding-box in PDF coordinates.
  - pdf coordinates
    - PDF Page Coordinates (page size, field placement, etc.)

データセット

icdar2013-competition-dataset-with-gt.zip のデータセットでxmlを画像に描画したところ文字領域と合わなかったため座標の調整を行った
- y : 745 / 792
- x : 630 / 613

2020-08-23

「OpenCVでかすんでる文字をクッキリさせる方法」をよんで

2020/08/23

URL

OpenCVでかすんでる文字をクッキリさせる方法

モチベーション

画像処理を行う前に、画像のノイズを除去しておきたい
いくつかの手法を試せるようにしておきたい
できれば理論もこの記事を、皮切りに確認したい

手法

ガンマ補正
適応的しきい値処理
- 平均しきい値処理
- 重み付け平均しきい値
Laplacian Filter (ラプラシアンフィルター)

「ガンマ補正」

Note

全体的に色彩を明るく or 暗くする
ピクセル値の計算方法に対数関数を利用
その関数内のパラメータガンマを調整する

「adaptiveThreshold」

opencv 画像の閾値処理

Note

単純なしきい値処理
- あるガ画素値がしきい値が大きければ、ある値（白）を割り当て、そうでなければ別の値(黒)を割り当てる
適応的しきい値処理
- 画像中の小領域ごとにしきい値の値を計算する
- そのため領域ごとに光源環境が変わってしまうような画像に対して，単純なしきい値処理より良い結果が得らる

「opencv Laplacian」

opencv 画像の勾配
【画像処理】ラプラシアンフィルタの原理・特徴・計算式%E3%81%AF,%E6%8A%BD%E5%87%BA%E3%81%99%E3%82%8B%E7%A9%BA%E9%96%93%E3%83%95%E3%82%A3%E3%83%AB%E3%82%BF%E3%81%A7%E3%81%99%E3%80%82&text=%E5%87%BA%E5%8A%9B%E7%94%BB%E5%83%8F%EF%BC%88%E3%83%95%E3%82%A3%E3%83%AB%E3%82%BF%E3%82%92%E6%8E%9B%E3%81%91,%E5%A4%A7%E3%81%8D%E3%81%84%E3%81%93%E3%81%A8%E3%81%8C%E3%82%8F%E3%81%8B%E3%82%8A%E3%81%BE%E3%81%99%E3%80%82)

Note

二次微分を利用して画像から輪郭を抽出する空間フィルタ
ラプラシアンフィルタのカーネルで畳み込み演算することで、2次微分計算を行い、エッジを抽出する