計量時系列分析
- 5 単位根過程
  - 5.1 単位根過程の性質
    - 5.1.1 単位根過程
    - 5.1.2 単位根過程のトレンド
    - 5.1.3 単位根過程の予測
    - 5.1.4 単位根過程のインパルス応答関数
  - 経済・ファイナンスデータの計量時系列分析 (統計ライブラリー)
    作者:竜義, 沖本
    朝倉書店
    Amazon

2022-08-30

【時系列解析】検定

データサイエンスデータサイエンス-時系列解析データサイエンス-統計学

Index

Index
検定
- 自己相関の検定
  - 統計量
  - 仮設検定
- 単位根過程の検定
  - Dickey-Fuller / DF 検定
  - 拡張 DF / AFD 検定
参考

検定

検定 #まとめ編
- yhayato1320.hatenablog.com
時系列解析 #まとめ編
- yhayato1320.hatenablog.com

自己相関の検定

データが自己相関をもっているのであれば、その自己相関構造を記述できる時系列モデルを構築し、そのモデルを予測などに用いることができる.

逆にいえば、データが自己相関を持っていないのであれば、時系列解析でできることは、非常に限られてしまう.

統計量

統計量
- yhayato1320.hatenablog.com

自己相関の検定を行うためには、まず自己相関の推定値を計算する必要がある.

期待値を求め、自己共分散を求めることができれば、自己相関係数を求めることできる.

仮設検定

この標本自己相関 $\hat{\rho}_{k}$ を用いて、

$H_{0}\ :\ \rho_{k}\ =\ 0$ という帰無仮説を
$H_{1}\ :\ \rho_{k}\ \neq\ 0$ という対立仮設

に対して検定を行う.

単位根過程の検定

Dickey-Fuller / DF 検定

真の過程を AR(1) モデルと仮定し、

「過程が、単位根 AR(1) 過程である」という帰無仮説を
「過程が、定常 AR(1) 過程である」という対立仮説に

対して検定する.

拡張 DF / AFD 検定

DF 検定では、真のモデルが AR(1) 過程と仮定されていた.

しかしながら、AR(1) 過程でモデル化できる経済・ファイナンスなどのデータは、限られており、この仮定は、現実的でない場合も多い.

そこで、この仮定を緩めて、DF 検定を拡張した検定を考える.

真のモデルが、AR(p) 過程であることを仮定した検定が ADF 検定である.

参考

計量時系列分析
- 1 時系列分析の基礎概念
  - 1.4 自己相関の検定
- 5 単位根過程
  - 5.2 単位根検定
    - 5.2.1 DF 検定
    - 5.2.2 ADF 検定
    - 5.2.3 PP 検定
- 6 見せかけの回帰共和分
  - 6.5 共和分の検定
  - 経済・ファイナンスデータの計量時系列分析 (統計ライブラリー)
    作者:竜義, 沖本
    朝倉書店
    Amazon

2022-08-30

【統計学】検定 #まとめ編

データサイエンスデータサイエンス-統計学

Index

Index
検定
- 目的
- 手段
母平均に関する検定
- 両側検定
- 片側検定
検定統計量
- p-値
- t-値
時系列データにおける検定
参考
- Web サイト

検定

統計学 #まとめ編
- yhayato1320.hatenablog.com

仮説検定は、「有意性」の検定である.

「仮説の下で期待するもの」と「観測した結果」を比較し、これらの違い・差が偶然によって起こったものか否かを評価する.

目的

「母集団に関する命題」を得られた標本から検証するための手法.

母集団 / 標本
- yhayato1320.hatenablog.com

結果と理論値のズレが、確率的な誤差の範囲内かどうかを検証する.

手段

棄却

理論値とのずれが確率的な誤差の範囲を超え、誤りであると判断せざるを得ないとき、「仮説を棄却する」という.

「仮説を棄却する」ということは、

「得られた標本が、ほとんど起こらないほど出現する確率が低い場合」

である.

有意水準

この基準となる確率は、有意水準とよばれる.

$\alpha$ で、表されることが多い.

仮説が棄却された場合、仮説からのズレは、有意であるという.

偶然ではない.

帰無仮説と対立仮説

母集団の母数について、ある条件についてある条件を仮定して、設定した仮説を 帰無仮説と呼ぶ.

母数
- yhayato1320.hatenablog.com

帰無仮説 : $H_{0}$

また、これと対立する仮説を対立仮説とよぶ.

帰無仮説 : $H_{1}$

母平均に関する検定

正規母集団の母平均に関する検定は、広く行われている検定である.

正規母集団
- yhayato1320.hatenablog.com

両側検定

片側検定

検定統計量

統計量
- yhayato1320.hatenablog.com

p-値

P値のトリセツ
- speakerdeck.com

t-値

時系列データにおける検定

検定 #まとめ編
- 時系列解析
- yhayato1320.hatenablog.com

参考

統計学入門東京大学出版
- 12 仮設検定
  - 12.1 検定の考え方
  - 12.2 正規母集団に対する仮設検定
  - 12.3 いろいろな $\chi^{2}$ 検定
  - 12.4 中心極限定理を用いる検定
  - 12.5 検出力
- 統計学入門 (基礎統計学Ⅰ)
  - 東京大学出版会
  Amazon
確率・統計 Ⅰ
- 4 推定と検定
  - 4.3 仮設検定
    - 4.3.2 母平均に関する検定
      - 両側検定
      - 片側検定
- 基礎系数学確率・統計I (東京大学工学教程)
  - 作者:縄田和満
  - 丸善出版
  Amazon
現代数理統計学の基礎
- 7 統計的仮説検定
- 現代数理統計学の基礎共立講座数学の魅力
  - 作者:久保川達也,新井仁之,小林俊行,斎藤毅,吉田朋広
  - 共立出版
  Amazon

Web サイト

正規分布の母平均の片側検定・両側検定における検出力関数(power function)の描画
- www.hello-statisticians.com

2022-08-30

【時系列解析】ホワイトノイズ

データサイエンスデータサイエンス-時系列解析

Index

Index
ホワイトノイズ
- iid 系列
- ホワイトノイズ
参考

ホワイトノイズ

時系列解析
- yhayato1320.hatenablog.com

iid 系列

最も基本的な強定常性の例として、次の iid 系列がある.

定常性
- yhayato1320.hatenablog.com

iid 系列

各時点のデータが互いに独立で、かつ同一の分布に従う系列は、iid 系列と呼ばれる.

Independently and Identically Distributed

時刻 $t$ の変数 $y_{t}$ が、期待値 $\mu$ 、分散 $\sigma^{2}$ の iid 系列であるとき

$y_{t}\ \sim\ iid(\mu,\ \sigma^{2})$

と表記する.

iid 系列自体が、経済・ファイナンスデータの時系列モデルとして用いられることは少ないが、期待値 0 の iid 系列は時系列モデルの撹乱項、すなわち、確率的変動を表現する部分として用いられることができる.

iid 系列を取り上げたが、独立性や同一分布性は非常に強い仮定であり、必ずしも分析に必要となるものではない.

したがって、もう少し弱い仮定しか必要とせず、モデルの撹乱項として用いることができるものがあれば便利である.

それでは、ホワイトノイズを紹介する.

ホワイトノイズ

ホワイトノイズすべての時点 $t$ において

$E(\epsilon_{t})\ =\ 0$

$\gamma_{k}\ =\ E(\epsilon_{t},\ \epsilon_{t\ -\ k})\ =\ \left\{ \begin{array}{ll} \sigma^{2} & k\ =\ 0 \\ 0 & k\ \neq\ 0 \end{array} \right.$

が成立するとき、 $\epsilon_{t}$ はホワイトノイズと呼ばれる.

参考

計量時系列分析
- 1 時系列分析の基礎概念
  - 1.3 ホワイトノイズ
  - 経済・ファイナンスデータの計量時系列分析 (統計ライブラリー)
    作者:竜義, 沖本
    朝倉書店
    Amazon

2022-08-29

【深層学習】TabNet

データサイエンスデータサイエンス-深層学習

Index

Index
TabNet
Tabular Learning
- Sequential Attention
参考
- Web

TabNet

テーブルデータを入力とする深層学習手法.

深層学習 #まとめ編
- yhayato1320.hatenablog.com

特徴量選択 / Feature Selection

特徴量選択とは、予測に有用な特徴量を選択.

Global Method

Ward Selection や Lasso Regularization (正則化) は、学習データ全体に基づいて、特徴量の重要性を特定する.

Regularization
- yhayato1320.hatenablog.com

この様な手法を、Global Method と呼ぶ.

Instance Wise

また、入力ごとに個別に特徴量を選択する手法を Instance Wise とよぶ.

Ensumble
- yhayato1320.hatenablog.com

Soft Feature Selection / Sparse Feature Selection

TabNet は、Soft Feature Selection が導入されている.

Soft Feature Selection は、制御可能でスパース性を持つ.

Sequential Attention を使用して、特徴量選択 / Feature Selection を行う.

アルゴリズムの構成

Tree Based Learning / Decision Tree

Decision Tree は、表形式 / Tabular のデータによく使用される.

Decision Tree #まとめ編
- yhayato1320.hatenablog.com
Random Forests
XGBoost
LightGBM

DNN の導入

Sequential Attention を使用して、特徴量選択 / Feature Selection を行うことで、 Decision Tree に DNN を導入している.

教師なし事前学習 / Unsupervised Pre-Training

教師なし学習のひとつである自己教師あり学習を利用.

自己教師あり / Self Supervised
- yhayato1320.hatenablog.com
事前学習 / Pre Training
- yhayato1320.hatenablog.com

Optimize

Gradient Descent を利用して最適化を行う.

Tabular Learning

このアルゴリズムにおけるテクニック.

Sequential Attention

参考

TabNet: Attentive Interpretable Tabular Learning
- [2019]
- 0 Abstract
- 1 Introduction
- 2 Related Work
  - 2.1 Feature selection
  - 2.2 Tree-based learning
  - 2.3 Integration of DNNs into DTs
  - 2.4 Self-supervised learning
- 3 TabNet for Tabular Learning
  - 3.1 Feature selection
  - 3.2 Feature processing
  - 3.3 Feature processing
  - 3.4 Interpretability
  - 3.5 Tabular self-supervised learning
- 4 Experiments
  - 4.1 Instance-wise feature selection
  - 4.2 Performance on real-world datasets
- arxiv.org

Web

Tabnetはどのように使えるのか
- qiita.com
TabNetとは一体何者なのか？
- zenn.dev

2022-08-29

【時系列解析】アルゴリズム #まとめ編 #02

データサイエンスデータサイエンス-深層学習データサイエンス-時系列解析

Index

Index
深層学習を用いた時系列解析
工夫・テクニック
参考

深層学習を用いた時系列解析

深層学習を用いた時系列解析のアルゴリズムをまとめる.

深層学習 #まとめ編
- yhayato1320.hatenablog.com
時系列解析 #まとめ編
- yhayato1320.hatenablog.com

DNN

Graph TNC / 2022

Graph TNC
- yhayato1320.hatenablog.com

Delay-SDE-net / 2023

Delay-SDE-net: A deep learning approach for time series modelling with memory and uncertainty estimates
- [2023]
- arxiv.org

CNN

SCINet / 2021

SCINet: Time Series Modeling and Forecasting with Sample Convolution and Interaction
- [2021]
- arxiv.org
トランスフォーマーを超える予測性能SCINet
- ai-scholar.tech

RNN

RNN #まとめ編
- yhayato1320.hatenablog.com

LSTM

LSTM
- yhayato1320.hatenablog.com

Temporal Regularized Matrix Factorization / TRMF / 2016

Temporal Regularized Matrix Factorization for High-dimensional Time Series Prediction
- [2016]
- papers.nips.cc

Long Short-term Time-series Network / LSTNet / 2017

Modeling Long- and Short-Term Temporal Patterns with Deep Neural Networks
- [2017]
- arxiv.org

DeepAR / 2017

DeepAR: Probabilistic Forecasting with Autoregressive Recurrent Networks
- [2017]
- arxiv.org
【Amazon Forecast】DeepARの論文が気になったのでざっくり読んでみた
- dev.classmethod.jp

Deep State Space Model / DeepState / 2018

Deep State Space Models for Time Series Forecasting
- [2018]
- papers.nips.cc

Deep Air Quality Forecasting Framework / DAQFF / 2018

Deep Air Quality Forecasting Using Hybrid Deep Learning Framework
- [2018]
- arxiv.org

Temporal Fusion Transformer / TFT / 2019

Think Globally, Act Locally: A Deep Neural Network Approach to High-Dimensional Time Series Forecasting
- [2019]
- arxiv.org

Attention

Attention
- 時系列解析 #まとめ編
- yhayato1320.hatenablog.com

TabNet / 2019

TabNet
- yhayato1320.hatenablog.com

TiDE / 2023

Long-term Forecasting with TiDE: Time-series Dense Encoder
- [2023]
- arxiv.org
- ai.googleblog.com

工夫・テクニック

GAN

GAN を用いた時系列解析手法.

GAN
- 時系列解析 #まとめ編
- yhayato1320.hatenablog.com

Diffusion Model

Diffusion Model
- yhayato1320.hatenablog.com

対照学習

Time-Frequency Consistency / TF-C / 2022

Self-Supervised Contrastive Pre-Training For Time Series via Time-Frequency Consistency
- [2022]
- arxiv.org
時系列での事前学習を自己教師対照学習で初めて現実化した時間-周波数整合性（TF-C）
- ai-scholar.tech

参考

Time Series Forecasting With Deep Learning: A Survey

[2020]
2 Deep Learning Architectures for Time Series Forecasting
arxiv.org