- 2020/08/26
モチベーション
- table のデータセットを使いたかったが、 仕様や種類があったのでまとめたい
サイト
- ICDAR 2013 Table Competition
- メイン
- このコンペは「 table detection or location」と「table structure recognition」のふたつのコンペに分かれている
- 以下のデータが取得可能
- 2013-11-23 : icdar2013-competition-dataset-with-gt.zip
- The ground-truthed competition dataset
- 2013-04-05 : competition-dataset-20130405.zip
- The competition dataset
- 2013-11-23 : icdar2013-competition-dataset-with-gt.zip
- Ground-truthed datasets of PDF tables
- 以下のデータが取得可能
- ICDAR 2013 Table Competition -- Dataset Format
- データフォーマット
- entrants are only required to return its rectangular bounding-box in PDF coordinates.
- pdf coordinates
データセット
- icdar2013-competition-dataset-with-gt.zip のデータセットでxmlを画像に描画したところ文字領域と合わなかったため座標の調整を行った
- y : 745 / 792
- x : 630 / 613