オムライスの備忘録

数学・統計学・機械学習・プログラミングに関することを記す

Edge Detection の学習(U-Net)にopen data を使用したい

  • 2020/08/24

「edge detection document dataset」

  • MIDV-500: a dataset for identity document analysis and recognition on mobile devices in video stream
    • paper
    • dataset 「MIDV-500」についての説明
  • DeepDeSRT: Deep Learning for Detection and Structure Recognition of Tables in Document Images
    • paper
    • 文書画像の表の認識 について
    • データセット ICDAR 2013 を使用

「MIDV-500」

「midv-2019」

  • MIDV-2019: Challenges of the modern mobile-based document OCR
    • paper
    • dataset 「MIDV-2019」についての説明
      • MIDV-500 の強化版
      • 身分証明書のデータセット
      • 高画質になり、証明などの環境もバリエーションを持たせた

「edge detection table dataset」

「ICDAR 2013」

「ICDAR 2013 table competition dataset」

python ICDAR 2013 Table Competition xml

  • xml データのパースを誰かやってないかと思ってみてみた
  • TableBank: Table Benchmark for Image-based Table Detection and Recognition
    • paper
    • テーブルの検出 / 認識
    • 2020