Tesseract のさまざまな側面を説明する技術文書

著作権表示

ここに掲載されている資料は著作権により保護されており、それぞれの著作権者の許可なく販売または配布することはできません。

ペーパーを読む

以下のリンクから PDF ダウンロードにジャンプできます。

IEEE 著作権資料

以下の資料は IEEE 出版物に登場し、それぞれに IEEE 著作権表示があります。IEEE の書面による許可なしに、これらのペーパーを販売したり、さらに配布したりすることはできません。

Tesseract OCR エンジンの概要

タブストップ検出によるハイブリッドページレイアウト分析

ACM 著作権資料

多言語 OCR に合わせて Tesseract オープンソース OCR エンジンを適応させる

©ACM、2009 年。これはこの作品の著者のバージョンです。著者の許可により、個人の使用でのみここに掲載されています。再配布はできません。決定版は 2009 年 7 月 25 日にスペインのバルセロナで開催された多言語 OCR に関する国際ワークショップの議事録で発行されました。https://dl.acm.org/citation.cfm?id=1577804

Ray Smith の他の出版物

Ray Smith の出版物
マルチメディア文書画像からのテキストの抽出および認識、スミス、R.W.（博士論文）、1987 年
DAS2014 で発表された Tesseract に関するチュートリアルのスライド
DAS2016 で発表された Tesseract に関するチュートリアルのスライド

その他

ビデオ PhotoTechEDU 11 日目：レプトニカを使用した文書画像分析
古代ギリシャ語 OCR 用 Tesseract をトレーニングする、ニック・ホワイト
ヒンディー語の認識向上のための白レカ切断統合 Tesseract OCR エンジン、ニティン・ミシュラ、C. パトヴァルダン、C. ヴァサンタラクシュミ、サリカシン
Tesseract と ABBYY FineReader OCR エンジンの比較レポート、ヘリンスキ、クミェチャク、パコラ
hOCR 埋め込み OCR ワークフローと出力フォーマット（hOCR 仕様）
ストローク幅変換を使用した Nokia N900 上のテキスト検出（ソースコード付き）
長短期記憶ネットワークを使用した汎用テキスト認識 - 博士論文
コンピュータービジョンとディープラーニングを使用して最新の OCR パイプラインを作成する
翻訳に触発された OCR、ドミトリー・ゲンセル、アショク・C. ポパット、ネマニャ・スパソイェビッチ、マイケル・ヤール、アンドリュー・シニア、ユージーン・ル、フランク ... キーワード - 光学的文字認識、統計的機械 ... （文字）の場所アラビア語、英語、ヒンディー語の PRAN データの例。
Google で多言語 OCR と手書き認識を開発する、アショク・ポパット。リサーチサイエンティスト、Google Inc. IAPR サマースクール、ジャイプル：2017 年 1 月 23 日。
グラフ畳み込みニューラルネットワークによる汎用 OCR 段落識別、レンシェン・ワン、ヤスヒサ・フジイ、アショク・C. ポパット、2021 年 1 月