コンテンツへスキップします。

Tesseract OCR を使用する GUI およびその他のプロジェクト

1. GUI

名称 Linux Mac Windows ライセンス 説明
Scribe OCR AGPL-3.0 ライセンス Scribe OCR は、テキスト認識、OCR データの校正、および完全にデジタル化されたドキュメントの作成のための、無料かつオープンソースのウェブアプリケーションです。ライブサイトは scribeocr.com です。
Rescribe GPL v3 インストール不要の使いやすい Tesseract フロントエンドで、PDF 処理、Google ブックスのダウンロード、追加の前処理および後処理機能が含まれています。
normcap GPL v3 画像ではなく情報をキャプチャするための、OCR 搭載スクリーンキャプチャツール。
gImageReader   GPL v3 tesseract-ocr のグラフィカル GTK フロントエンド
VietOCR Apache 2.0 Tesseract OCR エンジンの GUI フロントエンドです。ベトナム語および Tesseract でサポートされている他の言語の光学文字認識をサポートしています。
NeOCR     フリーウェア Tesseract 4.0 OCR エンジンの GUI フロントエンドです。
Free-Ocr-Windows-Desktop     GNU AGPL v3 Windows デスクトップ用の無料 OCR アプリケーションです。基本的に、Tesseract OCR エンジンのグラフィカルユーザーインターフェース (GUI) です。このアプリケーションには、スキャンされた PDF ファイルの読み取りもサポートされています。
YAGF     GPL v3 cuneiform と tesseract のグラフィカルフロントエンド
OCR2Text MIT PDF を TXT にバッチ処理するための CLI ツール
OCRFeeder     GPL v3 OCRFeeder は、ドキュメントレイアウト解析と光学文字認識システムです。
Lector   GPL v2 Python、Qt4、および Tesseract OCR をベースとした、GNU/Linux 用のグラフィカル OCR ソリューションです。
Tesseract-OCR QT4 gui     Apache 2.0 Tesseract-OCR QT4 gui は、tesseract のシンプルな GUI です。
Lime OCR     GPL v3 tesseract-ocr エンジンを使用した、Windows 用のシンプルで無料の OCR ソフトウェアです。
Ocrivist     GPL v3 Ocrivist は、書籍やその他の印刷されたドキュメントを PDF または Djvu 形式でスキャンして OCR することを可能にするユーティリティです。
Tesseract-GUI     GPL v2 Tessract-GUI は tesseract-ocr のフロントエンドではなく、ImageMagick を使用して簡単な画像操作を行うグラフィカルな方法です。
QTesseract     LGPL v3 Tesseract OCR の QT GUI
dpScreenOCR   zlib 画面上のテキストを認識するプログラム
pmOCR     BSD バッチ OCR ツール、tesseract によるファイルモニターイベント OCR も
tesseract4java GPLv3 バッチ認識や精度評価などの高度な機能を備えた、Tesseract のトレーニングと実行のためのクロスプラットフォーム GUI です。
Linux-Intelligent-OCR-Solution(lios)     GPLv3 視覚障害者向けに完全なアクセシビリティを備え、スキャナー輝度オプティマイザー、テキストクリーナーなどの高度な機能を備えた、Tesseract のスキャン、実行、トレーニングのための GUI です。
SunnyPages OCR     プロプライエタリ 画像の明るさの自動調整、画像処理、および PDF サポートを備えた、Tesseract OCR エンジンの GUI フロントエンドです。
PDF OCR X   プロプライエタリ PDF OCR は、Mac OS X と Windows 用のシンプルなドラッグアンドドロップユーティリティで、PDF と画像をテキストドキュメントまたは検索可能な PDF ファイルに変換します。
TaxWorkFlow     プロプライエタリ TaxWorkFlow は、Tesseract OCR エンジンの GUI フロントエンドを含む会計業務管理アプリケーションです。このアプリは AVX をサポートしており、PDF ファイルおよび 100 以上の画像ファイル形式から、選択した解像度と圧縮率の OCR された PDF ファイルを作成できます。
AmhOCR     GPLv3 複数の前処理/後処理 GUI を備えた、Tesseract 搭載の Windows デスクトップ OCR アプリケーション
TesseractStudio.Net Github     プロプライエタリ (実行ファイル、ソースコードは利用不可、サイトURLは無効) tesseract 4.0 のグラフィカルインターフェース
TesseractStudio.Net     プロプライエタリ tesseract 4.0 のグラフィカルインターフェース
ImageTrans プロプライエタリ Tesseract を使用してページ全体、画像の選択領域、またはスクリーンショットの OCR を実行できる画像翻訳ツールです。
NAPS2 GLP2 できるだけ簡単に、ドキュメントを PDF などに変換します。
Ave React OCR     MIT avernakis react によって動作するシンプルな OCR アプリです。

2. オンライン OCR サービス

3. モバイル

4. その他(ユーティリティ、ツール、コマンドラインインターフェース [CLI] など)

A. PDF を検索可能な PDF に変換するツール

(つまり、検索不可能な PDF も入力として処理できるツール)

  1. OCRmyPDF - スキャンされた PDF ファイルと画像に OCR テキストレイヤーを追加して、検索できるようにします。マルチコア CPU でページを並列処理します。可能な場合は、JPEG を再圧縮せずに、元の埋め込み画像の正確な解像度を維持します。いくつかの画像前処理オプション、詳細なドキュメント、および多くの特殊な PDF のサポートが含まれています。
  2. pdf2pdfocr は、PDF(またはサポートされている画像)の OCR を実行し、元のファイルにテキストレイヤーを追加して検索可能な PDF にするツールです。tesseract とその他のオープンソースツールを使用する Python スクリプトです。Linux、macOS、Windows をサポートしています。
  3. pdf2searchablepdf - 検索できない PDF、または画像のディレクトリ全体を検索可能な PDF に変換できるツールです。

B. その他

  1. Scantools - スキャンされたドキュメントの処理と高品質な PDF ファイルの生成を目的として記述された、グラフィック操作用のライブラリと一致するコマンドラインアプリケーションのセットです。**image2pdf** は画像を PDF に変換します。Tesseract などの光学文字認識プログラムによって生成された HOCR ファイルをオプションで指定して、PDF ファイルを検索可能にすることができます。生成されたファイルは、デジタルドキュメントの長期間保存のための ISO PDF/A 標準に準拠しています。**hocr2any** は HOCR ファイルをテキストに変換するか、ラスターグラフィックまたは PDF ファイルとしてレンダリングします。**ocrPDF** は Tesseract OCR エンジンを使用してテキストを検出し、PDF ファイルにテキストレイヤーを生成します。
  2. ocr-fileformat - OCR ファイル形式 (hOCR、ALTO、PAGE、FineReader) の検証と変換を行います。
  3. Tess4J - Tesseract OCR API の Java JNA ラッパーです。
  4. Traineddata インスペクター - traineddata ファイルの内部構造の一部を検査するためのツールです。
  5. TopOCR - tesseract-ocr をサポートするカメラ用の高品質 OCR(有料製品)
  6. シンプルな OCR Web サーバー python、flask、tesseract-ocr、leptonica を使用しています。
  7. Display OCR は、OpenCV-Python + python-tesseract による 7 セグメントフォントのリアルタイム画像前処理と OCR です。
  8. OpenOCR は、独自の OCR REST API を簡単にホストできるようにします。
  9. https://github.com/guitarmind/tesseract-web-service は、tornado を使用した tesseract-OCR の RESTful ウェブサービスの実装です。
  10. RasterEdge .NET Image SDK - OCR 認識 は、デスクトップアプリケーションまたはサーバーアプリケーション用のロイヤリティフリー配布の堅牢で高性能な認識アプリケーションです。
  11. DevScope OCR SDK は、Microsoft .NET framework を使用したアプリケーションの開発を可能にする、Tesseract OCR v3 をベースとした光学文字認識ツールキットエンジンです。
  12. Paperwork - OCR を使用して簡単に古くなった書類を検索する(pyocr が必要)
  13. Aletheia - 生産環境向けの高度なドキュメントレイアウトとテキストグラウンドトゥルースシステム
  14. gscan2pdf スキャンされたドキュメントから PDF または DjVu を作成するための GUI
  15. Audiveris は、楽譜の画像を処理して MusicXML 標準で自動的に記号音楽情報を提供するオープンソースの光学音楽認識ソフトウェアです。
  16. Ocrivist は、書籍やその他の印刷されたドキュメントを PDF または Djvu 形式でスキャンして OCR することを可能にするユーティリティです。
  17. thu-ipv6-login authcode の OCR をサポートした、清華大学の IPv6 認証のための Python スクリプトです。
  18. Wolfram Mathematica 9.0 は、テキスト認識 に tesseract を使用します。
  19. node-dv は、スキャンされたドキュメントを処理および理解するための node.js ライブラリです。
  20. hocr-tools - HTML に埋め込むことで多言語 OCR 結果を表す hOCR 形式を操作および評価するための Python ツールです。検索可能な pdf を作成するための hocr-pdf ツールが含まれています。
  21. PyPDFOCR - Tesseract-OCR ベースの PDF ファイリング
  22. ChronoScan は、ドキュメントのスキャンとデータ入力のための完全なスイートです。
  23. speedy-ocr は、スキャンとOCRを簡素化し、視覚障害者コミュニティを支援するためのユーティリティです。Vinuxプロジェクトの一部です。
  24. Project VIRAL Varico 請求書認識システム(アシスト学習付き)
  25. Bindery:後処理されたスキャン済みページをデジタルドキュメントにバインドするためのシンプルなGUIです。
  26. Clarify:Clarifyは、「画像のみ」のPDFのOCRに役立ちます。入力は、通常テキストを抽出できないPDFです。出力はテキストです。Clarifyは、tesseract-ocr、xpdf、netpbmをラップするPythonモジュールです。要件: Python、tesseract-ocr、xpdf、netpbm
  27. hOcr2Pdf.NET:hOcr2Pdf.NETは、プログラマーが高度に圧縮された検索可能なPDFをアプリケーションで作成するために使用できるライブラリです。要件: .NET 2.0以降、Tesseract 3.0、JBig2.exe
  28. PDFBeads:hOCRファイルに基づいて、スキャンした画像を単一の検索可能なPDFファイルに変換します。要件: Ruby、RMagick、hpricot
  29. ExactImage/hocr2pdf:hOCR入力から検索可能なPDFを作成します。要件: libagg
  30. HocrConverter:hOCRドキュメントからPDFとプレーンテキストを作成します。要件: Python、reportlab
  31. HocrToPdf.java:非常に基本的なhOCRからPDFへのコンバーターのJavaソースコード。コンパイル済みバージョンは、modi2hocrプロジェクトにあります。要件: Java、Jericho、iText2
  32. hOcr2Pdf.NET:TesseractまたはCuneiformによって生成された.hocr HTMLを、HtmlAgilityPackとiTextSharpを使用して検索可能なPDFに変換するための.NETライブラリです。要件: C#。
  33. Tally-Ho:Google Booksなどのサイトを対象としたスクリーンリーダーです。
  34. Mayan EDMS:tesseractをベースとしたドキュメント管理システムです。
  35. Olena:汎用で効率的な画像処理プラットフォームです(scriboと呼ばれる部分でtesseractを使用しています)。
  36. ocrodjvuは、OCRシステムのラッパーで、DjVuファイルのOCRを実行できます。
  37. PaRADIIT(Pattern Redundancy Analysis for Document Image Indexation & Transcription)は、2つの連続するGoogle DH賞によって開始および後援されたプロジェクトです。ルネサンス期の書籍を中心に、古代の書籍をアクセス可能なデジタルライブラリに変換することを目指しています。
  38. ISRI分析ツールは、OCR出力のパフォーマンス測定と実験を行うための17個のツールで構成されています。
  39. Indic Messenger インド語/英語のテキストを含む画像のOCRを行い、他のインドのスクリプトに翻字できるFacebookチャットボットです。
  40. LibreOCR 画像をOCTに変換し、Writerアプリケーションで開くことができるLibreOffice拡張機能です。
  41. hertzg/tesseract-server 軽量で、Dockerベースのマルチアーキテクチャ、ステートレスなJSON HTTP APIサービスです。

IMPACTプロジェクトの詳細については、tesseractフォーラムでのディスカッションを参照してください。