Tesseract OCR を使用する GUI およびその他のプロジェクト
1. GUI
名称 | Linux | Mac | Windows | ライセンス | 説明 |
---|---|---|---|---|---|
Scribe OCR | 〇 | 〇 | 〇 | AGPL-3.0 ライセンス | Scribe OCR は、テキスト認識、OCR データの校正、および完全にデジタル化されたドキュメントの作成のための、無料かつオープンソースのウェブアプリケーションです。ライブサイトは scribeocr.com です。 |
Rescribe | 〇 | 〇 | 〇 | GPL v3 | インストール不要の使いやすい Tesseract フロントエンドで、PDF 処理、Google ブックスのダウンロード、追加の前処理および後処理機能が含まれています。 |
normcap | 〇 | 〇 | 〇 | GPL v3 | 画像ではなく情報をキャプチャするための、OCR 搭載スクリーンキャプチャツール。 |
gImageReader | 〇 | 〇 | GPL v3 | tesseract-ocr のグラフィカル GTK フロントエンド | |
VietOCR | 〇 | 〇 | 〇 | Apache 2.0 | Tesseract OCR エンジンの GUI フロントエンドです。ベトナム語および Tesseract でサポートされている他の言語の光学文字認識をサポートしています。 |
NeOCR | 〇 | フリーウェア | Tesseract 4.0 OCR エンジンの GUI フロントエンドです。 | ||
Free-Ocr-Windows-Desktop | 〇 | GNU AGPL v3 | Windows デスクトップ用の無料 OCR アプリケーションです。基本的に、Tesseract OCR エンジンのグラフィカルユーザーインターフェース (GUI) です。このアプリケーションには、スキャンされた PDF ファイルの読み取りもサポートされています。 | ||
YAGF | 〇 | GPL v3 | cuneiform と tesseract のグラフィカルフロントエンド | ||
OCR2Text | 〇 | 〇 | 〇 | MIT | PDF を TXT にバッチ処理するための CLI ツール |
OCRFeeder | 〇 | GPL v3 | OCRFeeder は、ドキュメントレイアウト解析と光学文字認識システムです。 | ||
Lector | 〇 | 〇 | GPL v2 | Python、Qt4、および Tesseract OCR をベースとした、GNU/Linux 用のグラフィカル OCR ソリューションです。 | |
Tesseract-OCR QT4 gui | 〇 | Apache 2.0 | Tesseract-OCR QT4 gui は、tesseract のシンプルな GUI です。 | ||
Lime OCR | 〇 | GPL v3 | tesseract-ocr エンジンを使用した、Windows 用のシンプルで無料の OCR ソフトウェアです。 | ||
Ocrivist | 〇 | GPL v3 | Ocrivist は、書籍やその他の印刷されたドキュメントを PDF または Djvu 形式でスキャンして OCR することを可能にするユーティリティです。 | ||
Tesseract-GUI | 〇 | GPL v2 | Tessract-GUI は tesseract-ocr のフロントエンドではなく、ImageMagick を使用して簡単な画像操作を行うグラフィカルな方法です。 | ||
QTesseract | 〇 | LGPL v3 | Tesseract OCR の QT GUI | ||
dpScreenOCR | 〇 | 〇 | zlib | 画面上のテキストを認識するプログラム | |
pmOCR | 〇 | BSD | バッチ OCR ツール、tesseract によるファイルモニターイベント OCR も | ||
tesseract4java | 〇 | 〇 | 〇 | GPLv3 | バッチ認識や精度評価などの高度な機能を備えた、Tesseract のトレーニングと実行のためのクロスプラットフォーム GUI です。 |
Linux-Intelligent-OCR-Solution(lios) | 〇 | GPLv3 | 視覚障害者向けに完全なアクセシビリティを備え、スキャナー輝度オプティマイザー、テキストクリーナーなどの高度な機能を備えた、Tesseract のスキャン、実行、トレーニングのための GUI です。 | ||
SunnyPages OCR | 〇 | プロプライエタリ | 画像の明るさの自動調整、画像処理、および PDF サポートを備えた、Tesseract OCR エンジンの GUI フロントエンドです。 | ||
PDF OCR X | 〇 | 〇 | プロプライエタリ | PDF OCR は、Mac OS X と Windows 用のシンプルなドラッグアンドドロップユーティリティで、PDF と画像をテキストドキュメントまたは検索可能な PDF ファイルに変換します。 | |
TaxWorkFlow | 〇 | プロプライエタリ | TaxWorkFlow は、Tesseract OCR エンジンの GUI フロントエンドを含む会計業務管理アプリケーションです。このアプリは AVX をサポートしており、PDF ファイルおよび 100 以上の画像ファイル形式から、選択した解像度と圧縮率の OCR された PDF ファイルを作成できます。 | ||
AmhOCR | 〇 | GPLv3 | 複数の前処理/後処理 GUI を備えた、Tesseract 搭載の Windows デスクトップ OCR アプリケーション | ||
TesseractStudio.Net Github | 〇 | プロプライエタリ | (実行ファイル、ソースコードは利用不可、サイトURLは無効) tesseract 4.0 のグラフィカルインターフェース | ||
TesseractStudio.Net | 〇 | プロプライエタリ | tesseract 4.0 のグラフィカルインターフェース | ||
ImageTrans | 〇 | 〇 | 〇 | プロプライエタリ | Tesseract を使用してページ全体、画像の選択領域、またはスクリーンショットの OCR を実行できる画像翻訳ツールです。 |
NAPS2 | 〇 | 〇 | 〇 | GLP2 | できるだけ簡単に、ドキュメントを PDF などに変換します。 |
Ave React OCR | 〇 | MIT | avernakis react によって動作するシンプルな OCR アプリです。 |
2. オンライン OCR サービス
- OCR.net:バックエンドで PDF OCR X を使用しています。PDF と画像をテキストまたは検索可能な PDF に変換します。
- 無料 OCR
- i2OCR
- Indic-OCR OCR サービス インドの言語向けのオンライン OCR サービスです。
3. モバイル
- Android:
- tess-two - Android 用 Tesseract ツールのフォーク tesseract-android-tools にいくつかの追加機能を追加したもの。
- Tesseract4Android - 最新バージョンの Tesseract OCR をサポートするためにゼロから書き直された tess-two のフォーク。
- textfairy ソースコードは github.com にある Android OCR アプリ。
- 文字認識 ソースコードは gitorious.org にある Android OCR アプリ。
- tesseract-android-tools:Android API のセット(2013年1月28日に Google Code Archive にアーカイブ)
- Mobile OCR:Mobile OCR の目標は、携帯電話のカメラで撮影した画像からテキストを認識する Android プラットフォーム用のアプリケーションを作成することです。このアプリケーションは、視覚障害者や盲目のユーザーにとって完全にアクセス可能です。
- Across India:ユーザーがインドの言語または英語の看板の写真を撮り、読める言語に翻字できるアプリです。
- iOS:
- Tesseract-OCR-iOS - Tesseract OCR iOS は iOS7+ 用のフレームワークで、armv7s と arm64 でもコンパイルされています。
- OCR-iOS-Example - iOS で光学文字認識 (OCR) を実行する方法の簡単な例です。
- Tesseract-iPhone-Demo - tesseract 2.04 をベースにした例です。
- その他の OS:
- ScanBizCards:名刺スキャンのモバイルソリューション。要件:iPhone 4/iPhone 3/Android 2.0
- macOS:
- Tesseract macOS - Objective C と swift の両方をサポートする macOS 用の Tesseract OCR フレームワークです。x86 と arm64 の両方でコンパイルされています。
4. その他(ユーティリティ、ツール、コマンドラインインターフェース [CLI] など)
A. PDF を検索可能な PDF に変換するツール
(つまり、検索不可能な PDF も入力として処理できるツール)
- OCRmyPDF - スキャンされた PDF ファイルと画像に OCR テキストレイヤーを追加して、検索できるようにします。マルチコア CPU でページを並列処理します。可能な場合は、JPEG を再圧縮せずに、元の埋め込み画像の正確な解像度を維持します。いくつかの画像前処理オプション、詳細なドキュメント、および多くの特殊な PDF のサポートが含まれています。
- pdf2pdfocr は、PDF(またはサポートされている画像)の OCR を実行し、元のファイルにテキストレイヤーを追加して検索可能な PDF にするツールです。tesseract とその他のオープンソースツールを使用する Python スクリプトです。Linux、macOS、Windows をサポートしています。
- pdf2searchablepdf - 検索できない PDF、または画像のディレクトリ全体を検索可能な PDF に変換できるツールです。
B. その他
- Scantools - スキャンされたドキュメントの処理と高品質な PDF ファイルの生成を目的として記述された、グラフィック操作用のライブラリと一致するコマンドラインアプリケーションのセットです。**image2pdf** は画像を PDF に変換します。Tesseract などの光学文字認識プログラムによって生成された HOCR ファイルをオプションで指定して、PDF ファイルを検索可能にすることができます。生成されたファイルは、デジタルドキュメントの長期間保存のための ISO PDF/A 標準に準拠しています。**hocr2any** は HOCR ファイルをテキストに変換するか、ラスターグラフィックまたは PDF ファイルとしてレンダリングします。**ocrPDF** は Tesseract OCR エンジンを使用してテキストを検出し、PDF ファイルにテキストレイヤーを生成します。
- ocr-fileformat - OCR ファイル形式 (hOCR、ALTO、PAGE、FineReader) の検証と変換を行います。
- Tess4J - Tesseract OCR API の Java JNA ラッパーです。
- Traineddata インスペクター - traineddata ファイルの内部構造の一部を検査するためのツールです。
- TopOCR - tesseract-ocr をサポートするカメラ用の高品質 OCR(有料製品)
- シンプルな OCR Web サーバー python、flask、tesseract-ocr、leptonica を使用しています。
- Display OCR は、OpenCV-Python + python-tesseract による 7 セグメントフォントのリアルタイム画像前処理と OCR です。
- OpenOCR は、独自の OCR REST API を簡単にホストできるようにします。
- https://github.com/guitarmind/tesseract-web-service は、tornado を使用した tesseract-OCR の RESTful ウェブサービスの実装です。
- RasterEdge .NET Image SDK - OCR 認識 は、デスクトップアプリケーションまたはサーバーアプリケーション用のロイヤリティフリー配布の堅牢で高性能な認識アプリケーションです。
- DevScope OCR SDK は、Microsoft .NET framework を使用したアプリケーションの開発を可能にする、Tesseract OCR v3 をベースとした光学文字認識ツールキットエンジンです。
- Paperwork - OCR を使用して簡単に古くなった書類を検索する(pyocr が必要)
- Aletheia - 生産環境向けの高度なドキュメントレイアウトとテキストグラウンドトゥルースシステム
- gscan2pdf スキャンされたドキュメントから PDF または DjVu を作成するための GUI
- Audiveris は、楽譜の画像を処理して MusicXML 標準で自動的に記号音楽情報を提供するオープンソースの光学音楽認識ソフトウェアです。
- Ocrivist は、書籍やその他の印刷されたドキュメントを PDF または Djvu 形式でスキャンして OCR することを可能にするユーティリティです。
- thu-ipv6-login authcode の OCR をサポートした、清華大学の IPv6 認証のための Python スクリプトです。
- Wolfram Mathematica 9.0 は、テキスト認識 に tesseract を使用します。
- node-dv は、スキャンされたドキュメントを処理および理解するための node.js ライブラリです。
- hocr-tools - HTML に埋め込むことで多言語 OCR 結果を表す hOCR 形式を操作および評価するための Python ツールです。検索可能な pdf を作成するための hocr-pdf ツールが含まれています。
- PyPDFOCR - Tesseract-OCR ベースの PDF ファイリング
- ChronoScan は、ドキュメントのスキャンとデータ入力のための完全なスイートです。
- speedy-ocr は、スキャンとOCRを簡素化し、視覚障害者コミュニティを支援するためのユーティリティです。Vinuxプロジェクトの一部です。
- Project VIRAL Varico 請求書認識システム(アシスト学習付き)
- Bindery:後処理されたスキャン済みページをデジタルドキュメントにバインドするためのシンプルなGUIです。
- Clarify:Clarifyは、「画像のみ」のPDFのOCRに役立ちます。入力は、通常テキストを抽出できないPDFです。出力はテキストです。Clarifyは、tesseract-ocr、xpdf、netpbmをラップするPythonモジュールです。要件: Python、tesseract-ocr、xpdf、netpbm
- hOcr2Pdf.NET:hOcr2Pdf.NETは、プログラマーが高度に圧縮された検索可能なPDFをアプリケーションで作成するために使用できるライブラリです。要件: .NET 2.0以降、Tesseract 3.0、JBig2.exe
- PDFBeads:hOCRファイルに基づいて、スキャンした画像を単一の検索可能なPDFファイルに変換します。要件: Ruby、RMagick、hpricot
- ExactImage/hocr2pdf:hOCR入力から検索可能なPDFを作成します。要件: libagg
- HocrConverter:hOCRドキュメントからPDFとプレーンテキストを作成します。要件: Python、reportlab
- HocrToPdf.java:非常に基本的なhOCRからPDFへのコンバーターのJavaソースコード。コンパイル済みバージョンは、modi2hocrプロジェクトにあります。要件: Java、Jericho、iText2
- hOcr2Pdf.NET:TesseractまたはCuneiformによって生成された.hocr HTMLを、HtmlAgilityPackとiTextSharpを使用して検索可能なPDFに変換するための.NETライブラリです。要件: C#。
- Tally-Ho:Google Booksなどのサイトを対象としたスクリーンリーダーです。
- Mayan EDMS:tesseractをベースとしたドキュメント管理システムです。
- Olena:汎用で効率的な画像処理プラットフォームです(scriboと呼ばれる部分でtesseractを使用しています)。
- ocrodjvuは、OCRシステムのラッパーで、DjVuファイルのOCRを実行できます。
- PaRADIIT(Pattern Redundancy Analysis for Document Image Indexation & Transcription)は、2つの連続するGoogle DH賞によって開始および後援されたプロジェクトです。ルネサンス期の書籍を中心に、古代の書籍をアクセス可能なデジタルライブラリに変換することを目指しています。
- ISRI分析ツールは、OCR出力のパフォーマンス測定と実験を行うための17個のツールで構成されています。
- Indic Messenger インド語/英語のテキストを含む画像のOCRを行い、他のインドのスクリプトに翻字できるFacebookチャットボットです。
- LibreOCR 画像をOCTに変換し、Writerアプリケーションで開くことができるLibreOffice拡張機能です。
- hertzg/tesseract-server 軽量で、Dockerベースのマルチアーキテクチャ、ステートレスなJSON HTTP APIサービスです。
IMPACT関連
- IMPACTセンター - IMPACTの成果を維持し、コミュニティ構築を促進するために設立された非営利団体です。
- IMPACTデータ
- IMPACTツール
- IMPACT相互運用性フレームワーク - IMPACTプロジェクト中に開発されたソフトウェアコンポーネントの疎結合をサポートする相互運用性レイヤーです。
- インベントリ抽出ツールプロトタイプは、特定の言語辞書やフォントライブラリを参照せずに、ドキュメントから完全な文字リストを抽出できるグラフィカルユーザーインターフェース(GUI)を備えたプロトタイプです。
- ポスト補正ツールは、OCRされたドキュメントの対話型ポスト補正ツールです。テキストおよびエラープロファイラによって取得された情報を使用して、補正プロセス全体が処理中のドキュメントに適応します。このように、通常は膨大な数の体系的なエラーを、ほんの数回のキーストロークで修正できます。
- OCR評価ツール.
- BlackLabは、Apache Lucene上に構築されたコーパス検索エンジンです。大規模でタグ付けされ、注釈が付けられたテキスト本文に対する高速で複雑な検索を、正確なヒット強調表示と共に実行できます。オランダ語辞書研究所(INL)で開発され、歴史的および現代的なテキストコーパスに対する高速で機能豊富な検索インターフェースを提供します。
IMPACTプロジェクトの詳細については、tesseractフォーラムでのディスカッションを参照してください。