このページは、2018年5月1日時点の Tesseract 2.0x、3.0x、および 4.00.00alpha に関連するFAQページをアーカイブしたものです。
メインのFAQページには、Tesseract 4.0.0 以降に関連する情報が含まれます。
よくある質問
よくある質問とその回答、またはそのヒントを集めたものです。下に回答がない質問がある場合は、フォーラムに投稿してください。
目次
- OCR の速度を上げることはできますか?
- Windows: tesseract が起動直後に自動的に閉じます
- Tesseract はどのような出力形式を生成できますか?
- hOCR のベースライン出力を解釈する方法は?
- libtesseract.so.3: 共有オブジェクトファイルを開けません
- Tesseract が動作しません
- Tesseract をアンインストールする方法
- 同じマシンで複数のバージョンの Tesseract を実行する方法
- pixReadStream でエラーが発生
- eng.unicharset を開けませんか?
- leptonica ライブラリが見つかりません
- 圧縮された TIFF ファイルを読み取れません
- カラー画像で出力がありません
- マルチページ TIFF ファイルはサポートされていますか?
- viewer/svutil.cpp がコンパイルできないのはなぜですか?
- Ubuntu 14.04 用のトレーニングツールはどこにありますか?
- トレーニングで使用される Box ファイルを編集する方法は?
- Utf8 バッファが大きすぎます、サイズ=xx (トレーニング中のエラー)
- 数字のみを認識する方法は?
- 最初から再トレーニングせずに、お気に入りの言語に 1 つの文字または 1 つのフォントだけを追加するにはどうすればよいですか?
- 検索可能な PDF 出力を生成するにはどうすればよいですか?
- 生成された検索可能な PDF にはスペースしか含まれていないようです
- ストリーミングする方法
- 最小/最大テキストサイズはありますか?(画面テキストを読み取れません!)
- 出力が空または品質が低いのはなぜですか?
- 言語データファイルを生成する方法は?
- 既存の言語データファイルをアンパックまたは変更する方法は?
- 独自の辞書を提供する方法は?
- wordlist2dawg が動作しません!
- 辞書の信頼性/強度を高めるにはどうすればよいですか?
- configs とは何ですか?また、どうすれば増やせますか?
- 複数の画像をデコードするために同じ TessBaseAPI オブジェクトを使用すると、tesseract から一貫性のない結果が得られます
- グリフの上と下の発音区別符号が無視される/ガベージ出力の原因となる
- ドキュメントはどこにありますか?
- 次のバージョンを試すにはどうすればよいですか?
- [actual_tessdata_num_entries_<= TESSDATA_NUM_ENTRIES:Error:Assert failed:in file ..\ccutil\tessdatamanager.cpp, line 55_](#actual_tessdata_num_entries_-tessdata_num_entrieserrorassert-failedin-file-ccutiltessdatamanagercpp-line-55_)
- last_char == '\n':Error:Assert failed:in file ..\ccutil\tessdatamanager.cpp, line 95
- エラー:不正な最小または最大仕様
- エラー: inttemp に X クラスがありますが、unicharset には Y 個のユニチャーが含まれています。
- エラー: unicharset のサイズが MAX_NUM_CLASSES より大きいです
- エラーメッセージを stderr ではなく tesseract.log に出力する方法は?
- tesseract の情報行を抑制するにはどうすればよいですか?
- 各単語の座標と信頼度を取得するにはどうすればよいですか?
- 信頼度はどのように計算されますか?
- Tesseract を手書き認識に使用できますか?
- tesseract をバーコード認識に使用できますか?
- 古いバージョンの tesseract に関する問題
- Tesseract エンジンを vb6 プロジェクトに移植する方法は?
- tessdll.dll 用の Delphi ラッパー
- 不完全な OCR 結果
- エラー LNK2001: 未解決の外部シンボル “public: static char cdecl TessBaseAPI::TesseractRect(unsigned char const,int,int,int,int,int,int)”
- トレーニング時のボックスの重複、または複数行のブロブのエラー
- エラーメッセージ「mf.cpp:78: FEATURE_SET_STRUCT* ExtractMicros...」でトレーニングに失敗しました
- エラーメッセージ: サンプル 0 でフォント ID = -1/0、クラス ID = 1/105
- 私の質問はここにはありません!
ルールとアドバイス
Tesseract にバグを見つけたと思われる場合は、問題を提起してください。質問はユーザーメーリングリストで質問する必要があります。
GitHub で問題を報告したり、フォーラムで質問したりする前に、必ずCONTRIBUTINGガイドをお読みください。
OCR の速度を上げることはできますか?
複数の画像を処理している場合は、GNU Parallelを使用して tesseract を並行して実行できます。たとえば、代わりに
find . -maxdepth 1 -name "*.tif" -print0 | while IFS= read -r -d '' n; do
tesseract "$n" "$n" -l eng hocr
hocr2pdf -i "$n" -n -o "$n.pdf" < "$n.html"
done
次のように実行できます
parallel "tesseract {} {} -l eng hocr; hocr2pdf -i {} -n -o {}.pdf < {}.html" ::: *.tif
この例は少し古いことに注意してください。Tesseract に 1 ページの PDF ファイルを並行して生成させ、最後に QPDF などを使用してそれらを結合する方が、より良い結果が得られます。Tesseract 4 を実行している場合は、「高速」モデルを使用できます。
Tesseract 4 は、ページを処理中に最大 4 つの CPU スレッドも使用するため、1 ページの場合は Tesseract 3 よりも高速になります。お使いのコンピュータに 2 つの CPU コアしかない場合、4 つのスレッドを実行すると処理速度が大幅に低下するため、1 つのスレッドまたは最大 2 つのスレッドを使用する方が適切です。シングルスレッドを使用すると、マルチスレッドの計算オーバーヘッドが解消され、CPU コアごとに 1 つの Tesseract プロセスを実行して大量の画像を処理する場合にも最適なソリューションになります。環境変数 OMP_THREAD_LIMIT
を使用して、スレッドの最大数を設定します。マルチスレッドを無効にするには、OMP_THREAD_LIMIT=1
を使用します。
Windows: tesseract が起動直後に自動的に閉じます
Tesseract はコマンドラインプログラムであるため、コマンドラインから実行する必要があります。グラフィカルインターフェースを備えたプログラムが必要な場合は、3rdPartyページでいくつかのものが利用可能です。
Tesseract はどのような出力形式を生成できますか?
- txt
- hocr
- tsv
- テキストレイヤーのみを含む pdf
Tesseract は、プレーンテキスト、PDF、および HTML 出力を生成できます。Tesseract の標準出力は、プレーンテキストファイル (utf-8 エンコード、行末マーカーとして '\n') です。
構成ファイル「hocr」を使用すると、tesseract はhOCR 仕様に準拠した XHTML 出力を生成します (オペレーティングシステムがファイル名に utf-8 エンコード以外のものを使用している場合は、入力画像名が ASCII である必要があります - 詳細についてはissue 809を参照してください)。
構成ファイル「pdf」を使用すると、tesseract は、非表示の検索可能なテキストレイヤーを含むページ画像が含まれた検索可能な PDF を生成します。
hOCR のベースライン出力を解釈する方法は?
eurotext.tif の最初の行の hOCR 出力には、次の情報が含まれています
<span class='ocr_line' id='line_1_1' title="bbox 105 66 823 113; baseline 0.015 -18; …
bbox は、画像座標での線のバウンディングボックス (青) です。ベースラインの 2 つの数値は、バウンディングボックス (赤) の左下隅に対するベースラインを記述する線形方程式の傾き (1 番目の数値) と定数項 (2 番目の数値) です。ベースラインは y 軸を -18
で横切り、その傾斜角は arctan(0.015) = 0.86°
です。一般に、ベースラインは、係数 pn ... p0
を持つ次数 n
の多項式で記述され、直線の場合 n = 1 になります (hOCR 仕様を参照)。
libtesseract.so.3: 共有オブジェクトファイルを開けません
「sudo make install」の後に「sudo ldconfig」を実行します。issue 621を参照してください。
Tesseract が動作しません
tesseract のインストールが 1 つだけであることを確認してください。たとえば、同じコンピュータに tesseract 3.01 と 3.02 がインストールされている場合、(共有ビルドの場合) 問題が報告されています。例: issue 793を参照してください
Tesseract をアンインストールする方法
tesseract-ocr
ディレクトリで、次を実行します
sudo make uninstall
トレーニングツールをインストールした場合は、次も実行します
sudo make training-uninstall
Tesseract の異なるバージョンを比較する方法
複数のバージョンの tesseract を使用する場合 (例: OCR 結果を比較する場合)、ソースからコンパイルする (例: /usr/src) ことにして、インストールしないことをお勧めします。特定のバージョンをテストする場合は、次のように実行できます
/usr/src/tesseract-3.03/api/tesseract eurotext.tif eurotext
/usr/src/tesseract-ocr.3.02/api/tesseract eurotext.tif eurotext
/usr/src/tesseract-3.03/api/tesseract はシェルラッパースクリプトであり、正しい共有ライブラリが使用されるように処理します (インストールせずに...)。
pixReadStream でエラーが発生
このエラーが表示された場合は、leptonica のインストールに問題があります。たとえば、画像形式のサポートが不足しています。通常、これは、leptonica のビルド中に適切な画像ライブラリが正しくインストールされなかったか、leptonica 内に構成上の問題があることを意味します。
eng.unicharset を開けませんか?
言語トレーニングデータがインストールされていません。READMEをお読みください。
leptonica ライブラリが見つかりません
./configure
を実行したときにこのエラーメッセージが表示され、leptonica ヘッダーファイルが /usr/local/include
にある場合 (たとえば、leptonica を /usr/local
にインストールした場合) は、次を実行します
LIBLEPT_HEADERSDIR=/usr/local/include ./configure
または
CPPFLAGS="-I/usr/local/include" LDFLAGS="-L/usr/local/lib" ./configure
圧縮された TIFF ファイルを読み取れません
このエラーメッセージが表示されます
read_tif_image:Error:Illegal image format:Compression
Windows (Visual C++): Libtiff サポートは、次の手順で VC++6 または VC++Express のいずれかに追加できます
libtiff の Windows ダウンロードに移動し、次の手順に従います
Download and run the setup program.
Add the paths for include and library files in tools/options/directories
Add HAVE_LIBTIFF to the preprocessor definitions.
Add libtiff.lib to the list of libraries.
Rebuild.
Put libtiff3.dll be in your path somewhere.
This is done by control panel/system/advanced/environment variables and adding c:/program files/gnuwin32/bin to PATH.
Keep your fingers crossed...
Windows 以外 (および Cygwin): libtiff-dev をインストールします。手順は OS によって異なりますが、多くの場合は次のような手順で実行できます
sudo apt-get install libtiff-dev
またはそのバリエーションで、構成を実行する前に、問題が解決するはずです。
カラー画像で出力がありません
libtiff の有無にかかわらず、カラー画像で空白またはガベージ出力に関するバグレポートがいくつかあります。以下は、最新情報です (最終更新日 2008 年 9 月 23 日)
libtiff がない場合、Tesseract は非圧縮の tiff ファイルのみを読み取ります。それでも、32 ビットの tiff ファイルを正しく読み取りません。2.04 で修正されます。(libtiff を使用すると、ほとんどの画像深度 (16 ビットを除く) を正しく処理できることを意味します。)
libtiff を使用すると、Tesseract は圧縮された tiff ファイルを読み取りますが、24 ビットまたは 32 ビットのあらゆるカラーを処理できません。1 ビットのバイナリ画像または 8 ビットのグレースケールのみを読み取ることができます。(カラーマップはありません!) 2.04 で修正されました。
API (TessBaseAPI) は、1、8、24、または 32 ビットの画像で正常に動作するはずです。
マルチページ TIFF ファイルはサポートされていますか?
はい、libtiff がインストールされている限り、すべてのバージョン 2.03 以降でサポートされています。上記の圧縮 TIFF を参照してください。
viewer/svutil.cpp がコンパイルできないのはなぜですか?
このファイルは、外部プロセスで実行されるビューアとのインターフェースであるため、移植性の問題の最大の原因です。もしあなたのシステムでコンパイルできた場合は、変更した内容を記録して問題を報告してください。ただし、現在のバージョンについてのみお願いします。もしコンパイルできない場合は、コンパイラで(すべてのソースに対して) GRAPHICS_DISABLED を定義すると、コンパイルが難しいコードがすべてコメントアウトされ、ビューア機能が無効になります。これはほとんどの人が使用しない機能です。
Unix 系システムでは、configure スクリプトで以下のようにグラフィックスを無効にするよう指示できます。
configure --disable-graphics
Ubuntu 14.04 用のトレーニングツールはどこにありますか?
見落としにより、トレーニングツールは Ubuntu 14.04 に同梱されていません。次の Ubuntu リリースを待つか、以下のコマンドを使用してください。
sudo apt-get build-dep tesseract-ocr
sudo apt-get install devscripts
dget http://http.debian.net/debian/pool/main/t/tesseract/tesseract_3.03.03-1.dsc
tar xvzf tesseract_3.03.03.orig.tar.gz
cd tesseract-3.03
zcat ../tesseract_3.03.03-1.diff.gz | patch -p1
debuild -us -uc
cd ..
sudo dpkg -i *.deb
トレーニングで使用される Box ファイルを編集する方法は?
これに役立つさまざまなプログラムがあります。AddOns ページを参照してください。
Utf8 バッファが大きすぎます、サイズ=xx (トレーニング中のエラー)
認識可能な各単位(文字/書記素/グリフ)の utf-8 表現には 30 バイトの上限があります。これは簡単には増やすことができません。ボックスファイルで異常に長い文字列がないか確認してください。
数字のみを認識する方法は?
Tesseract 3
次のように digits
設定ファイルを使用します。
tesseract imagename outputbase digits
Tesseract 2.03
使用方法:
TessBaseAPI::SetVariable("tessedit_char_whitelist", "0123456789");
Init 関数を呼び出す**前**、または tessdata/configs/digits
というテキストファイルに以下を記述します。
tessedit_char_whitelist 0123456789
すると、コマンドラインは次のようになります。
tesseract image.tif outputbase nobatch digits
警告: バージョン 2.03/2.04 では(バージョン 3.00 以降ではそうではありません)、digits
の前に nobatch
を**必ず**記述してください。
最初から再トレーニングせずに、お気に入りの言語に 1 つの文字または 1 つのフォントだけを追加するにはどうすればよいですか?
1つの文字やフォントだけを追加することはできません。最初から再トレーニングする必要があります。Tesseract のトレーニングに関するドキュメントを参照してください。
検索可能な PDF 出力を生成するにはどうすればよいですか?
検索可能な PDF 出力は、Tesseract バージョン 3.03 から標準機能です。次のように pdf
設定ファイルを使用します。
tesseract phototest.tif phototest pdf
検索可能な PDF には、スペースまたは単語の文字間のスペースのみが含まれているようです。
PDF 自体には問題がない可能性がありますが、その隠された検索可能なテキストレイヤーが PDF リーダーで理解されていない可能性があります。たとえば、Mac OS X の Preview.app はこのような問題を抱えていることがよく知られており、スペースのみでテキストが表示されない場合があります。代わりに Adobe Acrobat Reader を使用してみてください。
ストリーミングする方法
例えば、素晴らしいが低速な複数ページスキャニングデバイスがあるとしましょう。スキャン中に OCR を実行できれば便利です。この例では、スキャニングプログラムは、生成された画像ファイル名を Tesseract に送信しています。Tesseract は検索可能な PDF を stdout にストリームします。この機能を使用するには、Tesseract v3.04 以降が必要です。
scanimage --batch --batch-print | tesseract -c stream_filelist=true - - pdf > output.pdf
最小/最大テキストサイズはありますか?(画面テキストを読み取れません!)
適切な精度を得るには、最小のテキストサイズがあります。ポイントサイズだけでなく、解像度も考慮する必要があります。精度は 10pt x 300dpi 未満で低下し、8pt x 300dpi 未満では急速に低下します。簡単な確認方法は、文字の x-height (小文字の x の高さ) のピクセル数を数えることです。10pt x 300dpi では、x-height は通常約 20 ピクセルですが、フォントによって大きく異なる場合があります。x-height が 10 ピクセルを下回ると、正確な結果を得る可能性は非常に低くなり、約 8 ピクセルを下回ると、テキストのほとんどが「ノイズ除去」されます。
LSTM を使用する場合、x-height には 30 ピクセル前後の上限もあるようです。それを超えると、Tesseract は正確な結果を生成しません。従来のエンジンはこれになりにくいようです(https://groups.google.com/forum/#!msg/tesseract-ocr/Wdh_JJwnw94/24JHDYQbBQAJ を参照)。
出力が空または品質が低いのはなぜですか?
品質向上のドキュメントを参照してください。
言語データファイルを生成する方法は?
Tesseract のトレーニングに関するドキュメントを参照してください。
既存の言語データファイルをアンパックまたは変更する方法は?
combine_tessdata コマンドを使用します。その使用方法の詳細については、combine_tessdata マニュアルページを参照してください。
独自の辞書を提供する方法は?
Tesseract 3
単語リストを追加するには、tesseract(1) で説明されているように、.user-words ファイルを作成します。
辞書全体を置き換えたい場合は、.traineddata ファイルを展開し、新しい word-dawg ファイルを作成してから、ファイルを .traineddata ファイルに戻す必要があります。詳細については、TrainingTesseract を参照してください。
Tesseract 2
簡単:tessdata/eng.user-words
を、同じ形式(UTF8 テキスト、1行に1単語)の独自の単語リストで置き換えます。
より難しいですが、大きな辞書にはより適しています。tessdata/eng.word-dawg
を、独自の単語リストから wordlist2dawg を使用して作成されたもので置き換えます。詳細については、Tesseract のトレーニングのドキュメントを参照してください。
wordlist2dawg が動作しません!
2.03 の wordlist2dawg にはメモリの問題があります。1GB を超えるメモリがない場合、システムが停止し、非常に遅くなります。training/wordlist2dawg.cpp の 39〜40 行目で、max_num_edges と reserved_edges の両方を 10 分の 1 に減らし、再構築してください。
新しい dawg を正常に作成しても、次のエラーが原因で読み込まれない場合は、
Error: trying to read a DAWG '%s' that contains %d edges while the maximum is %d.
dawg.h の MAX_NUM_EDGES_IN_SQUISHED_DAWG_FILE の値を変更してみてください。
辞書の信頼性/強度を高めるにはどうすればよいですか?
tesseract-ocr < 3.01 の場合は、dict/permute.cpp の NON_WERD と GARBAGE_STRING を 3 または 5 に増やしてみてください。
tesseract-ocr >= 3.01 の場合は、設定ファイルで language_model_penalty_non_freq_dict_word と language_model_penalty_non_dict_word の変数を増やしてみてください。デフォルトでは、それぞれ 0.1 と 0.15 です。
tesseract-ocr 2.0x の場合: 認識しているテキストフォントがトレーニングデータと大幅に異なり、速度低下を気にしない場合は、classify/intmatcher.cpp の ClassPrunerThreshold を 229 から約 200 に下げてみてください。これらの対策はすべて、辞書が非単語から単語を解決する能力を向上させるはずです。
もちろん、辞書の力を高める変更は、辞書の単語を幻視する能力も高めます。これが問題である場合は、短い単語を辞書から除外してください。また、より頻繁に使用される単語とのあいまいさを増やす場合は、めったに使用されない膨大な単語リストを追加しないでください。
反対に、辞書をオフにするには、combine_tessdata を使用して traineddata ファイルから適切な dawg を削除するか、適切な load_type_dawg パラメータを false に設定できます。ただし、これは設定ファイルと、configs 引数を取る Init のバージョンで行う必要があります。パラメータは初期化を制御しているため、SetVariable では実行できません。type は、punc、system、number、bigram、freq、unambig のいずれかです。
configs とは何ですか?また、どうすれば増やせますか?
config は、tesseract で多義的に使用される単語です。1つの意味は、tessdata/configs/segdemo などの、デバッグや動作の変更に使用される制御パラメータのファイルです。
もう1つの意味は、トレーニングと分類器で使用されます。
config は、(潜在的に)異なるフォントからの文字の異なる形状を表します。MAX_NUM_CONFIGS の制限は、mftraining のコマンドラインで、1つの文字のサンプルを含む異なるファイルの数に適用されます。各ファイルは異なるフォントを表すと想定されるためです。現在 (2.03) は 32 個の config の制限があります。すべてのファイルにすべての文字が含まれていない場合は、mftraining コマンドラインで 32 個を超えるファイルを使用しても構いません。
問題を修正するその他の方法
ファイルに非常によく似たサンプルが含まれている場合は、それらを cat して 1 つのファイルにまとめて、ファイルの総数を減らすことができます。2 つのファイルの文字が非常に異なる場合は、**そうしないでください**。
MAX_NUM_CONFIGS を増やします(intproto.h 内)。これには影響があります。MAX_NUM_CONFIGS の異なる値で生成された inttemp ファイルは読み取りできなくなります。バージョン 3.0 でこの弱点を克服するよう取り組んでいます。ただし、2.04 には含まれません。また、分類が遅くなり、より多くのメモリを使用するようになります。
複数の画像をデコードするために同じ TessBaseAPI オブジェクトを使用すると、tesseract から一貫性のない結果が得られます
ClearAdaptiveClassifier()
でアダプティブデータをクリアするか、設定変数でアダプティブ分類器をオフにしてみてください。
classify_enable_learning 0
classify_enable_adaptive_matcher 0
tesseract フォーラムでの議論も参照してください。
グリフの上または下のダイアクリティカルマークは無視されるか、ガベージ出力の原因になります。
textord_min_linesize のデフォルト値(1.25)をより高い値に増やしてみてください。一部のユーザーは、2.5 の値で良い結果を報告しています。
ドキュメントはどこにありますか?
ご覧のとおりです。不明な点がある場合は、Tesseract Google グループで検索するか、そこで質問してください。さらに多くの記事を書くのを手伝いたい場合は、ぜひそうしてください。そして、グループに投稿してください!
次のバージョンを試すにはどうすればよいですか?
定期的に安定版がダウンロードページに掲載されます。リリース間、特に新しいリリースの直前には、最新のコードが git から入手できます。ソースは https://github.com/tesseract-ocr/tesseract.git にあり、コマンドラインでチェックアウトするか、さまざまなクライアントプログラムとプラグインの使用方法に関するリンクに従うことができます。
actual_tessdata_num_entries_<= TESSDATA_NUM_ENTRIES:Error:Assert failed:in file ..\ccutil\tessdatamanager.cpp, line 55_
tesseract の実行中にエラーが発生した場合は、traineddata の正しいバージョン(例: 3.01 を使用する場合は 3.00 など)を使用しているかどうかを確認してください。tesseract 3.00 で 3.01 traineddata を使用することはできません。
last_char == '\n':Error:Assert failed:in file ..\ccutil\tessdatamanager.cpp, line 95
combine_tessdata の実行中にエラーが発生した場合
これは、lang.unicharambigs の末尾に空行がないことを示しています。
エラー:不正な最小または最大仕様
これは、数値形式(Linux では「ロケール」、Windows では「地域と言語オプション」)が英語形式と異なる場合に発生する可能性があります。解決策は、tesseract を呼び出す前に、LC_NUMERIC のロケールを(コード内で)「C」に設定することです。場合によっては、locale.h を含める必要があります。
#include <locale.h>
setlocale (LC_NUMERIC, "C");
別のオプションは、ユーザーロケール/地域設定を調整することです。
エラー: inttemp に X クラスがありますが、unicharset には Y 個のユニチャーが含まれています。
(Y != X の場合) 2 つの可能性があります: X ~= Y (通常は X < Y): 通常は、トレーニングプロセスの失敗が原因です。tr ファイル生成プロセスからの FATALITY メッセージを探してください。トレーニングプロセスが一部の文字のサンプルを拾い上げることができず、tr ファイルにエントリがないため、(mftraining の) inttemp ファイルに含まれていないようです。applybox には、多くの人にとって問題を発生させる悪い問題があります。文字サンプルを間隔を空ける必要があります。
X はワイルドな数 (非常に大きいプラスまたはマイナス) で、Y は言語に応じて 100 から数千の間の妥当な数です。inttemp ファイルの破損、または (自分でトレーニングしていない場合は) ハードウェアに自動的に検出されないおかしなエンディアンアーキテクチャがあります。ビッグエンディアンまたはリトルエンディアン 32 ビットおよび 64 ビットは**機能するはず**ですが、混合エンディアン(0x12345678 -> 0x56 0x78 0x12 0x13 など)は**機能しません**。適切なハードウェアアーキテクチャを入手するか、自分で再トレーニングしてください。そうすれば、inttemp はハードウェアと一致します。
エラー: unicharset のサイズが MAX_NUM_CLASSES より大きいです
ビルドのために (dict/matchdefs.h の) MAX_NUM_CLASSES を増やすだけです。イシュー 670 と 743 を参照してください。
エラーメッセージを stderr ではなく tesseract.log に出力する方法は?
コンソールウィンドウへの書き込みではなく、tesseract.log に書き込むという古い動作を復元するには、次の内容を含むテキストファイルが必要です。
debug_file tesseract.log
ファイルに ‘logfile’ という名前を付け、tessdata/configs/ に配置します。次に、コマンドラインの最後に logfile を追加します。
tesseract の情報行を抑制するにはどうすればよいですか?
イシュー 579 を参照してください。Linux では、stderr および stdout 出力を /dev/null にリダイレクトできます。例えば
tesseract phototest.tif phototest 1>/dev/null 2>&1
tesseract 3.02 では、設定 "quiet" を使用できます。例えば
tesseract phototest.tif phototest quiet
警告: どちらのオプションも、エラーが発生した場合にエラーメッセージが表示されなくなります。
各単語の座標と信頼度を取得するにはどうすればよいですか?
2つの選択肢があります。プログラミングにあまり関わりたくない場合は、TesseractのhOCR出力形式を使用できます(詳細はTesseractのマニュアルページを参照してください)。プログラミングに抵抗がない場合は、Tesseract APIを使用してください。
信頼度はどのように計算されますか?
- 文字 - 学習サンプルからの文字の0から1の間の距離尺度を計算します。
- 確実性 = -20 * 距離
- 評価 = 距離 * アウトライン長
- 単語
- 確実性 = 単語内の文字の確実性の最小値。
- 評価 = 単語内の文字の評価の合計。
Tesseract を手書き認識に使用できますか?
できますが、Tesseractは印刷されたテキスト向けに設計されているため、あまりうまくいきません。代わりに、Lipi Toolkitプロジェクトを見てください。
tesseract をバーコード認識に使用できますか?
いいえ。Tesseractはテキスト認識用です。
古いバージョンの tesseract に関する問題
(ステータスが「Look-here-for-help」のissueトラッカーからの情報。)
Tesseract エンジンを vb6 プロジェクトに移植する方法は?
issue 42の提案を参照してください。
tessdll.dll 用の Delphi ラッパー
アドオンのドキュメントを参照するか、issue 88のコメントを参照してください。
不完全な OCR 結果
issue 44の提案を参照してください。
エラー LNK2001: 未解決の外部シンボル "public: static char cdecl TessBaseAPI::TesseractRect(unsigned char const,int,int,int,int,int,int)" (?TesseractRect@TessBaseAPI@@SAPADPBEHHHHHH@Z)
バージョン2.04とVC++ 6を使用している場合は、baseapi.hを含める前に#define TESSDLL_IMPORTSを追加してください。(issue 297を参照)
トレーニング時のボックスの重複、または複数行のブロブのエラー
このエラーが発生した場合は、ページセグメンテーションの値5または6を使用してみてください。例:
tesseract input_image output -psm 6 batch.nochop makebox
または、issue 471の他の提案を参照してください。
エラーメッセージ「mf.cpp:78: FEATURE_SET_STRUCT* ExtractMicros...」でトレーニングに失敗しました
入力画像を改善する方法については、issue 488の提案を参照してください。
エラーメッセージ: サンプル 0 でフォント ID = -1/0、クラス ID = 1/105
これは、フォント名がfont_propertiesにないか、font_propertiesが要件を満たしていないことを意味します。
私の質問はここにはありません!
フォーラム:http://groups.google.com/group/tesseract-ocr で検索してみてください。あなたの質問は、ここにリストされていなくても以前に提起されている可能性があります。