コンテンツへスキップ

リリースノート

このページには、最新のリリースノートが掲載されています。

目次

開発中

Tesseract の API/ABI 変更に関するレビュー

API/ABI changes graph

api_abi_changes.png

V5.5.0

2024年11月10日

https://github.com/tesseract-ocr/tesseract/releases/tag/5.5.0

V5.4.1

2024年6月11日

https://github.com/tesseract-ocr/tesseract/releases/tag/5.4.1

V5.4.0

2024年6月6日

https://github.com/tesseract-ocr/tesseract/releases/tag/5.4.0

V5.3.4

2024年1月18日

https://github.com/tesseract-ocr/tesseract/releases/tag/5.3.4

V5.3.3

2023年10月5日

https://github.com/tesseract-ocr/tesseract/releases/tag/5.3.3

V5.3.2

2023年7月11日

https://github.com/tesseract-ocr/tesseract/releases/tag/5.3.2

V5.3.1

2023年4月1日

フォーマットをわずかに調整することで、DebugDump 出力を改善しました。PR #4022 で @GerHobbelt が担当。

バグ修正

CMake ビルドシステム

コンパイラサポート

GCC および libstdc++ 8.x のサポートを終了しました。

V5.3.0

2022年12月22日

LSTM トレーニング:関数 BoxFileName を拡張して、別の画像名拡張子 .raw.png を処理できるようにしました。PR #3962@bertsky が担当。

バグ修正

ビルドシステム

V5.2.0

2022年7月6日

V5.1.0

2022年3月1日

V5.0.1

2022年1月7日

CMake ビルド

V5.0.0

2021年11月30日

V4.1.3

2021年11月15日

壊れたautotoolsビルドを修正しました。

V4.1.2

2021年11月14日

Autotoolsビルドの変更

V4.1.1

2019年12月26日

V4.1.0

2019年7月7日

V4.0.0

2018年10月29日

V3.05.02

2018年6月19日

このリリースでは、4.0.0 からバックポートされたいくつかのバグを修正しました。

V3.05.01

2017年6月1日

V3.05.00

2017年2月16日

V3.04.01

2016年2月16日

V3.04.00

2015年7月11日

V3.03(rc1)

2014年2月4日

V3.02.02

2012年10月23日

V3.01

2011年10月21日

V3.00

2010年9月30日

V2.04

2009年6月30日

V2.03

2008年4月22日

2.02は、最終段階での「簡単な」変更により実行できませんでした。2.03はこの問題を修正します。また、Leptonicaのincludeチェックを追加して、より使いやすくしました。

V2.02

2008年4月21日

V2.01

2007年8月30日

(使用方法については、下記の2.00のリリースノートも参照してください)

主要な機能変更はありません。バグ修正がいくつか行われています。

元の6言語には新しいデータファイルはありません。v2.00のファイルを使用してください。ドイツ語Fraktur(deu-f)とブラジルポルトガル語(por)の新しいデータファイルがあります。

速報 unicharset_extractorに軽微なバグがあります。これはトレーニングにのみ適用されるため、トレーニングを実行する必要がない限り、メインのtarballは問題ありません。トレーニングを実行する必要がある場合は、unicharset_extractor.cppとunicharset_extractor.exeをtesseract-2.01.patch1.tar.gz内のものと置き換えてください。

V2.00

2007年7月18日

(追加の使用方法については、下記の1.04のリリースノートも参照してください)

国際版の最初のリリースです。このバージョンは次の言語を認識します。

言語コードはISO 639-2に従っています。デフォルトの言語は英語です。別の言語を認識するには

tesseract inputimage outputbase -l langcode

新しい言語でトレーニングするには、TrainingTesseract2を参照してください。今後、より多くの言語が登場する予定です。

このリリースでの変更点のリスト

警告:Tesseract 2.00は、以前のバージョンよりも多くの互換性テストが行われています。プラットフォーム間での精度の整合性を向上させるための修正も行われています。とは言っても、コードには多くの変更が加えられており、移植性が損なわれている可能性があるため、64ビット版とMac版は以前のように動作しない、またはビルドできない可能性があります。

V1.04

2007年5月15日

Tesseractの開発は現在、Subversionを使用してcode.google.comで行われています(以前はCVSをバージョン管理システムとして、sourceforge.netをホスティングに使用していました)。

Windowsユーザーのみ

Windows用のdllインターフェースを追加しました。これはJetsoftのGlenによる貢献です。dllを使用するには、tessdll.hをインクルードし、tessdll.libをインポートし、tessdll.dllをシステムが見つけられる場所に配置します。dllをテストするための小さなdlltestプログラムもあります。次のように実行します。

dlltest phototest.tif phototest.txt

phototest.tifからのテキストとバウンディングボックス情報を表示します。

Windowsの新機能

このディストリビューションには、すぐに動作する可能性のあるtesseract.exeとtessdll.dllが含まれています!動作させるには、少なくともVC++6バージョンのMFCとCRTが必要なため、保証はありません。(バッテリーは含まれていませんし、インストールシールドももちろんありません。)

makeでビルドするすべての人(つまり、devstudioユーザー以外)にとって重要なメモ

このリリースには、データディレクトリの新しい標準化が含まれています。Tesseractがデータファイルを見つけるには、次のいずれかを行う必要があります。

./configure
make
make install

データファイルを標準の場所に移動するか、

export TESSDATA_PREFIX="directory in which your tessdata resides/"

(または同等のもの)を.profileまたはその他のファイルに設定するか、環境変数を設定するためにsetenvを使用します。ディレクトリは/で終わる必要があることに注意してください。

tesseractとtessdataを同じディレクトリに配置しても、もう動作しません。

すべてのユーザー

多くの名前の衝突を修正しました - 主にSTLとの衝突です。Unicode互換性のための予備的な変更を行いました。新しいデータファイル(unicharset)と他のデータファイルのengへの名前変更が含まれており、異なる言語をサポートします。また、その他の軽微なバグ修正と、64ビット、最新のVisual Studioコンパイラなどに対する移植性の向上も含まれています。

これらの修正に貢献してくれたすべての方々に感謝します。

注:これはおそらく最後の英語のみのリリースです!Windowsの実行ファイルによって配布が膨らむことを、Windows以外のユーザーの方々にはあらかじめお詫び申し上げます。これは、多言語対応によって配布が膨らむため、次のリリースで修正される可能性があります。

V1.03

2007年2月3日

V1.02

2006年10月4日

V1.01

2006年9月7日

V1.00

2006年6月17日

Tesseractの最初のオープンソースバージョン!

sourceforge.netでホストされています。CVSはバージョン管理に使用されています。