コンテンツをスキップ。

ボックスファイル (Tesseract 4.1.1、Tesseract 5.0.0)

LSTM トレーニングには、さまざまな形式のボックスファイルを使用できますが、Tesseract 3 が使用する形式とは異なります。

text2image

Unicode フォントとトレーニング用テキストを使用して text2image によって生成された内容。

I 114 4655 120 4691 0
n 127 4655 150 4682 0
f 152 4655 169 4692 0
o 168 4654 193 4682 0
r 197 4654 213 4681 0
m 214 4654 250 4681 0
a 255 4654 280 4681 0
t 282 4654 295 4689 0
i 298 4654 304 4690 0
o 308 4654 333 4681 0
n 337 4654 360 4681 0
  360 4653 378 4691 0
G 378 4653 413 4691 0
r 418 4653 434 4680 0
o 434 4653 459 4680 0
u 463 4653 486 4679 0
p 491 4643 515 4680 0
s 517 4653 540 4680 0
  540 4653 555 4690 0

lstmbox

lstmbox 設定を使用して画像ファイルから tesseract によって生成された内容 - 各文字は行全体の位置を使用。この形式は tesstrain makefile でも生成されます。

I 114 4640 1912 4692 0
n 114 4640 1912 4692 0
f 114 4640 1912 4692 0
o 114 4640 1912 4692 0
r 114 4640 1912 4692 0
m 114 4640 1912 4692 0
a 114 4640 1912 4692 0
t 114 4640 1912 4692 0
i 114 4640 1912 4692 0
o 114 4640 1912 4692 0
n 114 4640 1912 4692 0
  114 4640 1912 4692 0
G 114 4640 1912 4692 0
r 114 4640 1912 4692 0
o 114 4640 1912 4692 0
u 114 4640 1912 4692 0
p 114 4640 1912 4692 0
s 114 4640 1912 4692 0
  114 4640 1912 4692 0
  

wordstrbox

wordstrbox 設定を使用して画像ファイルから tesseract によって生成された内容 - 行全体に対して Wordstr、位置、テキストを使用。この形式は、インドの文字のための tesstrain makefile でも生成されます。Wordstr 形式のボックスファイルは、特に複雑な文字の場合、ボックスファイルの作成と修正をより簡単に行うことができます。

WordStr 114 4640 1907 4692 0 #Information Groups for public OPTIONAL, jaundice Proterozoic Have LOCATION 
	 1908 4640 1912 4692 0
WordStr 112 4544 2015 4592 0 #mixed, Male By TEXT Cove... ¥ INSTABILITY About WERE Crimson THAT HOPKINS 
	 2016 4544 2020 4592 0

以下にデーバナーガリー文字の例を示します。

WordStr 0 0 235 28 0 #मनुष्यबाह्यगतये कृतज्ञाय शिखण्डिने
	 0 0 235 28 0

makebox 設定ファイルを使用して生成されたボックスファイルは、レガシーモデルのトレーニングには適していますが、LSTM トレーニングには適していないことに注意してください。

詳細については トレーニング用データの作成セクションを参照してください。