此頁面列出由 Tesseract 社群提供的與 Tesseract4 相容的 tessdata 存放庫 (適用於 –oem 1 - LSTM)
此類 tessdata 貢獻理想上應詳述重製訓練流程所需的一切 (字型、圖像、原始文本、文字、指令碼、文件、… 等)。
語言代碼 | 語言 | 資料檔案 | 貢獻者 | 資訊 |
---|---|---|---|---|
khmLimon | 高棉語 | best | OpenInstituteCambodia/phyrumsk | PR in tessdata_best |
cop | 科普特語 | best | shreeshrii/tessdata_coptic | tesseract-ocr 論壇文章 |
jpn_vert | 日文直書 | best | zodiac3539/jpn_vert | tesseract-ocr 論壇文章 |
ocrb_plus | MRZ | best | shreeshrii/tessdata_ocrb | tesseract-ocr 論壇文章 |
jav_java | 爪哇文字 | best | Shreeshrii/tessdata_jav_java | tesseract-ocr 論壇文章 |
mrz | MRZ | best | DoubangoTelecom/tesseractMRZ | tesseract-ocr 論壇文章 |
dot_matrix | MRZ | best | ameera3/OCR_Expiration_Date | tesseract-ocr 論壇文章 |
e13b | E13B (或 MICR) | best | ElMagoElGato/tess_e13b_training | tesseract-ocr 論壇文章 |
e13b | E13B (或 MICR) | best | DoubangoTelecom/tesseractMICR | tesseract-ocr 論壇文章 |
frak | 德文黑體字 | best | bib.uni-mannheim.de/~stweil | tesstrain wiki |