跳到內容。

此頁面列出由 Tesseract 社群提供的與 Tesseract4 相容的 tessdata 存放庫 (適用於 –oem 1 - LSTM)

此類 tessdata 貢獻理想上應詳述重製訓練流程所需的一切 (字型、圖像、原始文本、文字、指令碼、文件、… 等)。


語言代碼 語言 資料檔案 貢獻者 資訊
khmLimon 高棉語 best OpenInstituteCambodia/phyrumsk PR in tessdata_best
cop 科普特語 best shreeshrii/tessdata_coptic tesseract-ocr 論壇文章
jpn_vert 日文直書 best zodiac3539/jpn_vert tesseract-ocr 論壇文章
ocrb_plus MRZ best shreeshrii/tessdata_ocrb tesseract-ocr 論壇文章
jav_java 爪哇文字 best Shreeshrii/tessdata_jav_java tesseract-ocr 論壇文章
mrz MRZ best DoubangoTelecom/tesseractMRZ tesseract-ocr 論壇文章
dot_matrix MRZ best ameera3/OCR_Expiration_Date tesseract-ocr 論壇文章
e13b E13B (或 MICR) best ElMagoElGato/tess_e13b_training tesseract-ocr 論壇文章
e13b E13B (或 MICR) best DoubangoTelecom/tesseractMICR tesseract-ocr 論壇文章
frak 德文黑體字 best bib.uni-mannheim.de/~stweil tesstrain wiki