Tesseract

Aus Tuxfutter

Wechseln zu: Navigation, Suche
Tesseract
Logo
Hersteller / Programmierer



Grundinformationen
Lizenz: Apache-Lizenz 2.0 (Freie Software)
Unterstützte Plattformen: Linux, Windows, Mac OS
Webpräsenz / Download: code.google.com/p/tesseract-ocr
Aktuelle Version: 2.03
Alternativen
Freie Software Ocrad, GOCR
Proprietäre Software

Tesseract ist die wohl präziseste freie Texterkennungs-Software. Es ist nur ein Zeichenerkennungsprogramm für die Kommandozeile, also ohne grafische Benutzeroberfläche und weitere Merkmale wie Layout-Analyse oder ähnliches.

Sie wird als Texterkennungsmodul in andere Anwendungen wie OCRopus oder gscan2pdf eingebunden, die eine grafische Oberfläche dazu bieten und eventuell noch weitere über weitere Module noch Layout-Analyse, Nachbearbeitung der rohen Erkennungsergebnisse mit Sprachmodellen und z.B. das Speichern ins PDF oder DjVu-Format erlauben.

[Bearbeiten] Externe Verweise

'Persönliche Werkzeuge