Tesseract
Aus Tuxfutter
| Tesseract | |
|---|---|
| Logo | |
| Hersteller / Programmierer | |
| | |
| Grundinformationen | |
| Lizenz: | Apache-Lizenz 2.0 (Freie Software) |
| Unterstützte Plattformen: | Linux, Windows, Mac OS |
| Webpräsenz / Download: | code.google.com/p/tesseract-ocr |
| Aktuelle Version: | 2.03 |
| Alternativen | |
| Freie Software | Ocrad, GOCR |
| Proprietäre Software | |
Tesseract ist die wohl präziseste freie Texterkennungs-Software. Es ist nur ein Zeichenerkennungsprogramm für die Kommandozeile, also ohne grafische Benutzeroberfläche und weitere Merkmale wie Layout-Analyse oder ähnliches.
Sie wird als Texterkennungsmodul in andere Anwendungen wie OCRopus oder gscan2pdf eingebunden, die eine grafische Oberfläche dazu bieten und eventuell noch weitere über weitere Module noch Layout-Analyse, Nachbearbeitung der rohen Erkennungsergebnisse mit Sprachmodellen und z.B. das Speichern ins PDF oder DjVu-Format erlauben.
[Bearbeiten] Externe Verweise
- code.google.com/p/tesseract-ocr - offizielle Webpräsenz

