22.08.2014, 17:33 UhrDeutsch | English
Hallo Gast [ Registrierung | Anmelden ]

Neues Thema eröffnen   Neue Antwort erstellen
Vorheriges Thema anzeigen Druckerfreundliche Version Einloggen, um private Nachrichten zu lesen Nächstes Thema anzeigen
Autor Nachricht
stalin2000
Titel: Tesseract - OCR mit Fraktur/Altdeutscher Schrift scheitert  BeitragVerfasst am: 11.06.2011, 10:12 Uhr



Anmeldung: 04. Jan 2007
Beiträge: 1604
Wohnort: Hamburg
Hallo Ihr,

ich habe einen altdeutschen/fraktur Text, den ich mit OCR erkennen lassen möchte. Nun habe ich das Paket tesseract-ocr-deu-f gefunden und es installiert. Es scheint aber nicht zu funktionieren.

Ich habe jetzt mal geschaut und gesehen daß im Ordner
/usr/share/tesseract-ocr/tessdata/

Die Datei deu-f.freq-dawg ist nur 1 KB groß, wohingegen die Datei deu.word-dawg 1,1 MB groß ist. Die Fraktur-Datei scheint also nichts zu enthalten.

Und wenn ich in gscan2pdf den Eintrag -f wähle, was wohl für Fraktur stehen soll, dann bricht die Texterkennung sofort ab.

Habt Ihr Erfahrungen mit diesem Problem, bzw. könnt Ihr das so reproduzieren?

Viele Grüße Christopher

_________________
Es ist dem Untertanen untersagt, den Maßstab seiner beschränkten Einsicht an die Handlungen der Obrigkeit anzulegen - Kurfürst Friedrich Wilhelm von Brandenburg
www.projektidee.org | www.gesundheitstabelle.de | www.neoliberalyse.de
 
 Benutzer-Profile anzeigen Private Nachricht senden Website dieses Benutzers besuchen  
Antworten mit Zitat Nach oben
stalin2000
Titel: Tesseract - OCR mit Fraktur/Altdeutscher Schrift scheitert  BeitragVerfasst am: 03.09.2012, 22:42 Uhr



Anmeldung: 04. Jan 2007
Beiträge: 1604
Wohnort: Hamburg
Mit Debian-Wheezy-unterbau geht's jetzt sowhol mit gscan2pdf als auch mit gImageReader (http://sourceforge.net/projects/gimagereader/files/0.9/).

Also: Fraktur Deutsch wird einwandfrei erkannt. Die Erkennungsqualität ist sogar fast besser als bei lateinischer Schrift.

_________________
Es ist dem Untertanen untersagt, den Maßstab seiner beschränkten Einsicht an die Handlungen der Obrigkeit anzulegen - Kurfürst Friedrich Wilhelm von Brandenburg
www.projektidee.org | www.gesundheitstabelle.de | www.neoliberalyse.de
 
 Benutzer-Profile anzeigen Private Nachricht senden Website dieses Benutzers besuchen  
Antworten mit Zitat Nach oben
Beiträge vom vorherigen Thema anzeigen:     
Gehe zu:  
Alle Zeiten sind GMT + 1 Stunde
Neues Thema eröffnen   Neue Antwort erstellen
Vorheriges Thema anzeigen Druckerfreundliche Version Einloggen, um private Nachrichten zu lesen Nächstes Thema anzeigen
PNphpBB2 © 2003-2007 
 
Deutsch | English
Logos and trademarks are the property of their respective owners, comments are property of their posters, the rest is © 2004 - 2006 by Jörg Schirottke (Kano).
Consult Impressum and Legal Terms for details. Kanotix is Free Software released under the GNU/GPL license.
This CMS is powered by PostNuke, all themes used at this site are released under the GNU/GPL license. designed and hosted by w3you. Our web server is running on Kanotix64-2006.