OCR App wanted

  • 9 Antworten
  • Neuester Beitrag
Diskutiere OCR App wanted im Business und Organisation im Bereich Android Apps und Spiele.
N

Naddus

Neues Mitglied
Hallo,

ich habe fürs' Studium (Fernuni Hagen) meine Skripte eingescannt, um sie mit dem ezPdf Reader bearbeiten zu können - sprich Highlights setzen und dann in eine Textdatei exportieren. Mit den Skripten die von Uni Seite aus schon im pdf Format vorliegen, funktioniert das auch wunderbar. Aber bei den Skripten, die ich eingescannt habe nur bedingt, um nicht zu sagen nur sehr sehr bescheiden.

Als ich die Skripte eingescannt habe, habe ich sie anschließend auf dem PC mit PDF Viewer bearbeit, also die OCR Texterkennung drüber laufen lassen. Dann habe ich mir die Skripte aufs Tablet geladen. Mein Problem ist, dass der Text zwar korrekt dargestellt, aber nicht korrekt erkannt wird. Wenn ich bspw. Wörter markiere, dann werden beim Export in die Textdatei einzelne Buchstaben "verschluckt", so dass diese teilweise keinen Sinn mehr ergeben.

Kennt jemand eine gute OCR App, die ich noch einmal über die PDFs' laufen lassen kann, so dass eventuell die Texterkennung verbessert werden kann?

Danke
 
G

girouno

Gast
OCR-Erkennungen haben nunmal Fehler. Ggf. müssten sie in einem Lernmodus auf die spezifische Textart angepasst werden; ich hab am PC mit Omnipage gelegentlich juristische Texte gescannt und die Fehlerquote war auch mit "Üben" noch ziemlich mies. Kann mir nicht vorstellen, dass es da auf Android-Basis wirklich etwas besseres gibt.

Du hast wahrscheinlich den graphischen Scan im Vordergrund (sichtbar) und den "erkannten" Text unsichtbar 'dahinter' - das ist zwar am Bildschirm schön lesbar, aber bei einem Textexport blöd (bis unbrauchbar).

Ggf. die Quelldaten nochmal durch eine bessere Texterkennung am PC laufen lassen und zwar nicht in einem vollautomatischen Verfahren, sondern mit manueller Fehlerbeseitigung. Anders kommt man da nicht auf er sehr gute Ergebnisse.
 
N

Naddus

Neues Mitglied
Welches Programm wäre denn für den PC empfehlenswert?
 
G

girouno

Gast
Naja, ich hatte Omnipage 16 (gab#s dann sogar später mal als Zeitschriftenbeilage) und war damit einigermaßen zufrieden. Normalen Text hat es sehr gut erkannt; Sonderzeichen eben nicht so. Gescannt wurde in reinem S/W mit 300 dpi.
 
ottosykora1

ottosykora1

Android-Hilfe.de Mitglied
Ich hatte schon Omnipage und Finereader. Kein von beiden war besser.
Es kommt noch auf die Fonts etwas an, einige sind wohl besser zu erkennen als andere, darum gibt es wohl auch ein spez OCR Font.

Aber wirklich brauchbar ohne Fehler war es nie. Habe probiert alle Variationen, also Graustufen (war besser) und 1bit schwarz-weiss (war schlechter) und diverse Auflösungen, aber es gab immer noch viele Fehler pro Seite.
 
P

perpe

Gast
Dann muss du aus deinen PDFs die Bilder extrahieren und sie durch die OCR der Apps, in dem genannten Thread, jagen ;)
Zum PDFs splitten/Bilder extrahieren müsste es auch Apps im Play Store geben.

Da gibt es nun mal keinen einfachen Weg, OCR ist auch nichts einfaches. Wenn du richtig gute Ergebnisse willst, musst du es schon mit einem gescheiten Programm am PC machen.
 
ottosykora1

ottosykora1

Android-Hilfe.de Mitglied
Ich habe jetzt auch noch Readiris Pro, neuste Version, ist kaum besser als Omnipage und Finereader. Ist etwas schneller, aber scheint noch mehr Fehler zu machen. Ohne intensive Nachbearbeitung nicht verwendbar. Und das bei dem ganzen Rechenpower eines heutigen PC. Auch hier scheint wichtig: Graustufen Scanns geben bessere Resultate als normale schwarz auf weiss Texte.
Kaum vorstellbar dass so was derzeit auf einem Android realisierbar wäre.
 
P

perpe

Gast
Es kommt halt immer auf die Vorlage und die Übung an.
Ein sehbeeinträchtigter Bekannter von mir schwört auf den Finereader. Er hat damit sein Studium gemacht, damals waren E-Books noch nicht so verbreitet, alles was es nicht als E-Book gab wurde eingescannt und durch die OCR gejagd. Er hat da natürlich auch die nötige Übung und die OCR Programme sind auch lernfähig, Ergebnisse werde mit der Zeit eben auch besser.
Aber auch dann ist es problematisch, wenn das Layout z.B. nicht einheitlich ist, unterschiedliche Schriftarten verwendet werden, Text und Bilder wildgemischt...
Die Android Apps haben noch einiges vor sich, wenn sie die Qualität eines PC Programms erreichen wollen.
 
Ähnliche Themen - OCR App wanted Antworten Datum
12
0
0