Kostenlos Dokumente zu PDFs scannen – einfach, kostenlos und lokal auf dem Gerät

Conena

Conena

Neues Mitglied
41
Hallo liebe Android Gemeinde,

seit geraumer Zeit stört es mich, dass es zwar eine Vielzahl an Dokumenten-Scan Apps für Android gibt, jedoch keine, die einfach, kostengünstig und ohne lästige Accounterstellung arbeitet und dabei sämtliche Verarbeitungsvorgänge lokal durchführt.
Nach der kürzlichen Erweiterung des Machine Learning Kits für Android, sah ich die Gelegenheit, eine App zu entwickeln, die genau diese Anforderungen erfüllt.

Warum solltet Ihr einen Blick auf die App werfen?
  • Kostenfrei
  • Benutzerfreundlich
  • Zeitgemäßes Design (Material 3/You)
  • Kein Account erforderlich
  • Keine Werbung
  • Keine fragwürdigen Berechtigungen
  • 100% lokale Verarbeitung auf dem Gerät
  • Nachbearbeitungsmöglichkeiten (z.B. Entfernen von Schatten)
  • Geringe Installationsgröße
Systemanforderungen
  • Android 5.1+
  • Mindestens 1,7 GB RAM
  • Aktuelle Google Play Dienste (für die Nutzung des ML-Kits)
Zielgruppe

Die App richtet sich an Gelegenheitsnutzer, und während es sicherlich Apps gibt, die bessere Ergebnisse liefern, verlangen sie in der Regel einen nicht unerheblichen Preis – sei es in Form von Geld oder Daten. Mein Ziel ist es nicht, mit diesen Apps zu konkurrieren, sondern eine Lösung für den durchschnittlichen Anwender (wie mich selbst) anzubieten.

Feedback

Ich bin offen für euer Feedback und Verbesserungsvorschläge. Beachtet bitte, dass ich am Scanverhalten und den Nachbearbeitungsoptionen nichts ändern werde, da ich hier vollständig auf das ML-Kit von Google setze. Andernfalls wären die Entwicklungskosten zu hoch, um die App kostenlos anzubieten.

Download

Die App kann hier heruntergeladen werden. Sie wurde erst vor zwei Tagen veröffentlicht, daher ist es durchaus möglich, dass noch der ein oder andere Bug vorhanden ist (ich konnte sie aufgrund der Hardwareanforderungen nur auf Android 7 und höher testen, da mir kein Gerät mit 1,7 GB RAM und einer älteren Android-Version zur Verfügung steht). Ich freue mich auf euer Feedback!

Bilder


images_0_30_resized.png
 
  • Danke
Reaktionen: Espressojunkie, Dustman, braindealer und 5 andere
Erster Eindruck:
Leicht zu bedienen und trackingfrei in der aktuellen Version 1.2.2 εxodus.
Wird weiter probiert 😉
Beiträge automatisch zusammengeführt:

In welchem Ordner werden die "Fotos" zwischengespeichert?
Werden diese Dateien nach dem Umwandeln gelöscht, sodass "nur" das Ergebnis gespeichert wird?
 
Zuletzt bearbeitet:
  • Danke
Reaktionen: pueh, Conena und DOT2010
orgshooter schrieb:
In welchem Ordner werden die "Fotos" zwischengespeichert?
Werden diese Dateien nach dem Umwandeln gelöscht, sodass "nur" das Ergebnis gespeichert wird?
Wenn du nur PDF wählst, erhält die App nur das fertige PDF. Die Umwandlung geschieht systemseitig (ebenfalls über das ML-Kit was auf allen aktuellen Geräten installiert ist). Wo der systemseitige Cache angesiedelt ist, ist ein Implementierung Detail welches nicht dokumentiert ist. Bei den anderen Optionen wird der Standard Cache Folder der App verwendet. Der App Cache wird von Zeit zu Zeit gelöscht, ich werde es in einem kommenden Update so umgestalten, dass er nach jedem Scan gelöscht wird. Wenn du auf die Bilder Zugriff haben möchtest, wähle „PDF & Image“.
 
  • Danke
Reaktionen: orgshooter
@Conena Zunächst danke!

Frage:
Wenn ich Dokumente zu pdf scanne, ergibt das für mich nur Sinn, wenn die PDF-Dateien hinterher auch durchsuchbar ist und man auch Text markieren/kopieren kann.

Nur so kann man außerdem in Windows oder Android einfach mal eine dateiübergreifende Volltextsuche starten

Das heißt, man. braucht eine gute OCR. Hier trennt sich die Spreu vom Weizen bei den Apps.

Momentan ist in deiner App kein OCR enthalten?
 
Conena schrieb:
Der App Cache wird von Zeit zu Zeit gelöscht,
Das ist die Antwort die ich hören wollte.
Bei bspw. Genious Scan (oder den früher verwendeten CamScanner) bläht sich mit der Zeit "der Cache" auf, was ich nervig finde.
 
@holms War da neulich nicht was von Google wegen OCR beim scannen, das man dies in der Cloud dann redy hat?
 
@DOT2010 Es gibt diverse Möglichkeiten für OCR. Wir haben sogar einen Thread dazu mit Vergleichen.

Meine Frage bezog sich auf die App, um die es hier im Thread geht.
 
  • Danke
Reaktionen: DOT2010
@holms nein, aktuell noch kein OCR an Board.
 
  • Danke
Reaktionen: holms
holms schrieb:
@Conena Zunächst danke!

Frage:
Wenn ich Dokumente zu pdf scanne, ergibt das für mich nur Sinn, wenn die PDF-Dateien hinterher auch durchsuchbar ist und man auch Text markieren/kopieren kann.

Nur so kann man außerdem in Windows oder Android einfach mal eine dateiübergreifende Volltextsuche starten

Das heißt, man. braucht eine gute OCR. Hier trennt sich die Spreu vom Weizen bei den Apps.

Momentan ist in deiner App kein OCR enthalten?
Ich verstehe deinen Punkt. Aktuell wird es nicht unterstützt und ich habe auch Zweifel inwieweit sich das technisch - mit vertretbarem Aufwand - On-Device umsetzen lässt ohne viele ältere/günstigere Geräte auszuschließen. Ich habe vor etwa zwei Jahren mal mit On-Device OCR experimentiert und war von den Ergebnissen nicht sonderlich angetan. Sollte mir mal langweilig sein und ich eine Herausforderung suchen, schaue ich mir das nochmal an ;)
 
  • Danke
Reaktionen: holms
@Conena Geht nicht Tesseract auch lokal auf dem Gerät? Immerhin OpenSource.

Und so schlecht sind die Ergebnisse nicht (wenn auch andere serverbasierte Dienste besser sind in der Qualität).

Wie gesagt, PDF-Dateien mit Text, der lediglich als Bild drin ist und wo Text niemals wie gewohnt gefunden werden kann, bringen einem wenig, denke ich.
 
Zuletzt bearbeitet:
Textbasierte PDF-Dateien sind schon gut, wenn es funktioniert.
Wenn nicht, dann gebe ich mich auch mit einem guten bildbasiertem PDF zufrieden.

@Conena
Wird eine "Aufhellfunktion" oder "Kontraste erhöhen" in naher Zukunft hinzu kommen?
 
Zuletzt bearbeitet:
@holms Kommt auf den Anwendungszweck drauf an. Nicht jeder braucht durchsuchbare Dateien.
 
Ich werde mir das mal in kombi mit Paperless-ngx anschauen.
 
  • Danke
Reaktionen: Conena
holms schrieb:
Geht nicht Tesseract auch lokal auf dem Gerät? Immerhin OpenSource.

Und so schlecht sind die Ergebnisse nicht (wenn auch andere serverbasierte Dienste besser sind in der Qualität).
Ja es gibt da mehrere fertige Lösungen. Als ich es damals probiert habe, gab es ziemlich schnell Probleme sobald die Belichtung nicht mehr top war oder die Kontraste schwach (z.B. Courier New auf Umweltpapier, wie bei Behörden gerne in Gebrauch). Ich würde es nur einbauen, wenn die Ergebnisse im Alltag wirklich brauchbar sind.
holms schrieb:
Wie gesagt, PDF-Dateien mit Text, der lediglich als Bild drin ist und wo Text niemals wie gewohnt gefunden werden kann, bringen einem wenig, denke ich.
Wie @orgshooter und @DOT2010 zutreffend sagen, gibt es unterschiedliche Anwendungszwecke. Ich komme seit Jahren mit einem einfachen Scanner zu Recht. Ich werde mit der App nie alle glücklich machen können, das ist aber auch nicht mein Ziel. Soll immer eine minimalistische App für schnelle Scans sein, wenn man eben mal keinen Scanner zur Hand hat.
orgshooter schrieb:
Wird eine "Aufhellfunktion" oder "Kontraste erhöhen" in naher Zukunft hinzu kommen?
Aktuell bietet die App alles was das ML-Kit zur Dokumentenbearbeitung kann. Es ist noch im Beta Stadium und Google hat angedeutet, das weitere Funktionen nachgeliefert werden. Die Ergebnisse der Schattenentfernung und des Auto Filters finde ich bereits sehr gut. Ich will im Moment keine Nachbearbeitungsfunktionen selbst implementieren. Ausnahmen könnte ich mir vorstellen für Dinge wie PDF-Verschlüsselung oder OCR. Insgesamt will ich erstmal schauen wie gut die App allgemein ankommt und wie hoch das Interesse an einer minimalistischen Lösung in einem übersättigten Markt überhaupt ist.

Update 1.3.0 steht in Kürze zur Verfügung:
  • Neue Quick Settings Toggle über welche ein Scan gestartet werden kann (analog dem System QR Code Scanner)
  • Zwei neue Themes
  • Cache wird direkt nach der Dokumentenerstellung gelöscht
  • Diverse kleinere Anpassungen
 
  • Danke
Reaktionen: Espressojunkie, Dustman, orgshooter und 3 andere
Conena schrieb:
Ja es gibt da mehrere fertige Lösungen. Als ich es damals probiert habe, gab es ziemlich schnell Probleme sobald die Belichtung nicht mehr top war oder die Kontraste schwach (z.B. Courier New auf Umweltpapier, wie bei Behörden gerne in Gebrauch). Ich würde es nur einbauen, wenn die Ergebnisse im Alltag wirklich brauchbar sind.
Ich will es gar nicht groß diskutieren, ist ja deine App und alles ok.

Es gibt diverse Apps, die eben z.B. Tesseract erfolgreich einsetzen mit relativ guten Ergebnissen. Natürlich sind Ergebnisse immer von der Qualität der Vorlage abhängig. Und bei dunklem Papier bearbeiten gute Apps natürlich auch Helligkeit und Kontrast, dann geht das mit OCR. Courier als Schriftart ist da kein Problem (wobei ich niemanden kenne, der diese Schriftart noch verwendet ;)).

Ich denke, es ist angekommen, was ich sagen wollte. Muss man nicht in die Länge ziehen. Wünsche viel Erfolg mit der App!
 
ist auch eine Veröffentlichung via F-Droid geplant?
 
Mal kurz angetestet, erster Eindruck:
- aufgeräumt, simpel
- akzeptable Größe der PDFs, auch in Farbe

Verbesserungsvorschläge:
- die Option ob die App mit "automatischer" oder "manueller" Aufnahme gestartet werden soll (momentan stellt sie sich immer auf "automatisch" zurück)
- der Weißabgleich funktioniert (bei mir) nicht so gut (Blaustich), mit der "automatischen" Verbesserung wird es dann besser, aber noch nicht 100%ig. Getestet an einer schwarz/weiß/grauen Vorlage mit drei farbigen Spots auf einem Holztisch.

v1.30
 
Zuletzt bearbeitet:
  • Danke
Reaktionen: DOT2010

Ähnliche Themen

franz04
Antworten
50
Aufrufe
1.843
DOT2010
DOT2010
Wolli01
  • Wolli01
Antworten
1
Aufrufe
305
Wolli01
Wolli01
WatchScore
Antworten
0
Aufrufe
198
WatchScore
WatchScore
Zurück
Oben Unten