|
|
Autor |
Nachricht |
Textfluffer Schneckenpost
T
Beiträge: 5
|
T 06.08.2017 11:11 OCR-Programm für schnörkeligen Schreibmaschinentext von Textfluffer
|
|
|
Hallo die Damen und Herren,
vielleicht kann mir jemand zufällig bei einem spezielleren Problem helfen: Ich digitalisiere das Buch meines Vaters, was sich manuell natürlich als sehr langwierig erweist. Zumal ich bei 250 Seiten auch erst einmal die Zeit finden muss, das alles abzutippen.
Ich will das via Texterkennungs-Software abkürzen, doch kommen bisherige OCR-Programme, die ich ausprobierte, nicht mit der schnörkeligen Schrift einer Neunzigerjahre-Schreibmaschine zurecht. Die kostenlosen Tools im Netz geben nur Gulasch aus, ebenso die OCR-Funktion meines Druckers. Dazu habe ich Auflösung und Kontrast möglichst hochgeschraubt, um zumindest solche Defizite auszuklammern - dennoch. Damit ihr euch vorstellen könnte, mit welcher Schriftart ich es zu tun habe, hier ein Auszug.
Hat jemand womöglich einen Geheimtipp für eine Software, die auch mit solchen Herausforderungen klar kommt oder bin ich dazu verdammt, alles abtippen zu müssen?
Vielen Dank im Voraus.
|
|
Nach oben |
|
|
Terhoven Eselsohr
Beiträge: 401
|
08.08.2017 11:43
von Terhoven
|
|
|
Du könntest es doch auch diktieren, da findet sich vielleicht eher eine kostenlose Software, die das kann.
|
|
Nach oben |
|
|
Merlinor Art & Brain
Alter: 72 Beiträge: 8658 Wohnort: Bayern
|
08.08.2017 16:49
von Merlinor
|
|
|
Hallo Textfluffer
Die von Dir gezeigte Schrift der Schreibmaschine ist sehr ungewöhnlich. Sie erinnert ein wenig an eine Handschrift.
Daher mein Vorschlag: Probier es doch einmal mit einem Programm zur Handschriftenerkennung.
Angeblich ist die Erkennung von Handschriften durch das Programm *Evernote* recht brauchbar.
Der *Downlod* einer Basisversion ist kostenlos.
Die *Erkennungsrate* ist angeblich gut.
Ich könnte mir vorstellen, dass so ein Programm mit der zwar schnörkeligen, aber dabei sehr sauberen und regelmäßigen Schrift aus dieser Schreibmaschine umgehen kann.
Ist aber nur eine Idee.
Ausprobiert habe ich es nicht.
LG Merlinor
_________________ „Ich bin fromm geworden, weil ich zu Ende gedacht habe und nicht mehr weiter denken konnte.
Als Physiker sage ich Ihnen nach meinen Erforschungen des Atoms:
Es gibt keine Materie an sich, Geist ist der Urgrund der Materie.“
MAX PLANCK (1858-1947), Mailand, 1942 |
|
Nach oben |
|
|
Textfluffer Schneckenpost
T
Beiträge: 5
|
T 15.01.2018 17:06
von Textfluffer
|
|
|
Merlinor hat Folgendes geschrieben: |
Ich könnte mir vorstellen, dass so ein Programm mit der zwar schnörkeligen, aber dabei sehr sauberen und regelmäßigen Schrift aus dieser Schreibmaschine umgehen kann.
Ist aber nur eine Idee.
Ausprobiert habe ich es nicht.
|
Zwar etwas lange her, aber weil ich mich nach einer Pause erst jetzt wieder damit beschäftigt habe, erst jetzt getestet: Funktioniert leider weder mit Evernote noch mit Onenote. Dennoch danke für den Tipp!
Am besten hat bislang tatsächlich eine kostenlose (5 Scans pro Tag) Mobile-App funktioniert: Smart Lens - damit zumindest 90 Prozent Erkennungsrate. Adobe Scan bekommt das nicht hin, auch die anderen kostenfreien nicht.
Ich habe mal beim Support von Abbyy Textgrab angefragt, ob es (vielleicht von deren Seite) vor dem Kauf die Möglichkeit gibt, die Erkennungsrate zu testen. Ansonsten probiere ich mal die 30-Tage-Testversion vom Abbyy Finereader für den Desktop, die aber darüberhinaus viel zu teuer ist.
Inzwischen habe ich einige Seiten manuell abgetippt, aber das zieht sich eben. Falls doch noch jemand einen anderen Tipp hat, ich nehme ihn gern.
|
|
Nach oben |
|
|
Olympus Mons Gänsefüßchen
O
Beiträge: 35
|
O 27.02.2018 11:29
von Olympus Mons
|
|
|
Moin,
das Muster zeigt ein fürwahr unübliches Schriftbild. OCR-Programme sind, wie ich finde, entweder nur mit viel Augenzudrücken - und noch viel mehr manuellen Eingriffen - "tauglich" und/oder bei Bezahlversionen letztlich eine teure Angelegenheit mit ungewissem Ausgang. Oder sie laufen erst gar nicht auf dem Rechner, Tesseract lässt grüßen...
Wenn du softwaretechnisch nicht gerade völlig veraltet aufgestellt bist, empfehle ich ein Mikro oder Gamingheadset und dann diktierst du den Text in Office. Geht schneller als Abtippen. Nicht gleich aufgeben, wenn das zu Anfang nicht so reibungslos klappt, denn die Spracherkennung muss erst angelernt werden und du wirst wenig gängige Wörter auch via Buchstabieren oder manueller Eingabe hinzufügen müssen. Hier gilt: je mehr damit gearbeitet wird, desto besser funktioniert das in der Praxis und lässt sich dann auch für Alltägliches wie Emails, Briefe etc nutzen. Ist also keine verlorene Zeit.
MfG
|
|
Nach oben |
|
|
Hirsch Gänsefüßchen
Beiträge: 19 Wohnort: Kaiserslautern
|
27.02.2018 14:20
von Hirsch
|
|
|
Hallo,
du könntest ein Neuronales Netz (NN) mit der Schrift trainieren, um so eine eigene OCR zu basteln. Mit der Tensorflow Bibliothek ist das gar nicht so schwer. Das Problem ist, dass ein NN viele Trainingsdaten braucht, um stabile Ergebnisse zu liefern. Die kann man synthetisch generieren, wenn man die Schriftdatei (TTF, OTF) hat oder manuell, indem man den Text aus bereits bestehenden Bildern ausschneidet und den Inhalt selbst vorgibt.
Wie das geht ist hier beschrieben: https://nicholastsmith.wordpress.com/2017/10/14/deep-learning-ocr-using-tensorflow-and-python/
Für die Digitalisierung von 250 Seiten würde sich das schon fast lohnen.
LG, Hirsch
EDIT: Möglicherweise ist es die Script 12 Pitch Schrift: https://www.myfonts.com/fonts/bitstream/script-12-pitch/
|
|
Nach oben |
|
|
|
|
Seite 1 von 1 |
|
Du kannst keine Beiträge in dieses Forum schreiben. Du kannst auf Beiträge in diesem Forum nicht antworten. Du kannst Deine Beiträge in diesem Forum nicht bearbeiten. Du kannst Deine Beiträge in diesem Forum nicht löschen. Du kannst an Umfragen in diesem Forum nicht teilnehmen. In diesem Forum darfst Du Ereignisse posten Du kannst Dateien in diesem Forum nicht posten Du kannst Dateien in diesem Forum nicht herunterladen
|
Empfehlung | Empfehlung | Buch | Empfehlung | Empfehlung | Empfehlung | Buch | Empfehlung | Empfehlung | Buch |
|
|
|
|
|
|
|
|
|
|
|