Gerät: Scanner
Meine ersten Versuche mit einem Scanner machte ich Ende der der 80er Jahre des vergangenen Jahrhunderts. Ein horrend teures Gerät mit der zugehörigen OCR
Software versprach Erkennungsraten von über 90 Prozent. Was sich ja zunächst einmal auch gaaanz toll anhört.
Doch tatsächlich sind's genau jene Zeichen, die nicht (richtig) erkannt werden, die dann die eigentliche Arbeit ausmachen (selbst dann, wenn 99,9% richtig erkannt werden): ein g
, das zu 9
oder q
wird (oder umgekehrt), ein l
, das zu 1
wird (oder umgekehrt), ein ;
, das zu :
oder !
wird (oder umgekehrt), ein ß
, das zu B
wird (oder umgekehrt), ein J
, das zu D
wird (oder umgekehrt), und und und ... Ganz zu schweigen von zusammenklebenden (und dann irgendwie zufällig erkannten
Zeichen bei Proportionalschrift-Vorlagen (wie Buch-, Zeitungs- oder Zeitschriften-Ausschnitten).
Nun ja, to keep a long (and very frustrating) story short: Ein klassische Fehl-Investition, die ich unglücklicherweise nicht in Kommision für einen Kunden, sondern aus eigener Tasche getätigt hatte.
Irgendwann 2001/2002 versuchte ich's dann nochmal, in der Hoffnung, saubere Vorlagen und ein schnellerer Rechner würden die Ergebnisse verbessern. Eitles Hoffen! Und: vergeblich.
So erstand ich dann Mitte 2003 einen Epson Perfection 1260
. Zwar war die unter GNU/Linux lauffähige Software nicht im (WinDOS-fokussierten) Lieferumfang enthalten, doch ist sie via HTTP im Gewebe verfügbar. So sind dann alle Abbildungen und weitaus meisten der alten Texte mit diesem Gerät eingelesen worden.
Die Zeichenerkennung (OCR
) indes jener Texte fand überwiegend in einer virtuellen WinDOS-Maschine statt, da das Kooka/GOCR
Gespann nur ähnlich bescheidene Ergebnisse produzierte wie die oben erwähnte 15 Jahre alte DOS-Software. Hingegen waren die nötigen Nacharbeiten/ Korrekturen bei ABBYY FineReader vergleichsweise erträglich. Die abschließende Formatierung der so erfaßten Texte wurde dann mit OpenOffice.org durchgeführt.
Die erwähnte Scanner-Software läßt sich übrigens auch in GIMP einbunden, so daß direkt aus dem Programm heraus gescannt werden kann. Ich selbst verwende jedoch i.d.R. XV, gewissermaßen aus alter Verbundenheit
und weil's längst nicht so überladen ist wie GIMP
.
Bislang jedenfalls bin ich mit den Produkten des Scanners zufrieden. Bedauerlich ist lediglich, daß – soweit ich's aus der für mich nutzlosen WinDOS Dokumentation ersehen kann – ein Teil der Hardware-Möglichkeiten von der gegenwärtig aktuellen GNU/Linux Software nicht unterstützt wird.