Gerät: Scanner

 

Meine ersten Versuche mit einem Scanner mach­te ich Ende der der 80er Jahre des ver­gan­ge­nen Jahr­hun­derts. Ein horrend teures Gerät mit der zu­ge­hö­ri­gen OCR Software versprach Er­ken­nungs­ra­ten von über 90 Pro­zent. Was sich ja zu­nächst einmal auch gaaanz toll anhört.

Doch tatsächlich sind's genau jene Zeichen, die nicht (rich­tig) erkannt werden, die dann die ei­gent­li­che Arbeit ausmachen (selbst dann, wenn 99,9% richtig erkannt wer­den): ein g, das zu 9 oder q wird (oder um­ge­kehrt), ein l, das zu 1 wird (oder um­ge­kehrt), ein ;, das zu : oder ! wird (oder um­ge­kehrt), ein ß, das zu B wird (oder umgekehrt), ein J, das zu D wird (oder um­ge­kehrt), und und und ... Ganz zu schwei­gen von zusammenklebenden (und dann ir­gend­wie zu­fäl­lig erkannten Zeichen bei Pro­por­tio­nal­schrift-Vorlagen (wie Buch-, Zeitungs- oder Zeit­schrif­ten-Ausschnitten).

Nun ja, to keep a long (and very frustrating) story short: Ein klassische Fehl-Investition, die ich un­glück­li­cher­wei­se nicht in Kommision für einen Kun­den, sondern aus eigener Tasche getätigt hatte.

Irgendwann 2001/2002 versuchte ich's dann noch­mal, in der Hoffnung, saubere Vorlagen und ein schnel­le­rer Rech­ner würden die Ergebnisse ver­bes­sern. Eitles Hof­fen! Und: vergeblich.

So erstand ich dann Mitte 2003 einen Epson Per­fec­tion 1260. Zwar war die unter GNU/Linux lauffähige Software nicht im (Win­DOS-fo­kus­sier­ten) Lieferumfang enthalten, doch ist sie via HTTP im Gewebe verfügbar. So sind dann al­le Ab­bil­dun­gen und weitaus meisten der alten Tex­te mit die­sem Gerät eingelesen worden.

Die Zeichenerkennung (OCR) indes jener Texte fand über­wie­gend in einer virtuellen Win­DOS-Ma­schine statt, da das Kooka/GOCR Ge­spann nur ähnlich be­schei­de­ne Ergebnisse pro­du­zier­te wie die oben erwähnte 15 Jahre alte DOS-Soft­ware. Hingegen waren die nötigen Nach­ar­bei­ten/ Kor­rek­tu­ren bei ABBYY Fine­Reader ver­gleichs­wei­se er­träg­lich. Die ab­schließen­de For­ma­tie­rung der so erfaßten Tex­te wur­de dann mit OpenOffice.org durch­ge­führt.

Die erwähnte Scanner-Software läßt sich übri­gens auch in GIMP einbunden, so daß direkt aus dem Pro­gramm heraus gescannt wer­den kann. Ich selbst ver­wen­de jedoch i.d.R. XV, ge­wis­ser­maßen aus alter Ver­bun­den­heit und weil's längst nicht so überladen ist wie GIMP.

Bislang jedenfalls bin ich mit den Produkten des Scan­ners zufrieden. Bedauerlich ist lediglich, daß – soweit ich's aus der für mich nutzlosen Win­DOS Dokumentation er­se­hen kann – ein Teil der Hard­ware-Möglichkeiten von der ge­gen­wär­tig aktuellen GNU/Li­nux Software nicht unterstützt wird.