home
***
CD-ROM
|
disk
|
FTP
|
other
***
search
/
Computer Club Elmshorn Atari PD
/
CCE_PD.iso
/
mac
/
0700
/
CCE_0708.ZIP
/
CCE_0708.PD
/
OCR
/
OCR.DOC
next >
Wrap
Text File
|
1994-01-30
|
26KB
|
598 lines
OCR V1.0 (Januar 1994)
ein Texterkennungs-Programm für ATARI ST/STE/TT/Falcon
von Alexander Clauss, Stresemannstr. 44, 64297 Darmstadt
Dieses Programm ist FREEWARE. Es darf kostenlos kopiert und benutzt
werden. Eine Verbreitung über Mailboxen und PD-Serien ist erlaubt.
Das Programm muβ immer komplett weitergegeben werden. Das Verändern des
Programms und der Anleitung ist nicht gestattet.
Wenn Ihnen das Programm gefällt und Sie es regelmäβig benutzen, sollten
Sie dem Autor eine freiwillige(!!) Spende (ca. 20-30 DM) zukommen lassen
oder mir zumindest ein Postkarte oder eine Nachricht per email schicken,
damit ich weiβ, ob überhaupt Interesse an diesem Programm besteht.
Neue Versionen gibt es direkt vom Autor (bitte Diskette und ausreichend
frankierten Rückumschlag schicken).
WICHTIG: Ich bin natürlich auch an Fehlermeldungen und/oder
Verbesserungsvorschlägen interessiert.
Bei Fehlermeldungen bitte immer Rechnertyp, TOS-Version,
Autoordner-Programme und Accessories angeben.
Konstruktive Kritik und Vorschläge für zukünftige Versionen
sind ausdrücklich erwünscht!!!
Meine Adresse
-------------
Alexander Clauss
Stresemannstraβe 44
D-64297 Darmstadt
email: aclauss@rbg.informatik.th-darmstadt.de
Bankverbindung
--------------
Sparkasse Darmstadt
BLZ: 508 501 50
Kontonr: 0115032143
Geben Sie auf der Überweisung Ihre Adresse an.
Als Verwendungszweck bitte 'OCR' angeben.
System-Voraussetzungen
======================
Dieses Programm läuft auf allen ATARI ST/STE/TT/Falcon Computern.
Es funktioniert in jeder Grafikauflösung mit mindestens 600x200 Punkten
und beliebiger Farbtiefe.
500 KBytes Speicher reichen aus, allerdings können dann keine gröβeren
Bilder eingeladen werden. Zum vernünftigen Arbeiten sollten daher mind.
2 MByte - besser noch mehr - Speicher vorhanden sein.
Einen (Handy-)Scanner benötigt man natürlich auch.
Kurze Übersicht
===============
Das Programm kann Texte in eingescannten Bildern erkennen und als
ASCII-Texte speichern, die dann mit einem Editor bzw. mit einer Text-
verarbeitung weiterverarbeitet werden können.
Für schwer erkennbare Zeichen können Korrekturregeln definiert werden.
Für verschiedene Schrifttypen können eigene Zeichensatz-Datenbänke
angelegt werden.
Für Bilder aus Zeichenprogrammen (die Texte wurden mit dem System- bzw
einem GDOS-Zeichensatz geschrieben) besitzt das Programm einen separaten
Modus in dem besonders wenig Rechenzeit verbraucht wird.
Erklärung der Programmfunktionen
================================
Die Menüfunktionen können fast alle auch mit der Tastatur ausgelöst
werden. Die entsprechenden Tastaturkommados werden im Folgenden in
Klammern angegeben.
Fenster
=======
Folgende Tastatureingaben beziehen sich auf die Fenster:
CTRL-U Oberstes Fenster schlieβen.
CTRL-F Das oberste Fenster wird auf die volle Gröβe gebracht, wenn
es schon diese Gröβe hat, wird es auf die ursprüngliche Gröβe
gebracht.
CTRL-W Wechselt das aktive Fenster. (Das untere Programmfenster
wird zum obersten und umgekehrt)
Cursortasten Verschiebt den Fensterinhalt in die entsprechende
Richtung zeilenweise.
SHIFT-Cursor Verschiebt den Fensterinhalt seitenweise.
Bild-Fenster
------------
Hier wird das eingeladene bzw. eingescannte Bild angezeigt. Da diese
Bilder oft sehr groβ sind, kann man das Bild verkleinert anzeigen lassen
(siehe Bildgröβe).
Man kann einen Block in diesem Fenster markieren, indem man mit gedrückter
Maustaste eine Box aufzieht. Wenn der Block nicht ganz korrekt definiert
wurde, kann man diesen auch nachträglich ändern. Man positioniert die
Maus über eine der neun kleinen Boxen auf der Blockmarkierung; jetzt
kann man mit gedrückter Maustaste die Blockgrenzen ändern.
Blöcke kann man löschen; dies ist wichtig um Linien, Bilder oder andere
Bereiche zu eliminieren, die nicht als Text erkannt werden können.
Wenn ein Block markiert wurde, wird bei der Erkennung nur der markierte
Bereich betrachtet; dies ist notwendig, wenn man mehrspaltige Texte
bearbeiten will (Jede Spalte muβ einzel markiert und erkannt werden).
Text-Fenster
------------
Hier wird der erkannte Text ausgegeben.
OCR-Menü
========
Programminfo
------------
Informationen über das Programm.
Datei-Menü
==========
Bild laden (CTRL-O)
--------------------
Läd ein Bild im IMG-Format (nur monochrom). Falls sich schon ein Bild im
Speicher befindet, das verändert wurde, erscheint ein Warnhinweis und
man hat dann folgende Möglichkeiten:
Speichern: Bevor das neue Bild geladen wird, wird das alte Bild ge-
speichert.
Laden: Das neue Bild wird geladen (die Änderungen des alten Bildes
gehen verloren).
Abbruch: Die ganze Aktion wird abgebrochen.
Bild speichern (CTRL-M)
-----------------------
Speichert das im Speicher befindliche Bild im IMG-Format.
ASCII speichern (ALT-S)
-----------------------
Der erkannte Text wird im ASCII-Format gespeichert. Gibt man eine schon
existierende Datei an, kann man den Text and diese Datei anhängen oder
diese Datei überschreiben (dann geht der ursprüngliche Inhalt der Datei
verloren).
ASCII löschen
-------------
Der erkannte Text wird gelöscht. Falls der Text noch nicht gespeichert
wurde, fragt das Programm sicherheitshalber noch einmal nach:
Speichern: Bevor der Text gelöscht wird, wird er gespeichert.
Löschen: Der Text wird gelöscht.
Abbruch: Die ganze Aktion wird abgebrochen.
Font laden (ALT-R)
------------------
Eine Zeichensatz-Datenbank wird geladen. Falls sich im Speicher eine
Zeichensatz-Datenbank befindet, die noch nicht gespeichert wurde, gibt
das Programm eine Warnung aus; man hat jetzt folgende Möglichkeiten:
Speichern: Die alte Zeichensatz-Datenbank wird gespeichert bevor die
neue geladen wird.
Laden: Die Zeichensatz-Datenbank wird geladen.
Abbruch: Die ganze Aktion wird abgebrochen.
Font speichern (ALT-W)
----------------------
Die Zeichensatz-Datenbank wird gespeichert.
Font löschen
------------
Die Zeichensatz-Datenbank wird gelöscht. Falls die Zeichensatz-Datenbank
noch nicht gespeichert wurde, gibt es eine Warnung und wieder die
Möglichkeit die Datenbank vorher zu Speichern, bzw. die Aktion abzu-
brechen. Wenn man eine neue Datenbank anlegen möchte, muβ man die alte
vorher aus dem Speicher entfernen.
Programmende (CTRL-Q)
---------------------
Hier kann man das Programm verlassen. Wenn irgendwelche Daten noch nicht
gespeichert wurden, hat man jetzt noch die Möglichkeit dazu, denn es
erscheint wieder ein entsprechener Warnhinweis.
Bearbeiten-Menü
===============
Blockmarken löschen (CTRL-B)
----------------------------
Löscht die Blockmarken. (siehe Bild-Fenster)
Block löschen (CTRL-E)
----------------------
Der durch die Blockmarkierung begrenzte Bereich im Bild wird gelöscht.
(siehe Bild-Fenster)
Alles markieren (CTRL-A)
------------------------
Das komplette Bild wird als Block markiert. (siehe Bild-Fenster)
Bildgröβe (CTRL-0,1,2,3,4)
--------------------------
Hier kann man das Bild verkleinert anzeigen lassen, damit man eine
bessere Übersicht erhält. Unter MultiTOS oder auf dem Falcon ist die
Bildgröβe auch durch ein Submenü einstellbar, sonst erscheint eine
Dialogbox.
Folgende Gröβen sind möglich:
100% (CTRL-0): Original Gröβe
50% (CTRL-1): Breite und Höhe des Bildes haben nur noch die halbe
Länge (1:2).
25% (CTRL-2): 1:4
12.5% (CTRL-3): 1:8
6.25% (CTRL-4): 1:16
Textfenster öffnen (CTRL-T)
---------------------------
Öffnet das Textfenster.
Text erkennen (F1)
------------------
Startet die Texterkennung. Wenn ein Block markiert wurde, wird nur
dieser Blockinhalt zur Texterkennung benutzt; ist kein Block definiert,
wird das komplette Bild zur Texterkennung verwendet. Bilder und Linien
müβen eventuell vorher gelöscht werden, damit das Programm Textzeilen
bzw. einzelne Buchstaben erkennen kann.
WICHTIG: Bitte achten Sie darauf, daβ die richtige Zeichensatz-Datenbank
geladen wurde. Wenn noch keine passende Datenbank vorhanden
ist, sollte man mit 'Font löschen' die eventuell im Speicher
befindliche löschen (In 'Einstellungen'/'Font' sollte man jetzt
unbedingt die relevanten Scannereinstellungen ins Kommentarfeld
eintragen. Auch an die Leerzeichenbreite sollte man denken).
Das Programm sucht zunächst nach der ersten Zeile. Als Zeile wird
erkannt, was durch mindestens eine leere (weiβe) Pixelzeile oben und
unten umgrenzt wird und mindestens 5 Pixel hoch ist (Ich nehme an, daβ
niemand auf die Idee kommt, solch kleine Buchstaben (<5 Pixel Höhe)
erkennen zu wollen). Auf diese Weise kann das Programm unter Umständen
Unterstreichungen automatisch ignorieren (wenn sich Unterlängen einiger
Buchstaben aber auf gleicher Höhe wie die Unterstreichung befinden,
funktioniert dies nicht mehr; in diesem Fall muβ man die Unterstreichung
löschen (Block löschen)).
Nach dem das Programm eine Zeile gefunden hat, werden die Buchstaben
dieser Zeile separiert und mit den Buchstaben der Zeichensatz-Datenbank
vergleichen. Das Zeichen aus der Datenbank, das die gröβte Ähnlichkeit
mit dem zu erkennenden Zeichen hat, wird in den Text eingefügt. Findet
sich in der Datenbank kein Zeichen, das eine ausreichende Ähnlichkeit
hat, wird bei eingeschaltetem Lernmodus (siehe Einstellungen) der
Benutzer nach dem Zeichen befragt, bei ausgeschaltetem Lernmodus wird
ein '?' in den Text eingefügt.
Sowohl die Art des Vergleichs zwischen den Zeichen, als auch der Grad
der Übereinstimmung, der mindestens nötig ist um ein Zeichen als
'erkannt' zu betrachten, läβt sich einstellen (siehe Einstellungen).
Bei eingeschaltetem Lernmodus, fragt das Programm in einer Dialogbox
nach, wenn es ein Zeichen nicht mit ausreichender Sicherheit erkennen
kann. Das Zeichen wird in der Dialogbox angezeigt und ausserdem im
Bildfenster markiert. In der Dialogbox gibt man das (die) zu diesem
Zeichen passende(n) ASCII-Zeichen ein. Man kann hier bis zu fünf ASCII-
Zeichen eingeben, da es vorkommen kann, daβ Zeichen beim Scannen zusam-
menwachsen (Das Programm kann sie dann nicht trennen). Zusammenge-
wachsene Zeichen (Ligaturen) können durchaus auch schon in der Vorlage
vorkommen, dies wird gerne bei bestimmten Zeichenfolgen gemacht.
In der Dialogbox kann man auβerdem angeben, ob das zu erkennende Zeichen
in die Zeichensatz-Datenbank aufgenommen, und ob das ASCII-Zeichen in
den Text eingefügt werden soll. Diese beiden Einstellungen sind normal-
erweise eingeschaltet. Wenn man aber weiβ, daβ das zu erkennende Zeichen
so nicht (oder nie) mehr vorkommen wird (weil es beispielsweise durch
Fehler beim Scannen, oder eine schlechte Scan-Vorlage verunstaltet ist)
kann man verhindern, daβ das Zeichen in der Zeichensatz-Datenbank ge-
speichert wird. Verläβt man die Dialogbox mit 'OK' wird mit der Texter-
kennung fortgefahren, 'Abbruch' bricht die Texterkennung ab.
Man kann die Texterkennung auch dann abbrechen, wenn das Programm nicht
wegen unbekannten Zeichen nachfragt (siehe nächster Punkt).
Texterkennung abbrechen (ESC)
-----------------------------
Hiermit kann man die Texterkennung abbrechen. Da das Programm aber nur
am Ende jeder Zeile auf Tastendrücke bzw. auf eine Menüauswahl reagiert,
kann es durchaus einige Sekunden dauern bis die Texterkennung abge-
brochen wird.
Einstellungen
=============
Texterkennung (ALT-O)
---------------------
Diese Einstellungen beeinflussen die Texterkennung.
Lernmodus: Wird ein Zeichen nicht mit genügend hoher Übereinstimmung
erkannt, wird der Benutzer bei eingeschaltetem Lernmodus
befragt, bei ausgeschaltetem Lernmodus wird '?' in den Text
eingefügt.
Übereinstimmung: Hier gibt man an, wie groβ die Übereinstimmung beim
Vergleich sein muβ, um ein Zeichen als 'erkannt' zu be-
trachten.
Akustisches Signal: Wenn die Zeichensatz-Datenbank ziemlich vollständig
ist, wird das Programm sehr selten (wenn überhaupt) nach
einem Zeichen fragen. Man kann das Programm daher alleine
rechnen lassen; wenn dieser Knopf angewählt ist, macht das
Programm mit einem PING aufmerksam, wenn die Erkennung be-
endet ist oder das Programm nach einem Zeichen fragt.
(Dieser Ton kann auch mit dem Kontrollfeld abgeschaltet
werden!)
Vergleich der Zeichen: Das Programm vergleicht die Zeichen des Bildes
mit den Zeichen der Zeichensatz-Datenbank. Zum Vergleich
wird das zu erkennende Zeichen wie eine Schablone über die
Zeichen der Datenbank gelegt. Wählt man 'schnell', wird
das Zeichen nur einmal mit jeden Zeichen aus der Datenbank
verglichen; bei 'mittel' und 'genau' wird das Zeichen zu-
sätzlich etwas verschoben mit den Zeichen aus der Datenbank
verglichen (Auf diese Weise können Ungenauigkeiten, die
durch das Scannen entstehen, ausgeglichen werden. Durch die
zusätzlichen Vergleiche wird dann natürlich mehr Rechenzeit
verbraucht, aber das Programm fragt nicht so oft nach unbe-
kannten Zeichen; die Trefferquote steigt an).
Qualität des Bildes: Stammt das Bild aus einem Scanner, sollte man hier
unbedingt 'Scanner' auswählen. Kleine Unterschiede zwischen
den Zeichen, die durch das Scannen entstehen, werden in
dieser Einstellung herausgefiltert (Filter).
Hat man z.B. ein Bild aus einem Zeichenprogramm, werden die
darin vorkommenden Texte (Systemzeichensatz oder GDOS-
Zeichensätze) sehr wahrscheinlich ohne jegliche Störung sein
(im Gegensatz zu eingescannten Texten, die normalerweise
immer Störungen [z.B.unsaubere Ränder] enthalten).
In diesem Fall sollte man 'präzise' einstellen. Dann werden
ALLE Unterschiede zwischen den Zeichen beachtet. Wenn diese
Zeichensätze sehr klein sind, müssen tatsächlich ALLE Unter-
schiede beachtet werden (die oben genannten Filter lassen
sonst eventuell nicht mehr viel von den Zeichen übrig).
Diese Einstellung spart übrigens einige Rechenzeit.
Font (ALT-F)
------------
Hier erhält (bzw. bestimmt) man Informationen über die gerade im
Speicher befindliche Zeichensatz-Datenbank.
Leerzeichen:
Breite: Legt die Mindestbreite der Leerzeichen fest
variable Breite: Falls in der Vorlage alle (Leer-)Zeichen gleich
breit sind, muβ dieser Knopf ausgeschaltet werden.
Sonst sollte er eingeschaltet werden.
Kommentar: Hier kann man beliebigen Text eingeben, der auch beim
Speichern der Datenbank mitgepeichert wird. Hier sollte
man notieren, um welchen Zeichensatz es sich handelt
(z.B. Herkunft: aus Zeitschrift XYZ) und mit welcher
Scannereinstellung (DPI, Kontrast, Helligkeit etc.) die
Zeichen entstanden sind. Somit kann man vor dem Scannen
von Text, den Scanner richtig einstellen (Weichen die
Scannereinstellungen zu stark ab, wird das Programm
unter Umständen nur noch wenige Zeichen erkennen).
Font bearbeiten (ALT-E)
-----------------------
Hier kann man einige Änderungen an der Zeichensatz-Datenbank vornehmen.
Zeichensatz-Überblick: Hier kann man durch die Zeichen blättern.
Ein Klick auf ein Zeichen, wählt dieses aus (siehe
nächsten Punkt).
Ausgewähltes Zeichen: Hier sind Änderungen an dem ausgewählten Zeichen
möglich.'Löschen' löscht dieses Zeichen aus der Datenbank,
in 'ASCII' kann man die zu dem Zeichen gehörenden ASCII-
Code (bis zu 5 ASCII-Zeichen) ändern/bestimmen.
Zeichen suchen: Man kann ASCII-Zeichen suchen. 'Suchen' sucht ab
Anfang, 'Suchen fortsetzen' sucht ab der aktuellen
Position. Ist das Suchen erfolgreich, wird das gefundene
Zeichen nach 'Ausgewähltes Zeichen' übertragen.
Sortieren: Die Zeichen der Datenbank werden sortiert.
Statistik: Man erhält eine Übersicht, welche Zeichen sich wie oft in
der Datenbank befinden. Es werden aber nur die wichtigsten
Zeichen angezeigt (Platzgründe).
Korrektur (ALT-C)
-----------------
Die Texterkennung ist natürlich nicht perfekt. Es gibt Zeichen, die das
Programm schwer (bzw. nicht) unterscheiden/erkennen kann. Bei einigen
Zeichensätzen sind beispielsweise '1' und 'l' noch nicht mal mit dem
Auge gut zu unterscheiden, wenn dann der Scanner noch einige Ungenauig-
keiten 'einbaut' kann das Zeichen nicht mehr genau zugeordnet werden.
Hier hilft nur noch eine Korrektur, die die Umgebung des Zeichens be-
trachtet, und prüft ob in dieser Umgebung das eine oder andere Zeichen
wahrscheinlicher ist (z.B. innerhalb von Ziffern wird sich kein 'l'
sondern eine '1' befinden).
Bestimmte Zeichen werden als mehrere einzelne Zeichen erkannt (z.B.
<"> wird als zwei mal <'> erkannt).
In dieser Dialogbox können Korrekturregeln für diese Probleme fest-
gelegt werden.
Ersetzungen: Hier wird eingetragen, welche Zeichenkombinationen durch
eine andere ersetzt werden soll. (Man kann z.B. zwei
(Hoch-)Kommata in Anführungsstriche umwandeln)
Korrekturen: Wenn im zu erkennenden Text die Zeichen 1/l, l/I oder 0/O
sehr ähnlich sind, kann man automatische Korrekturen
einschalten.
ACHTUNG: Diese Korrekturen können im Einzelfall natürlich
auch falsche Ergebnisse liefern!
Text formatieren:
Original Format: Eine Zeile Text im Bild, wird zu einer Zeile ASCII-
Text. Leerzeichen am Zeilenanfang können ignoriert werden.
neu formatieren: Der Text im Bild wird vollkommen neu formatiert.
Dabei wird die gewünschte Zeilenbreite beachtet. Dies ist
nützlich, wenn man Vorlagen hat, die aus engen Spalten
bestehen. In diesem Fall besitzt der Text meistens viele
getrennte Wörter. Bei eingeschalteter Trennungskorrektur
werden die Trennungstriche automatisch entfernt. Es gibt
aber auch hier einige Ausnahmeregeln. (Übrigens wird 'k-k'
wieder zu 'ck' überführt). Diese Option ist natürlich nur
für Flieβtext gedacht, für Programm-Listings, Tabellen etc.
ist diese Einstellung nicht geeignet.
Allgemein (ALT-A)
-----------------
Dialoge: Die Dialogboxen können wahlweise in der Bildschirmmitte oder an
der Mausposition auftauchen. Der Punkt 'verschieben' bewirkt,
daβ der durch die Dialogboxen verdeckte Teil des Bildschirms
gepuffert wird, und man die Dialogboxen verschieben kann
(klappt aber nur, wenn genug Speicher frei ist), wenn man auf
den Dialoghintergrund klickt.
(Hat man 'Let'em Fly', 'MultiDIAL' oder ähnliche Programme
sollte man diesen Knopf NICHT anwählen, denn diese Programme
erledigen das Verschieben wesentlich besser!).
Pfade: Klickt man auf diese Boxen, kann man im Fileselector den
entsprechenden Pfad bestimmen. Diese Pfade werden beim Pro-
grammstart automatisch voreingestellt, sodaβ man beim Laden/
Speichern gleich im richtigen Verzeichnis landet.
Text-Fenster: Wird dieser Button angekreuzt, wird das Text-Fenster nach
dem Programmstart automatisch geöffnet.
Dateien: Klickt man auf diese Boxen, kann man im Fileselector die ent-
sprechenden Dateien aussuchen. Diese Dateien werden beim Pro-
grammstart automatisch geladen. Wenn man immer die gleiche
Zeichensatz-Datenbank bzw. die gleichen Korrekturregeln
benutzt, kann man sie somit automatisch laden.
sichern
-------
Die Einstellungen des Programms werden gesichert. Beim nächsten Pro-
grammstart werden die Einstellungen auf die gesicherten Werte gesetzt.
Gesichert werden:
* Alle Einstellungen der Dialogboxen 'Text erkennen' und
'Allgemeine Einstellungen'
* Fensterpositionen und Fenstergröβen der beiden Fenster
Tips & Tricks
=============
Man sollte immer darauf achten, daβ man beim Scannen die gleichen
Scanner-Einstellungen benutzt, mit der auch die Zeichensatz-Datenbank
aufgebaut wurde. Werden andere Einstellungen benutzt kann es passieren,
daβ die Zeichen dicker oder dünner ausfallen; das Programm wird dann
Probleme haben, die Zeichen zu erkennen. Falls die Scan-Vorlagen
allerdings sehr unterschiedliche Qualität haben, kann es dennoch nötig
sein, andere Scanner-Einstellungen zu benutzen.
Für jeden unterschiedlichen Zeichensatztyp und für jede Gröβe sollte man
eine eigene Zeichensatz-Datenbank aufbauen. Dadurch bleiben die Daten-
bänke klein. Eine durch viele Zeichensatztypen aufgeblähte Datenbank
verlangsamt den Erkennungsvorgang deutlich.
Es ist in machen Fällen aber trotzdem nicht zu vermeiden, daβ man mehrere
Zeichensatztypen in einer Datenbank halten muβ (z.B. wenn man oft Texte
bearbeitet, die normale UND kursive Schrift enthalten).
Damit man später noch weiβ, welche Zeichensatz-Datei für welche Vorlage
(und Scannereinstellung) geeignet ist, sollte man die Kommentarfelder in
'Einstellungen'/'Font' immer gewissenhaft ausfüllen.
Die Scannergebnisse sollten sauber und gleichmäβig sein. Kontrast und
Helligkeit so einstellen, daβ mehrere Zeichen nicht zusammenwachsen aber
in den Zeichen selbst keine Lücken entstehen.
Je niedriger die Scannerauflösung, desto weniger Platz benötigen die
Zeichen in der Datenbank (entsprechend weniger Rechenzeit wird bei der
Erkennung verbraucht). Allerdings besteht bei niedrigen Scannerauf-
lösungen die Gefahr, daβ mehrere Zeichen zusammenwachsen. Man muβ etwas
experimentieren um die ideale Auflösung zu finden.
Den Grad der Übereinstimmung beim Vergleich der Zeichen kann man bei
hohen Scannerauflösungen bzw. guten Scannergebnissen niedrig einstellen.
Sollten bei der Erkennung bestimmte Zeichen immer wieder falsch bestimmt
werden, sollte man den Grad der Übereinstimmung etwas erhöhen. Bei hohem
Grad, fragt das Programm etwas öfter nach.
Möchte man in den Dialogboxen Buchstaben eingeben, die nicht auf der
Tastatur vorhanden sind, benötigt man entweder TOS 2.06/3.06 oder höher
oder MultiTOS (man kann den ASCII-Code, bei gedrückt gehaltener
ALTERNATE-Taste, über den Ziffernblock eingeben) oder Let'em Fly (Nach
betätigen von SHIFT-INSERT erhält man eine Übersicht über alle möglichen
Zeichen).
Technisches
===========
Das Programm unterstützt die erweiterten WM_ARROWED-Nachrichten und die
WM_BOTTOMED-Nachricht von Winx 2.2.
Das Programm unterstützt auβerdem den VSCR-Cookie. D.h. auch bei einer
hohen virtuellen Grafikauflösung erscheinen Dialogboxen im gerade sicht-
baren Bildausschnitt.
Auf dem Falcon (>=TOS 4.02) und unter MultiTOS werden die 3D-Effekte in
den Dialogboxen benutzt.
Bekannte Fehler und Unschönheiten
=================================
Das Programm kann in seltenen Fällen zwei Zeichen nicht trennen (das
Programm glaubt, dies wäre nur ein Buchstabe), obwohl sie nicht zusamme-
gewachsen sind. Grund: Es gibt einige Buchstaben, die aus mehreren nicht
zusammenhängenden Teilen bestehen (z.B. alle Buchstaben mit Punkt [i,j,ä
usw.] oder ã,ñ usw.); das Programm versucht diese Buchstaben nicht in
mehrere Teile zu trennen, mehrere sich überlappende Buchstaben sollten
aber doch getrennt werden (aber diese Unterscheidung klappt nicht immer).
Bei groβen Scannerauflösungen werden die Zeichen der Datenbank recht
groβ. Das Programm verbraucht dann sehr viel Rechenzeit.
Die Gröβe der Zeichen ist zur Zeit noch auf max. 96x96 Pixel beschränkt,
daher sollte man die Scannerauflösung höchstens auf 400 DPI stellen.
Zukunft
=======
Folgende Erweiterungen sind geplant (Vorschläge werden gerne aufgenommen):
* Nachfrage nach unbekannten Zeichen nachdem das komplette Bild (Block) be-
arbeitet wurde. Bei unvollständigen Datenbänken, könnte man das Programm
alleine rechnen lassen ohne gelegentlich Fragen beantworten zu müssen;
die kommen dann ganz am Schluβ.
* Änderungen (auf Pixelebene) der Zeichen in der Datenbank.
* Mehrere Zeichensatz-Datenbänke gleichzeitig verwalten. Man könnte dann
auch bei Texten die verschiedene Schrifttypen oder -gröβen enthalten,
die Datenbänke so organisieren, daβ sie nur einen Schrifttyp (Gröβe)
enthalten.
Sonstiges
=========
Ich empfehle, das Programm 'Let'em Fly' von Oliver Scheel zu
installieren. Damit werden alle Dialogboxen verschiebbar, und man kann
sie dann auch mit der Tastatur bedienen (u.a. bequeme Eingabe aller
ASCII-Zeichen und erweiterte Editiermöglichkeiten in Edit-Felder).
Besonders unter Multitasking-Systemen (z.B. MultiTOS) sollte man auch
'MultiDialog' von Helmut Neukirchen installieren. Dieses Programm legt
Dialogboxen in Fenster, so daβ andere Prozesse nicht mehr durch Dialoge
blockiert werden können.
Ausserdem empfehlenswert: Winx von Martin Osieka. Mit Hilfe dieses
Programms kann man bis zu 40 Fenster gleichzeitig öffnen und es werden
einige zusätzlichen Fensterfunktionen installiert.
Diese Programme gibt es in Mailboxen und auf FTP-Servern oder direkt
von den Autoren.