home *** CD-ROM | disk | FTP | other *** search
/ Computer Club Elmshorn Atari PD / CCE_PD.iso / mac / 0700 / CCE_0708.ZIP / CCE_0708.PD / OCR / OCR.DOC next >
Text File  |  1994-01-30  |  26KB  |  598 lines

  1. OCR V1.0  (Januar 1994)
  2.  
  3.     ein Texterkennungs-Programm für  ATARI ST/STE/TT/Falcon
  4.     von Alexander Clauss, Stresemannstr. 44, 64297 Darmstadt
  5.  
  6.  
  7.  
  8.  
  9. Dieses Programm ist FREEWARE. Es darf kostenlos kopiert und benutzt
  10. werden. Eine Verbreitung über Mailboxen und PD-Serien ist erlaubt.
  11. Das Programm muβ immer komplett weitergegeben werden. Das Verändern des
  12. Programms und der Anleitung ist nicht gestattet.
  13.  
  14. Wenn Ihnen das Programm gefällt und Sie es regelmäβig benutzen, sollten
  15. Sie dem Autor eine freiwillige(!!) Spende (ca. 20-30 DM) zukommen lassen
  16. oder mir zumindest ein Postkarte oder eine Nachricht per email schicken,
  17. damit ich weiβ, ob überhaupt Interesse an diesem Programm besteht.
  18.  
  19. Neue Versionen gibt es direkt vom Autor (bitte Diskette und ausreichend
  20. frankierten Rückumschlag schicken).
  21.  
  22. WICHTIG: Ich bin natürlich auch an Fehlermeldungen und/oder
  23.          Verbesserungsvorschlägen interessiert.
  24.          Bei Fehlermeldungen bitte immer Rechnertyp, TOS-Version,
  25.          Autoordner-Programme und Accessories angeben.
  26.  
  27.          Konstruktive Kritik und Vorschläge für zukünftige Versionen
  28.          sind ausdrücklich erwünscht!!!
  29.  
  30.  
  31. Meine Adresse
  32. -------------
  33.   Alexander Clauss
  34.   Stresemannstraβe 44
  35.   D-64297 Darmstadt
  36.  
  37. email: aclauss@rbg.informatik.th-darmstadt.de
  38.  
  39. Bankverbindung
  40. --------------
  41.   Sparkasse Darmstadt
  42.       BLZ: 508 501 50
  43.   Kontonr: 0115032143
  44.  
  45. Geben Sie auf der Überweisung Ihre Adresse an. 
  46. Als Verwendungszweck bitte 'OCR' angeben.
  47.  
  48.  
  49.  
  50.  
  51. System-Voraussetzungen
  52. ======================
  53. Dieses Programm läuft auf allen ATARI ST/STE/TT/Falcon Computern.
  54. Es funktioniert in jeder Grafikauflösung mit mindestens 600x200 Punkten
  55. und beliebiger Farbtiefe.
  56. 500 KBytes Speicher reichen aus, allerdings können dann keine gröβeren
  57. Bilder eingeladen werden. Zum vernünftigen Arbeiten sollten daher mind.
  58. 2 MByte - besser noch mehr - Speicher vorhanden sein.
  59. Einen (Handy-)Scanner benötigt man natürlich auch.
  60.  
  61.  
  62.  
  63.  
  64. Kurze Übersicht
  65. ===============
  66. Das Programm kann Texte in eingescannten Bildern erkennen und als
  67. ASCII-Texte speichern, die dann mit einem Editor bzw. mit einer Text-
  68. verarbeitung weiterverarbeitet werden können.
  69.  
  70. Für schwer erkennbare Zeichen können Korrekturregeln definiert werden.
  71.  
  72. Für verschiedene Schrifttypen können eigene Zeichensatz-Datenbänke
  73. angelegt werden.
  74.  
  75. Für Bilder aus Zeichenprogrammen (die Texte wurden mit dem System- bzw
  76. einem GDOS-Zeichensatz geschrieben) besitzt das Programm einen separaten
  77. Modus in dem besonders wenig Rechenzeit verbraucht wird.
  78.  
  79.  
  80.  
  81.  
  82. Erklärung der Programmfunktionen
  83. ================================
  84. Die Menüfunktionen können fast alle auch mit der Tastatur ausgelöst
  85. werden. Die entsprechenden Tastaturkommados werden im Folgenden in
  86. Klammern angegeben.
  87.  
  88.  
  89. Fenster
  90. =======
  91. Folgende Tastatureingaben beziehen sich auf die Fenster:
  92.   CTRL-U   Oberstes Fenster schlieβen.
  93.   CTRL-F   Das oberste Fenster wird auf die volle Gröβe gebracht, wenn
  94.            es schon diese Gröβe hat, wird es auf die ursprüngliche Gröβe
  95.            gebracht.
  96.   CTRL-W   Wechselt das aktive Fenster. (Das untere Programmfenster
  97.            wird zum obersten und umgekehrt)
  98.  
  99.   Cursortasten   Verschiebt den Fensterinhalt in die entsprechende
  100.                  Richtung zeilenweise.
  101.   SHIFT-Cursor   Verschiebt den Fensterinhalt seitenweise.
  102.  
  103.  
  104. Bild-Fenster
  105. ------------
  106. Hier wird das eingeladene bzw. eingescannte Bild angezeigt. Da diese
  107. Bilder oft sehr groβ sind, kann man das Bild verkleinert anzeigen lassen
  108. (siehe Bildgröβe).
  109. Man kann einen Block in diesem Fenster markieren, indem man mit gedrückter
  110. Maustaste eine Box aufzieht. Wenn der Block nicht ganz korrekt definiert
  111. wurde, kann man diesen auch nachträglich ändern. Man positioniert die
  112. Maus über eine der neun kleinen Boxen auf der Blockmarkierung; jetzt
  113. kann man mit gedrückter Maustaste die Blockgrenzen ändern.
  114.  
  115. Blöcke kann man löschen; dies ist wichtig um Linien, Bilder oder andere
  116. Bereiche zu eliminieren, die nicht als Text erkannt werden können.
  117.  
  118. Wenn ein Block markiert wurde, wird bei der Erkennung nur der markierte
  119. Bereich betrachtet; dies ist notwendig, wenn man mehrspaltige Texte
  120. bearbeiten will (Jede Spalte muβ einzel markiert und erkannt werden).
  121.  
  122.  
  123. Text-Fenster
  124. ------------
  125. Hier wird der erkannte Text ausgegeben.
  126.  
  127.  
  128.  
  129.  
  130. OCR-Menü
  131. ========
  132.  
  133. Programminfo
  134. ------------
  135. Informationen über das Programm.
  136.  
  137.  
  138.  
  139.  
  140. Datei-Menü
  141. ==========
  142.  
  143. Bild laden  (CTRL-O)
  144. --------------------
  145. Läd ein Bild im IMG-Format (nur monochrom). Falls sich schon ein Bild im
  146. Speicher befindet, das verändert wurde, erscheint ein Warnhinweis und
  147. man hat dann folgende Möglichkeiten:
  148.   Speichern: Bevor das neue Bild geladen wird, wird das alte Bild ge-
  149.              speichert.
  150.   Laden:     Das neue Bild wird geladen (die Änderungen des alten Bildes
  151.              gehen verloren).
  152.   Abbruch:   Die ganze Aktion wird abgebrochen.
  153.  
  154. Bild speichern (CTRL-M)
  155. -----------------------
  156. Speichert das im Speicher befindliche Bild im IMG-Format.
  157.  
  158.  
  159. ASCII speichern (ALT-S)
  160. -----------------------
  161. Der erkannte Text wird im ASCII-Format gespeichert. Gibt man eine schon
  162. existierende Datei an, kann man den Text and diese Datei anhängen oder
  163. diese Datei überschreiben (dann geht der ursprüngliche Inhalt der Datei
  164. verloren).
  165.  
  166. ASCII löschen
  167. -------------
  168. Der erkannte Text wird gelöscht. Falls der Text noch nicht gespeichert
  169. wurde, fragt das Programm sicherheitshalber noch einmal nach:
  170.   Speichern: Bevor der Text gelöscht wird, wird er gespeichert.
  171.   Löschen:   Der Text wird gelöscht.
  172.   Abbruch:   Die ganze Aktion wird abgebrochen.
  173.  
  174.  
  175. Font laden (ALT-R)
  176. ------------------
  177. Eine Zeichensatz-Datenbank wird geladen. Falls sich im Speicher eine
  178. Zeichensatz-Datenbank befindet, die noch nicht gespeichert wurde, gibt
  179. das Programm eine Warnung aus; man hat jetzt folgende Möglichkeiten:
  180.   Speichern: Die alte Zeichensatz-Datenbank wird gespeichert bevor die
  181.              neue geladen wird.
  182.   Laden:     Die Zeichensatz-Datenbank wird geladen.
  183.   Abbruch:   Die ganze Aktion wird abgebrochen.
  184.  
  185. Font speichern (ALT-W)
  186. ----------------------
  187. Die Zeichensatz-Datenbank wird gespeichert.
  188.  
  189. Font löschen
  190. ------------
  191. Die Zeichensatz-Datenbank wird gelöscht. Falls die Zeichensatz-Datenbank
  192. noch nicht gespeichert wurde, gibt es eine Warnung und wieder die
  193. Möglichkeit die Datenbank vorher zu Speichern, bzw. die Aktion abzu-
  194. brechen. Wenn man eine neue Datenbank anlegen möchte, muβ man die alte
  195. vorher aus dem Speicher entfernen.
  196.  
  197.  
  198. Programmende (CTRL-Q)
  199. ---------------------
  200. Hier kann man das Programm verlassen. Wenn irgendwelche Daten noch nicht
  201. gespeichert wurden, hat man jetzt noch die Möglichkeit dazu, denn es
  202. erscheint wieder ein entsprechener Warnhinweis.
  203.  
  204.  
  205.  
  206.  
  207. Bearbeiten-Menü
  208. ===============
  209.  
  210. Blockmarken löschen (CTRL-B)
  211. ----------------------------
  212. Löscht die Blockmarken. (siehe Bild-Fenster)
  213.  
  214. Block löschen (CTRL-E)
  215. ----------------------
  216. Der durch die Blockmarkierung begrenzte Bereich im Bild wird gelöscht.
  217. (siehe Bild-Fenster)
  218.  
  219. Alles markieren (CTRL-A)
  220. ------------------------
  221. Das komplette Bild wird als Block markiert. (siehe Bild-Fenster)
  222.  
  223.  
  224. Bildgröβe (CTRL-0,1,2,3,4)
  225. --------------------------
  226. Hier kann man das Bild verkleinert anzeigen lassen, damit man eine
  227. bessere Übersicht erhält. Unter MultiTOS oder auf dem Falcon ist die
  228. Bildgröβe auch durch ein Submenü einstellbar, sonst erscheint eine
  229. Dialogbox.
  230. Folgende Gröβen sind möglich:
  231.    100% (CTRL-0):  Original Gröβe
  232.     50% (CTRL-1):  Breite und Höhe des Bildes haben nur noch die halbe
  233.                    Länge (1:2).
  234.     25% (CTRL-2):  1:4
  235.   12.5% (CTRL-3):  1:8
  236.   6.25% (CTRL-4):  1:16
  237.  
  238.  
  239. Textfenster öffnen (CTRL-T)
  240. ---------------------------
  241. Öffnet das Textfenster.
  242.  
  243.  
  244. Text erkennen (F1)
  245. ------------------
  246. Startet die Texterkennung. Wenn ein Block markiert wurde, wird nur
  247. dieser Blockinhalt zur Texterkennung benutzt; ist kein Block definiert,
  248. wird das komplette Bild zur Texterkennung verwendet. Bilder und Linien
  249. müβen eventuell vorher gelöscht werden, damit das Programm Textzeilen
  250. bzw. einzelne Buchstaben erkennen kann.
  251.  
  252. WICHTIG: Bitte achten Sie darauf, daβ die richtige Zeichensatz-Datenbank
  253.          geladen wurde. Wenn noch keine passende Datenbank vorhanden
  254.          ist, sollte man mit 'Font löschen' die eventuell im Speicher
  255.          befindliche löschen (In 'Einstellungen'/'Font' sollte man jetzt
  256.          unbedingt die relevanten Scannereinstellungen ins Kommentarfeld
  257.          eintragen. Auch an die Leerzeichenbreite sollte man denken).
  258.  
  259. Das Programm sucht zunächst nach der ersten Zeile. Als Zeile wird
  260. erkannt, was durch mindestens eine leere (weiβe) Pixelzeile oben und
  261. unten umgrenzt wird und mindestens 5 Pixel hoch ist (Ich nehme an, daβ
  262. niemand auf die Idee kommt, solch kleine Buchstaben (<5 Pixel Höhe)
  263. erkennen zu wollen). Auf diese Weise kann das Programm unter Umständen
  264. Unterstreichungen automatisch ignorieren (wenn sich Unterlängen einiger
  265. Buchstaben aber auf gleicher Höhe wie die Unterstreichung befinden,
  266. funktioniert dies nicht mehr; in diesem Fall muβ man die Unterstreichung
  267. löschen (Block löschen)).
  268. Nach dem das Programm eine Zeile gefunden hat, werden die Buchstaben
  269. dieser Zeile separiert und mit den Buchstaben der Zeichensatz-Datenbank
  270. vergleichen. Das Zeichen aus der Datenbank, das die gröβte Ähnlichkeit
  271. mit dem zu erkennenden Zeichen hat, wird in den Text eingefügt. Findet
  272. sich in der Datenbank kein Zeichen, das eine ausreichende Ähnlichkeit
  273. hat, wird bei eingeschaltetem Lernmodus (siehe Einstellungen) der
  274. Benutzer nach dem Zeichen befragt, bei ausgeschaltetem Lernmodus wird
  275. ein '?' in den Text eingefügt.
  276. Sowohl die Art des Vergleichs zwischen den Zeichen, als auch der Grad
  277. der Übereinstimmung, der mindestens nötig ist um ein Zeichen als
  278. 'erkannt' zu betrachten, läβt sich einstellen (siehe Einstellungen).
  279.  
  280. Bei eingeschaltetem Lernmodus, fragt das Programm in einer Dialogbox
  281. nach, wenn es ein Zeichen nicht mit ausreichender Sicherheit erkennen
  282. kann. Das Zeichen wird in der Dialogbox angezeigt und ausserdem im
  283. Bildfenster markiert. In der Dialogbox gibt man das (die) zu diesem
  284. Zeichen passende(n) ASCII-Zeichen ein. Man kann hier bis zu fünf ASCII-
  285. Zeichen eingeben, da es vorkommen kann, daβ Zeichen beim Scannen zusam-
  286. menwachsen (Das Programm kann sie dann nicht trennen). Zusammenge-
  287. wachsene Zeichen (Ligaturen) können durchaus auch schon in der Vorlage
  288. vorkommen, dies wird gerne bei bestimmten Zeichenfolgen gemacht.
  289. In der Dialogbox kann man auβerdem angeben, ob das zu erkennende Zeichen
  290. in die Zeichensatz-Datenbank aufgenommen, und ob das ASCII-Zeichen in
  291. den Text eingefügt werden soll. Diese beiden Einstellungen sind normal-
  292. erweise eingeschaltet. Wenn man aber weiβ, daβ das zu erkennende Zeichen
  293. so nicht (oder nie) mehr vorkommen wird (weil es beispielsweise durch
  294. Fehler beim Scannen, oder eine schlechte Scan-Vorlage verunstaltet ist)
  295. kann man verhindern, daβ das Zeichen in der Zeichensatz-Datenbank ge-
  296. speichert wird. Verläβt man die Dialogbox mit 'OK' wird mit der Texter-
  297. kennung fortgefahren, 'Abbruch' bricht die Texterkennung ab.
  298. Man kann die Texterkennung auch dann abbrechen, wenn das Programm nicht
  299. wegen unbekannten Zeichen nachfragt (siehe nächster Punkt).
  300.  
  301. Texterkennung abbrechen (ESC)
  302. -----------------------------
  303. Hiermit kann man die Texterkennung abbrechen. Da das Programm aber nur
  304. am Ende jeder Zeile auf Tastendrücke bzw. auf eine Menüauswahl reagiert,
  305. kann es durchaus einige Sekunden dauern bis die Texterkennung abge-
  306. brochen wird.
  307.  
  308.  
  309.  
  310.  
  311. Einstellungen
  312. =============
  313.  
  314. Texterkennung (ALT-O)
  315. ---------------------
  316. Diese Einstellungen beeinflussen die Texterkennung.
  317.  
  318. Lernmodus:  Wird ein Zeichen nicht mit genügend hoher Übereinstimmung
  319.             erkannt, wird der Benutzer bei eingeschaltetem Lernmodus
  320.             befragt, bei ausgeschaltetem Lernmodus wird '?' in den Text
  321.             eingefügt.
  322. Übereinstimmung:  Hier gibt man an, wie groβ die Übereinstimmung beim
  323.             Vergleich sein muβ, um ein Zeichen als 'erkannt' zu be-
  324.             trachten.
  325. Akustisches Signal:  Wenn die Zeichensatz-Datenbank ziemlich vollständig
  326.             ist, wird das Programm sehr selten (wenn überhaupt) nach
  327.             einem Zeichen fragen. Man kann das Programm daher alleine
  328.             rechnen lassen; wenn dieser Knopf angewählt ist, macht das
  329.             Programm mit einem PING aufmerksam, wenn die Erkennung be-
  330.             endet ist oder das Programm nach einem Zeichen fragt.
  331.             (Dieser Ton kann auch mit dem Kontrollfeld abgeschaltet
  332.             werden!)
  333.  
  334. Vergleich der Zeichen:  Das Programm vergleicht die Zeichen des Bildes
  335.             mit den Zeichen der Zeichensatz-Datenbank. Zum Vergleich
  336.             wird das zu erkennende Zeichen wie eine Schablone über die
  337.             Zeichen der Datenbank gelegt.  Wählt man 'schnell', wird
  338.             das Zeichen nur einmal mit jeden Zeichen aus der Datenbank
  339.             verglichen; bei 'mittel' und 'genau' wird das Zeichen zu-
  340.             sätzlich etwas verschoben mit den Zeichen aus der Datenbank
  341.             verglichen (Auf diese Weise können Ungenauigkeiten, die
  342.             durch das Scannen entstehen, ausgeglichen werden. Durch die
  343.             zusätzlichen Vergleiche wird dann natürlich mehr Rechenzeit
  344.             verbraucht, aber das Programm fragt nicht so oft nach unbe-
  345.             kannten Zeichen; die Trefferquote steigt an).
  346. Qualität des Bildes:  Stammt das Bild aus einem Scanner, sollte man hier
  347.             unbedingt 'Scanner' auswählen. Kleine Unterschiede zwischen
  348.             den Zeichen, die durch das Scannen entstehen, werden in
  349.             dieser Einstellung herausgefiltert (Filter).
  350.             Hat man z.B. ein Bild aus einem Zeichenprogramm, werden die
  351.             darin vorkommenden Texte (Systemzeichensatz oder GDOS-
  352.             Zeichensätze) sehr wahrscheinlich ohne jegliche Störung sein
  353.             (im Gegensatz zu eingescannten Texten, die normalerweise
  354.             immer Störungen [z.B.unsaubere Ränder] enthalten).
  355.             In diesem Fall sollte man 'präzise' einstellen. Dann werden
  356.             ALLE Unterschiede zwischen den Zeichen beachtet. Wenn diese
  357.             Zeichensätze sehr klein sind, müssen tatsächlich ALLE Unter-
  358.             schiede beachtet werden (die oben genannten Filter lassen
  359.             sonst eventuell nicht mehr viel von den Zeichen übrig).
  360.             Diese Einstellung spart übrigens einige Rechenzeit.
  361.  
  362. Font (ALT-F)
  363. ------------
  364. Hier erhält (bzw. bestimmt) man Informationen über die gerade im
  365. Speicher befindliche Zeichensatz-Datenbank.
  366.  
  367. Leerzeichen:
  368.   Breite:           Legt die Mindestbreite der Leerzeichen fest
  369.   variable Breite:  Falls in der Vorlage alle (Leer-)Zeichen gleich 
  370.                     breit sind, muβ dieser Knopf ausgeschaltet werden. 
  371.                     Sonst sollte er eingeschaltet werden.
  372.  
  373. Kommentar:    Hier kann man beliebigen Text eingeben, der auch beim
  374.               Speichern der Datenbank mitgepeichert wird. Hier sollte
  375.               man notieren, um welchen Zeichensatz es sich handelt
  376.               (z.B. Herkunft: aus Zeitschrift XYZ) und mit welcher
  377.               Scannereinstellung (DPI, Kontrast, Helligkeit etc.) die
  378.               Zeichen entstanden sind. Somit kann man vor dem Scannen
  379.               von Text, den Scanner richtig einstellen (Weichen die
  380.               Scannereinstellungen zu stark ab, wird das Programm
  381.               unter Umständen nur noch wenige Zeichen erkennen).
  382.  
  383.  
  384. Font bearbeiten (ALT-E)
  385. -----------------------
  386. Hier kann man einige Änderungen an der Zeichensatz-Datenbank vornehmen.
  387.  
  388. Zeichensatz-Überblick:  Hier kann man durch die Zeichen blättern.
  389.               Ein Klick auf ein Zeichen, wählt dieses aus (siehe
  390.               nächsten Punkt).
  391. Ausgewähltes Zeichen:   Hier sind Änderungen an dem ausgewählten Zeichen
  392.               möglich.'Löschen' löscht dieses Zeichen aus der Datenbank,
  393.               in 'ASCII' kann man die zu dem Zeichen gehörenden ASCII-
  394.               Code (bis zu 5 ASCII-Zeichen) ändern/bestimmen.
  395. Zeichen suchen:  Man kann ASCII-Zeichen suchen. 'Suchen' sucht ab
  396.               Anfang, 'Suchen fortsetzen' sucht ab der aktuellen
  397.               Position. Ist das Suchen erfolgreich, wird das gefundene
  398.               Zeichen nach 'Ausgewähltes Zeichen' übertragen.
  399. Sortieren:    Die Zeichen der Datenbank werden sortiert.
  400. Statistik:    Man erhält eine Übersicht, welche Zeichen sich wie oft in
  401.               der Datenbank befinden. Es werden aber nur die wichtigsten
  402.               Zeichen angezeigt (Platzgründe).
  403.  
  404.  
  405. Korrektur (ALT-C)
  406. -----------------
  407. Die Texterkennung ist natürlich nicht perfekt. Es gibt Zeichen, die das
  408. Programm schwer (bzw. nicht) unterscheiden/erkennen kann. Bei einigen
  409. Zeichensätzen sind beispielsweise '1' und 'l' noch nicht mal mit dem
  410. Auge gut zu unterscheiden, wenn dann der Scanner noch einige Ungenauig-
  411. keiten 'einbaut' kann das Zeichen nicht mehr genau zugeordnet werden.
  412. Hier hilft nur noch eine Korrektur, die die Umgebung des Zeichens be-
  413. trachtet, und prüft ob in dieser Umgebung das eine oder andere Zeichen
  414. wahrscheinlicher ist (z.B. innerhalb von Ziffern wird sich kein 'l'
  415. sondern eine '1' befinden).
  416. Bestimmte Zeichen werden als mehrere einzelne Zeichen erkannt (z.B.
  417. <"> wird als zwei mal <'> erkannt).
  418.  
  419. In dieser Dialogbox können Korrekturregeln für diese Probleme fest-
  420. gelegt werden.
  421.  
  422. Ersetzungen:  Hier wird eingetragen, welche Zeichenkombinationen durch
  423.               eine andere ersetzt werden soll. (Man kann z.B. zwei
  424.               (Hoch-)Kommata in Anführungsstriche umwandeln)
  425. Korrekturen:  Wenn im zu erkennenden Text die Zeichen 1/l, l/I oder 0/O
  426.               sehr ähnlich sind, kann man automatische Korrekturen
  427.               einschalten.
  428.               ACHTUNG: Diese Korrekturen können im Einzelfall natürlich
  429.                        auch falsche Ergebnisse liefern!
  430.  
  431. Text formatieren:
  432.    Original Format:  Eine Zeile Text im Bild, wird zu einer Zeile ASCII-
  433.               Text. Leerzeichen am Zeilenanfang können ignoriert werden.
  434.    neu formatieren:  Der Text im Bild wird vollkommen neu formatiert.
  435.               Dabei wird die gewünschte Zeilenbreite beachtet. Dies ist
  436.               nützlich, wenn man Vorlagen hat, die aus engen Spalten
  437.               bestehen. In diesem Fall besitzt der Text meistens viele
  438.               getrennte Wörter. Bei eingeschalteter Trennungskorrektur
  439.               werden die Trennungstriche automatisch entfernt. Es gibt
  440.               aber auch hier einige Ausnahmeregeln. (Übrigens wird 'k-k'
  441.               wieder zu 'ck' überführt). Diese Option ist natürlich nur
  442.               für Flieβtext gedacht, für Programm-Listings, Tabellen etc.
  443.               ist diese Einstellung nicht geeignet.
  444.  
  445.  
  446. Allgemein (ALT-A)
  447. -----------------
  448. Dialoge: Die Dialogboxen können wahlweise in der Bildschirmmitte oder an
  449.          der Mausposition auftauchen. Der Punkt 'verschieben' bewirkt,
  450.          daβ der durch die Dialogboxen verdeckte Teil des Bildschirms
  451.          gepuffert wird, und man die Dialogboxen verschieben kann
  452.          (klappt aber nur, wenn genug Speicher frei ist), wenn man auf
  453.          den Dialoghintergrund klickt.
  454.          (Hat man 'Let'em Fly', 'MultiDIAL' oder ähnliche Programme
  455.          sollte man diesen Knopf NICHT anwählen, denn diese Programme
  456.          erledigen das Verschieben wesentlich besser!).
  457. Pfade:   Klickt man auf diese Boxen, kann man im Fileselector den
  458.          entsprechenden Pfad bestimmen. Diese Pfade werden beim Pro-
  459.          grammstart automatisch voreingestellt, sodaβ man beim Laden/
  460.          Speichern gleich im richtigen Verzeichnis landet.
  461. Text-Fenster: Wird dieser Button angekreuzt, wird das Text-Fenster nach
  462.          dem Programmstart automatisch geöffnet.
  463. Dateien: Klickt man auf diese Boxen, kann man im Fileselector die ent-
  464.          sprechenden Dateien aussuchen. Diese Dateien werden beim Pro-
  465.          grammstart automatisch geladen. Wenn man immer die gleiche
  466.          Zeichensatz-Datenbank bzw. die gleichen Korrekturregeln
  467.          benutzt, kann man sie somit automatisch laden.
  468.  
  469. sichern
  470. -------
  471. Die Einstellungen des Programms werden gesichert. Beim nächsten Pro-
  472. grammstart werden die Einstellungen auf die gesicherten Werte gesetzt.
  473. Gesichert werden:
  474.   * Alle Einstellungen der Dialogboxen 'Text erkennen' und
  475.     'Allgemeine Einstellungen'
  476.   * Fensterpositionen und Fenstergröβen der beiden Fenster
  477.  
  478.  
  479.  
  480.  
  481. Tips & Tricks
  482. =============
  483. Man sollte immer darauf achten, daβ man beim Scannen die gleichen
  484. Scanner-Einstellungen benutzt, mit der auch die Zeichensatz-Datenbank
  485. aufgebaut wurde. Werden andere Einstellungen benutzt kann es passieren,
  486. daβ die Zeichen dicker oder dünner ausfallen; das Programm wird dann
  487. Probleme haben, die Zeichen zu erkennen. Falls die Scan-Vorlagen
  488. allerdings sehr unterschiedliche Qualität haben, kann es dennoch nötig
  489. sein, andere Scanner-Einstellungen zu benutzen.
  490.  
  491. Für jeden unterschiedlichen Zeichensatztyp und für jede Gröβe sollte man
  492. eine eigene Zeichensatz-Datenbank aufbauen. Dadurch bleiben die Daten-
  493. bänke klein. Eine durch viele Zeichensatztypen aufgeblähte Datenbank
  494. verlangsamt den Erkennungsvorgang deutlich.
  495. Es ist in machen Fällen aber trotzdem nicht zu vermeiden, daβ man mehrere
  496. Zeichensatztypen in einer Datenbank halten muβ (z.B. wenn man oft Texte
  497. bearbeitet, die normale UND kursive Schrift enthalten).
  498. Damit man später noch weiβ, welche Zeichensatz-Datei für welche Vorlage
  499. (und Scannereinstellung) geeignet ist, sollte man die Kommentarfelder in
  500. 'Einstellungen'/'Font' immer gewissenhaft ausfüllen.
  501.  
  502. Die Scannergebnisse sollten sauber und gleichmäβig sein. Kontrast und
  503. Helligkeit so einstellen, daβ mehrere Zeichen nicht zusammenwachsen aber
  504. in den Zeichen selbst keine Lücken entstehen.
  505. Je niedriger die Scannerauflösung, desto weniger Platz benötigen die
  506. Zeichen in der Datenbank (entsprechend weniger Rechenzeit wird bei der
  507. Erkennung verbraucht). Allerdings besteht bei niedrigen Scannerauf-
  508. lösungen die Gefahr, daβ mehrere Zeichen zusammenwachsen. Man muβ etwas
  509. experimentieren um die ideale Auflösung zu finden.
  510.  
  511. Den Grad der Übereinstimmung beim Vergleich der Zeichen kann man bei
  512. hohen Scannerauflösungen bzw. guten Scannergebnissen niedrig einstellen.
  513. Sollten bei der Erkennung bestimmte Zeichen immer wieder falsch bestimmt
  514. werden, sollte man den Grad der Übereinstimmung etwas erhöhen. Bei hohem
  515. Grad, fragt das Programm etwas öfter nach.
  516.  
  517. Möchte man in den Dialogboxen Buchstaben eingeben, die nicht auf der
  518. Tastatur vorhanden sind, benötigt man entweder TOS 2.06/3.06 oder höher
  519. oder MultiTOS (man kann den ASCII-Code, bei gedrückt gehaltener
  520. ALTERNATE-Taste, über den Ziffernblock eingeben) oder Let'em Fly (Nach
  521. betätigen von SHIFT-INSERT erhält man eine Übersicht über alle möglichen 
  522. Zeichen).
  523.  
  524.  
  525.  
  526.  
  527. Technisches
  528. ===========
  529. Das Programm unterstützt die erweiterten WM_ARROWED-Nachrichten und die
  530. WM_BOTTOMED-Nachricht von Winx 2.2.
  531.  
  532. Das Programm unterstützt auβerdem den VSCR-Cookie. D.h. auch bei einer
  533. hohen virtuellen Grafikauflösung erscheinen Dialogboxen im gerade sicht-
  534. baren Bildausschnitt.
  535.  
  536. Auf dem Falcon (>=TOS 4.02) und unter MultiTOS werden die 3D-Effekte in
  537. den Dialogboxen benutzt.
  538.  
  539.  
  540.  
  541.  
  542. Bekannte Fehler und Unschönheiten
  543. =================================
  544. Das Programm kann in seltenen Fällen zwei Zeichen nicht trennen (das
  545. Programm glaubt, dies wäre nur ein Buchstabe), obwohl sie nicht zusamme-
  546. gewachsen sind. Grund: Es gibt einige Buchstaben, die aus mehreren nicht
  547. zusammenhängenden Teilen bestehen (z.B. alle Buchstaben mit Punkt [i,j,ä
  548. usw.] oder ã,ñ usw.); das Programm versucht diese Buchstaben nicht in
  549. mehrere Teile zu trennen, mehrere sich überlappende Buchstaben sollten
  550. aber doch getrennt werden (aber diese Unterscheidung klappt nicht immer).
  551.  
  552. Bei groβen Scannerauflösungen werden die Zeichen der Datenbank recht
  553. groβ. Das Programm verbraucht dann sehr viel Rechenzeit.
  554.  
  555. Die Gröβe der Zeichen ist zur Zeit noch auf max. 96x96 Pixel beschränkt,
  556. daher sollte man die Scannerauflösung höchstens auf 400 DPI stellen.
  557.  
  558.  
  559.  
  560.  
  561. Zukunft
  562. =======
  563. Folgende Erweiterungen sind geplant (Vorschläge werden gerne aufgenommen):
  564.  
  565. * Nachfrage nach unbekannten Zeichen nachdem das komplette Bild (Block) be-
  566.   arbeitet wurde. Bei unvollständigen Datenbänken, könnte man das Programm
  567.   alleine rechnen lassen ohne gelegentlich Fragen beantworten zu müssen;
  568.   die kommen dann ganz am Schluβ.
  569.   
  570. * Änderungen (auf Pixelebene) der Zeichen in der Datenbank.
  571.  
  572. * Mehrere Zeichensatz-Datenbänke gleichzeitig verwalten. Man könnte dann
  573.   auch bei Texten die verschiedene Schrifttypen oder -gröβen enthalten,
  574.   die Datenbänke so organisieren, daβ sie nur einen Schrifttyp (Gröβe)
  575.   enthalten.
  576.  
  577.  
  578.  
  579.  
  580. Sonstiges
  581. =========
  582. Ich empfehle, das Programm 'Let'em Fly' von Oliver Scheel zu
  583. installieren. Damit werden alle Dialogboxen verschiebbar, und man kann
  584. sie dann auch mit der Tastatur bedienen (u.a. bequeme Eingabe aller
  585. ASCII-Zeichen und erweiterte Editiermöglichkeiten in Edit-Felder).
  586.  
  587. Besonders unter Multitasking-Systemen (z.B. MultiTOS) sollte man auch
  588. 'MultiDialog' von Helmut Neukirchen installieren. Dieses Programm legt
  589. Dialogboxen in Fenster, so daβ andere Prozesse nicht mehr durch Dialoge
  590. blockiert werden können.
  591.  
  592. Ausserdem empfehlenswert: Winx von Martin Osieka. Mit Hilfe dieses
  593. Programms kann man bis zu 40 Fenster gleichzeitig öffnen und es werden
  594. einige zusätzlichen Fensterfunktionen installiert.
  595.  
  596. Diese Programme gibt es in Mailboxen und auf FTP-Servern oder direkt
  597. von den Autoren.
  598.