Druckversion | ||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
Anfang Inhalt Einleitung Erste Schritte Die Bash Das Dateisystem Nutzerkommandos Installation Shells Unix-Werkzeuge Vi Emacs Reguläre Ausdrücke Grep Sed Awk Make & Makefile System-Administration X Window System Der Kernel Netzwerk Grundlagen Netzwerk Clients Netzwerk Server Netzwerk Sicherheit Anhang Register |
Ein regulärer Ausdruck ist nichts anderes als ein Suchmuster, um übereinstimmende Muster in einer Eingabe zu finden. In der theoretischen Informatik wird der Begriff des regulären Ausdrucks im Zusammenhang mit endlichen Automaten in einer anderen Terminologie verwendet.
Einfache reguläre Ausdrücke sind Ihnen sicher schon begegnet, ohne dass Sie es bewusst wahr genommen haben. Zum Beispiel bei der Suche nach einem Zeichenmuster »Text« im Editor vi (mit »/Text«). Bleiben wir beim Beispiel des vi und betrachten weitere Möglichkeiten »regulärer Ausdrücke« anhand eines Verses von Eugen Roth:
Aus irgend einem Grund sei der Ersatz aller Textpassagen »dein« durch »sein« erwünscht. Im Kommandomodus des vi verrichtet folgende Zeile Suche und Ersatz:
Als Ergebnis erhalten wir:
Ein »statischer« Text ist ein einfacher Spezialfall eines regulären Ausdrucks. Erst unser nächstes Ansinnen, beide Auftreten des Worts »doch« zu streichen, lässt die Flexibilität des Konzepts erahnen:
Als Text erzielen wir:
Stellen Sie sich vor, auch Sie schreiben eine Einführung über irgendetwas. Und auch Sie veröffentlichen das Ganze in den zwei Formaten HTML und Postscript. Sie schreiben auch noch in Deutsch und müssen in LaTeX jedes 'ü' durch '"u' ausdrücken, jeden 'ö' durch '"o' usw. Vielleicht machen Sie sich die Arbeit, in HTML die Umlaute durch den Unicode auszudrücken... Dann könnten Sie alles per Hand anpassen, oder das Ganze durch ein paar wenige Zeilen regulärer Ausdrücke erledigen. Bevor wir uns den einzelnen Werkzeugen zuwenden, sollen alle regulären Ausdrücke tabellarisch zusammen gefasst werden.
Zwar vermag nicht jedes der nachstehenden Tools mit jedem der Ausdrücke etwas anzufangen, aber die meisten Mechanismen lassen sich schon in einem Pager wie less nachvollziehen.
In einem Leserbrief an eine beliebige Zeitung verwenden wir mehrfach die Redewendung »Herren und Damen«. Später wird uns bewusst, dass wir die guten Manieren etwas vernachlässigt hatten und wollen die Ansprache nun in »Damen und Herren« ändern:
Im Vi erledigt eine einzige Zeile die Arbeit:
Die drei uns interessierenden Muster merken wir uns vor, und greifen während der Ersetzung in umgekehrter Reihenfolge auf diese zu.
|
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
Korrekturen, Hinweise? |