Teilaspekten interessiert, etwa an den Motivähnlichkeiten ohne Berücksichtigung der
Position oder des Tempos eines Motivs oder an abstrakteren Maßen wie etwa
Unterschieden der Kontur oder Bewegtheit. Um solche Maße zu berechnen, ist eine
geeignete Vorverarbeitung oder ein erweitertes Modell nötig, wofür im folgenden Kapitel
Beispiele vorgestellt werden.
5.5.2. String-Matching
String-Matching bezeichnet eine Methode des Vergleichs von Zeichenketten, z.B.
geschriebenen Wörtern. Es bietet einen Ansatz für den Vergleich von Motiven
verschiedener Länge. Der grundlegende Ansatz setzt voraus, daß die betrachteten
Sequenzen aus klassifizierten Elementen bestehen, z.B. Buchstaben, von denen man für
jedes Element feststellen kann, ob sie übereinstimmen oder nicht. Man kann dann
versuchen, durch Überspringen von nicht übereinstimmenden Elementen zu einer guten
Übereinstimmung auf den folgenden Elementen zu gelangen.
Die Idee ist, zwei Sequenzen S und T, z.B. aus Buchstaben oder Noten bestehend, zu
vergleichen, indem man die eine Sequenz in die andere überführt. Dazu werden drei
Operationen verwendet:
- Einfügen eines Elements
- Entfernen eines Elements
- Ersetzen eines Elements
Die minimale Anzahl von Operationen, die nötig ist, um S in T zu überführen, heißt die
Levenstein-Distanz. Es gibt auch Varianten, die keine Ersetzungen vorsehen. Statt dessen
kann auch eine Einfüge- und eine Entfernungs-Operation durchgeführt werden, was aber
andere Abstandswerte zur Folge hat. Die Damereau-Levenstein-Distanz bezieht auch die
Vertauschung unmittelbar nebeneinander liegender Elemente als Operation mit
ein. Beide Maße unterscheiden weder Grade der Übereinstimmung zwischen
den Elementen noch gibt es einen Unterschied zwischen den verschiedenen
Operationen.