Weyde, Tillman: Lern- und wissensbasierte Analyse von Rhythmen

Die verteilte Repräsentation stellt aber auch ein Problem dar. Wenn ein neuronales Netz nach erfolgreichem Training ein Problem löst, kann man weder das aus den Daten gelernte Wissen noch die Funktionsweise der Lösung einfach aus dem Netz ablesen. Es gibt kein allgemeines Verfahren, um einem einzelnen Neuron oder einer Verbindung eine Bedeutung zuzuordnen. Dies ist in zweierlei Hinsicht problematisch. Zum einen, weil man verstehen möchte, wie das Netz funktioniert, und aus einem erfolgreichen Lernvorgang Wissen extrahiert werden soll. Zum anderen wäre es oft sinnvoll, vorhandenes Wissen in ein neuronales Netz einzubringen, was bei herkömmlichen MLP nur über die Repräsentation und Vorverarbeitung der Beispiele geschieht, nicht aber im Netz selbst.

Mustererkennung

Neuronale Netze sind für die Erkennung von Mustern, wie etwa von rhythmischen Motiven, gut geeignet. Zum einen, weil Fehlertoleranz notwendig ist, d.h. unvollständige Muster oder solche mit kleinen Abweichungen müssen erkannt werden. Zum zweiten sind dabei Phänomene wie wahrgenommene Ähnlichkeiten wichtig, deren Funktionsweise man nicht genau kennt.

Mustererkennung mit neuronalen Netzen bedeutet, Eingabedaten auf eine Ausgabe abzubilden, die die gewünschte Bewertung oder Zuordnung beschreibt. Beispielsweise geschieht dies, indem ein Neuron für jede zu erkennende Musterklasse oder ein Bewertungsneuron für Ähnlichkeiten verwendet werden. Für die Leistung neuronaler Mustererkenner ist, wie für neuronale Netze im allgemeinen, die Aufbereitung der Eingabedaten von entscheidender Bedeutung. Bei der Repräsentation der Daten für das neuronale Netz ist zu beachten, daß die Dimensionalität der Eingabedaten auf ein verarbeitbares Maß reduziert wird und die gewünschten Strukturen bereits soweit wie möglich durch die Vorverarbeitung berücksichtigt werden. Die geeignete Repräsentation zu finden, bedeutet eine schwierige Aufgabe bei der Entwicklung von Anwendungen neuronaler Netze, da hier Wissen über den zu modellierenden Bereich in eine für das Netz geeignete Repräsentation gebracht werden muß.

5.1.5. Generalisierung

Wenn das System anhand der Trainingsbeispiele ein bestimmtes Verhalten gelernt hat, stellt sich die Frage nach der Anwendbarkeit des Systems in der Praxis. Dabei treten normalerweise Eingaben auf, die nicht in der Trainingsmenge enthalten waren. Die Leistung eines Netzes auf anderen Eingabedaten als der Trainingsmenge bezeichnet man als Generalisierung. Die häufigste Methode, festzustellen, was das trainierte System auf unbekannten Beispielen leistet, besteht darin, eine zweite Menge mit zu den Trainingsbeispielen gleichartigen Beispielen als Testmenge zu verwenden.

Man beobachtet häufig, daß erfolgreiches Lernen auf der Trainingsmenge zunächst auch die Leistung auf der Testmenge verbessert, daß sich aber die Leistung bei weiterem Lernen auf der Testmenge wieder verschlechtert, obwohl die Leistung auf der Trainingsmenge weiter verbessert wurde. Dieses Problem entsteht, wenn