Die verteilte Repräsentation stellt aber auch ein Problem dar. Wenn ein neuronales
Netz nach erfolgreichem Training ein Problem löst, kann man weder das aus den Daten
gelernte Wissen noch die Funktionsweise der Lösung einfach aus dem Netz ablesen. Es
gibt kein allgemeines Verfahren, um einem einzelnen Neuron oder einer Verbindung eine
Bedeutung zuzuordnen. Dies ist in zweierlei Hinsicht problematisch. Zum einen, weil
man verstehen möchte, wie das Netz funktioniert, und aus einem erfolgreichen
Lernvorgang Wissen extrahiert werden soll. Zum anderen wäre es oft sinnvoll,
vorhandenes Wissen in ein neuronales Netz einzubringen, was bei herkömmlichen MLP
nur über die Repräsentation und Vorverarbeitung der Beispiele geschieht, nicht aber im
Netz selbst.
Mustererkennung
Neuronale Netze sind für die Erkennung von Mustern, wie etwa von rhythmischen
Motiven, gut geeignet. Zum einen, weil Fehlertoleranz notwendig ist, d.h. unvollständige
Muster oder solche mit kleinen Abweichungen müssen erkannt werden. Zum zweiten sind
dabei Phänomene wie wahrgenommene Ähnlichkeiten wichtig, deren Funktionsweise man
nicht genau kennt.
Mustererkennung mit neuronalen Netzen bedeutet, Eingabedaten auf eine Ausgabe
abzubilden, die die gewünschte Bewertung oder Zuordnung beschreibt. Beispielsweise
geschieht dies, indem ein Neuron für jede zu erkennende Musterklasse oder ein
Bewertungsneuron für Ähnlichkeiten verwendet werden. Für die Leistung neuronaler
Mustererkenner ist, wie für neuronale Netze im allgemeinen, die Aufbereitung der
Eingabedaten von entscheidender Bedeutung. Bei der Repräsentation der Daten für das
neuronale Netz ist zu beachten, daß die Dimensionalität der Eingabedaten
auf ein verarbeitbares Maß reduziert wird und die gewünschten Strukturen
bereits soweit wie möglich durch die Vorverarbeitung berücksichtigt werden. Die
geeignete Repräsentation zu finden, bedeutet eine schwierige Aufgabe bei der
Entwicklung von Anwendungen neuronaler Netze, da hier Wissen über den zu
modellierenden Bereich in eine für das Netz geeignete Repräsentation gebracht werden
muß.
5.1.5. Generalisierung
Wenn das System anhand der Trainingsbeispiele ein bestimmtes Verhalten gelernt hat,
stellt sich die Frage nach der Anwendbarkeit des Systems in der Praxis. Dabei treten
normalerweise Eingaben auf, die nicht in der Trainingsmenge enthalten waren.
Die Leistung eines Netzes auf anderen Eingabedaten als der Trainingsmenge
bezeichnet man als Generalisierung. Die häufigste Methode, festzustellen, was das
trainierte System auf unbekannten Beispielen leistet, besteht darin, eine zweite
Menge mit zu den Trainingsbeispielen gleichartigen Beispielen als Testmenge zu
verwenden.
Man beobachtet häufig, daß erfolgreiches Lernen auf der Trainingsmenge
zunächst auch die Leistung auf der Testmenge verbessert, daß sich aber die
Leistung bei weiterem Lernen auf der Testmenge wieder verschlechtert,
obwohl die Leistung auf der Trainingsmenge weiter verbessert wurde. Dieses
Problem entsteht, wenn