allgemeinen gelingt dies bei größeren Datenmengen jedoch nicht, was verschiedene
Ursachen haben kann. Ein Grund kann sein, daß die Daten, die zum Training benutzt
werden, nicht konsistent sind. Wenn man Daten von verschiedenen Experten verwendet,
erhält man verschiedene Interpretationen derselben Ein- und Vorgabe. Auch ein
einzelner Experte urteilt nicht immer konsistent. Ein anderer möglicher Grund für einen
fehlenden Lernerfolg ist der, daß die nötigen Bewertungen vom System nicht
berechnet werden können. Dies kann durch die Auswahl und Repräsentation der
Merkmale oder durch die mangelnde Flexibilität des Netzes begründet sein. Eine
Netzarchitektur mit geeigneter Flexibilität kann empirisch durch Tests mit
verschiedenen Netzarchitekturen bestimmt werden. Dabei muß man zwischen Lernerfolg
auf der Trainingsmenge und Lernerfolg auf neuen Aufgaben abwägen, wie in
Abschnitt 5.1.5 beschrieben. Schwieriger ist die Beurteilung der Angemessenheit der
Repräsentation. Da das Training eines neuronalen Netzes bei inkonsistenten Daten eine
Durchschnittsbildung bewirkt, ist die Frage, ob die Repräsentation der Eingabedaten
eine sinnvolle Durchschnittsbildung zuläßt. Mit der hier verwendeten Repräsentation
wird versucht, dies zu leisten, indem die strukturierten Informationen einer
Notensequenz auf die Parameter abgebildet werden, die sich in Musiktheorie und
Musikpsychologie als relevant herausgestellt haben. Es lassen sich zumindest
nach dem heutigen Stand der Forschung nicht alle relevanten Merkmale und
Zusammenhänge modellieren. Man muß daher versuchen, eine geeignete Auswahl
relevanter Parameter zu bestimmen, die ein effektives Lernen mit einer begrenzten
Datenmenge erlaubt.
Ergebnisse im VergleichsmodusDie Versuche mit dem ISSM haben gezeigt, daß es auch aus nicht konsistenten Daten geeignete Gewichte lernen kann. In Tests, die in Abschnitt 12.2 ausführlich dargestellt werden, hat sich gezeigt, daß in einem anwendungsnahen Szenario für Interpretationen eine Fehlerquote auf Testmengen von 20% erreicht werden kann. Allerdings ist nicht jeder Interpretationsfehler musikalisch problematisch, denn die Systemausgabe entspricht bei einem Fehler zwar nicht der vorgegebenen Interpretation, sie kann aber dennoch musikalisch sinnvoll sein. Bei den Tests hat sich gezeigt, daß beim trainierten Netz ca. 15% der Fehlinterpretationen als nicht musikalisch sinnvoll einzustufen sind. Insgesamt sind daher nur ca. 3% der vom System erzeugten Interpretationen nicht musikalisch sinnvoll. Gemessen an den Trefferquoten von OCR-Programmen ist dies kein schlechter Wert und für viele musikwissenschaftliche Anwendungen sicher ausreichend. Für Lernprogramme, in denen der Lernende sich am System orientieren soll, kann dieser Wert allerdings noch zu hoch sein, je nachdem wie die Ergebnisse verwendet werden. Es besteht die Möglichkeit, durch geeignete Filter und eine Eingrenzung der Aufgabe diesen Wert weiter zu reduzieren, wobei man die Flexibilität des Systems bei ungewöhnlichen Eingaben gegen die Sicherheit einer sinnvollen Interpretation bei häufigen Eingaben abwägen muß.
|