Weyde, Tillman: Lern- und wissensbasierte Analyse von Rhythmen

allgemeinen gelingt dies bei größeren Datenmengen jedoch nicht, was verschiedene Ursachen haben kann. Ein Grund kann sein, daß die Daten, die zum Training benutzt werden, nicht konsistent sind. Wenn man Daten von verschiedenen Experten verwendet, erhält man verschiedene Interpretationen derselben Ein- und Vorgabe. Auch ein einzelner Experte urteilt nicht immer konsistent. Ein anderer möglicher Grund für einen fehlenden Lernerfolg ist der, daß die nötigen Bewertungen vom System nicht berechnet werden können. Dies kann durch die Auswahl und Repräsentation der Merkmale oder durch die mangelnde Flexibilität des Netzes begründet sein. Eine Netzarchitektur mit geeigneter Flexibilität kann empirisch durch Tests mit verschiedenen Netzarchitekturen bestimmt werden. Dabei muß man zwischen Lernerfolg auf der Trainingsmenge und Lernerfolg auf neuen Aufgaben abwägen, wie in Abschnitt 5.1.5 beschrieben. Schwieriger ist die Beurteilung der Angemessenheit der Repräsentation. Da das Training eines neuronalen Netzes bei inkonsistenten Daten eine Durchschnittsbildung bewirkt, ist die Frage, ob die Repräsentation der Eingabedaten eine sinnvolle Durchschnittsbildung zuläßt. Mit der hier verwendeten Repräsentation wird versucht, dies zu leisten, indem die strukturierten Informationen einer Notensequenz auf die Parameter abgebildet werden, die sich in Musiktheorie und Musikpsychologie als relevant herausgestellt haben. Es lassen sich zumindest nach dem heutigen Stand der Forschung nicht alle relevanten Merkmale und Zusammenhänge modellieren. Man muß daher versuchen, eine geeignete Auswahl relevanter Parameter zu bestimmen, die ein effektives Lernen mit einer begrenzten Datenmenge erlaubt.

Ergebnisse im Vergleichsmodus

Die Versuche mit dem ISSM haben gezeigt, daß es auch aus nicht konsistenten Daten geeignete Gewichte lernen kann. In Tests, die in Abschnitt 12.2 ausführlich dargestellt werden, hat sich gezeigt, daß in einem anwendungsnahen Szenario für Interpretationen eine Fehlerquote auf Testmengen von 20% erreicht werden kann. Allerdings ist nicht jeder Interpretationsfehler musikalisch problematisch, denn die Systemausgabe entspricht bei einem Fehler zwar nicht der vorgegebenen Interpretation, sie kann aber dennoch musikalisch sinnvoll sein. Bei den Tests hat sich gezeigt, daß beim trainierten Netz ca. 15% der Fehlinterpretationen als nicht musikalisch sinnvoll einzustufen sind. Insgesamt sind daher nur ca. 3% der vom System erzeugten Interpretationen nicht musikalisch sinnvoll. Gemessen an den Trefferquoten von OCR-Programmen ist dies kein schlechter Wert und für viele musikwissenschaftliche Anwendungen sicher ausreichend. Für Lernprogramme, in denen der Lernende sich am System orientieren soll, kann dieser Wert allerdings noch zu hoch sein, je nachdem wie die Ergebnisse verwendet werden. Es besteht die Möglichkeit, durch geeignete Filter und eine Eingrenzung der Aufgabe diesen Wert weiter zu reduzieren, wobei man die Flexibilität des Systems bei ungewöhnlichen Eingaben gegen die Sicherheit einer sinnvollen Interpretation bei häufigen Eingaben abwägen muß.