15.3. Recherchierbarkeit der Informationen
Die gute Recherchierbarkeit ist ein wesentlicher Vorteil, den digital veröffentlichter
Content gegenüber analog veröffentlichtem bietet. Zudem lässt sich auch über
große Mengen von Dokumenten recherchieren. Gerade die Volltextsuche stellt
gegenüber der Suche in Metadaten und Abstracts ein großen Vorteil dar.
Allerdings erweist sich zugleich als problematisch, dass eine Volltextsuche in
unstrukturierten Texten zu viele Dokumente mit zu geringer Relevanz liefert:
man erhält zwar einen hohen ›recall‹, die ›precision‹ lässt aber zu wünschen
übrig.21
Vgl. dazu auch Seite 242.
|
Im Folgenden sind die wichtigsten Punkte bzw. Anforderungen in Bezug auf eine gute
Recherchierbarkeit stichwortartig aufgelistet:
- Volltextrecherche (Suche im gesamten Text)
- Suche in speziell ausgezeichneten Teilen eines Dokumentes (strukturelle Suche; z. B.
nur in Überschriften, Tabellen, Fußnoten oder Zitaten)
- Suche in Formeln (Physik, Chemie, Mathematik)
- Suche in Noten (Musik)
- Suche nach Rhythmen (Musik)
- Suche nach Audiosequenzen in Musikstücken
- Suche nach Bildteilen in Grafiken oder Bildlegenden
- Suche nach Bildteilen in Videos
- Möglichkeit der Verknüpfung mehrerer Suchbegriffe durch Boolsche Ausdrücke
(und, oder, nicht, etc.)
- Möglichkeit, in der Suche reguläre Ausdrücke zu verwenden
- Nachbarschaftssuche und Ähnlichkeitssuche
- Möglichkeit der Trunkierung (Wortstammsuche) von Begriffen
- Schreibfehler sollten möglichst toleriert werden
Was den reinen Text anbelangt, sind schon viele der oben aufgelisteten
Anforderungen erfüllt. Aber gerade die Suche nach nichttextuellen
Bestandteilen wie Noten, Bestandteilen von Grafiken, Audiosequenzen
von Musikstücken ist sehr kompliziert. Die Entwicklung entsprechender
Werkzeuge22
Für die Musik vgl. z. B. Abschnitt ??.
|
steckt hier noch im Anfangsstadium. An dieser Stelle eröffnen sich allerdings ganz neue
Möglichkeiten der Recherche, die z. B. für Musikwissenschaftler von großer Bedeutung
sind. Gerade für solche Recherchemöglichkeiten ist eine hohe Strukturierung des
Contents (vgl. Abschnitt 15.1) unabdingbar.
Die bisher angesprochenen Möglichkeiten beziehen sich ausschließlich auf das Suchen
bzw. Recherchieren innerhalb eines bereitgestellten Contents. Eine besondere Rolle
spielen zudem Metadaten wie Titel, Autor oder Schlagworte. Durch sie kann effektiver
nach einem bestimmten Content gesucht werden. Des Weiteren sollte dem Nutzer auch
die Möglichkeit gegeben werden, durch thematisch sortierte Mengen an Content zu
navigieren. So lässt sich Content nach Wissenschaftszweigen oder auch nach Instituten
oder Fakultäten einer Universität aufbereiten. Dadurch |