Information-Retrieval, Data- und Text-Mining, Inhaltserschließung

Spätestens seitdem die erste indexierende Web-Suchmaschine Altavista im Jahre 1995 an den Start ging, ist Informationsrecherche im Internet alltagstauglich geworden. Mittels Suchmaschinen ist heutzutage jede Person an jedem Ort und zu jeder Zeit in der Lage, relevante und größtenteils personalisierte Informationen zu „ergoogeln“ – und das in allen medialen Formen: als Text, Bild, Karte, Audio, Video etc.
Damit Suchanfragen maschinell „verstanden“, Informationen gefunden und auch nutzergerecht aufbereitet werden können, sind komplexe Algorithmen erforderlich, die für den Nutzer weitgehend unsichtbar im Hintergrund ausgeführt werden.
Information-Retrieval
Wie müssen Daten und Informationen beschaffen sein, damit sie wiedergefunden werden? Wie funktionieren Suchmaschinen? Wie können Objekte in Bildern erkannt werden oder wie erkennt ein Programm, welches Musikstück gerade gespielt wird? Das sind nur einige Fragestellungen, auf die im Themenbereich Information-Retrieval eingegangen wird.
Data-, Text- und Web-Mining
Gigantische Datenmengen, riesige Dokumentensammlungen, unzählige Webseiten (bei Google indexierte Webseiten: ca. 25 Milliarden) oder hochaktive Medienplattformen (YouTube 2013: pro Minute ca. 100 Stunden Videomaterial hochgeladen) bieten neue Möglichkeiten – wie im Bergbau – Informationsschätze aus einer großen Menge von Daten zu gewinnen. Verfahren zur Analyse, Extraktion und Auswertung von Daten und Texten lernen Sie in den Themengebieten Data- bzw. Text-Mining kennen.
Inhaltserschließung
Stellen Sie sich die folgende Situationen vor: Sie suchen Informationen über den Strauß, den größten lebenden Vogel der Erde. Zu Ihrem großen Erstaunen bekommen Sie eine Trefferliste mit Angaben zu Blumensträußen oder mit Biographien über den deutschen Politiker Franz Josef Strauß. Alternativ: Sie brauchen die technischen Daten von einem Fahrstuhl und bekommen keine Information – obwohl Ihre Kollegin alles gefunden hat, weil sie nach „Aufzug“ gesucht hat. In beiden Fällen haben wir es mit sprachlichen Phänomenen zu tun, die Zugang zu Daten erschweren.
Genau mit diesen Problemfeldern befasst sich die Inhaltserschließung: Während des Studiums entwickeln Sie einen Überblick und sichere Vorstellungen über die Funktionsweise der natürlichen Sprache sowie über wesentliche Sprachphänomene. Sie erlernen Methoden, mit denen Sie einen reibungslosen, inhaltlichen Zugang zu Daten schaffen können. Nach dem Studium werden Sie in der Lage sein, diverse Begriffssysteme, die als Instrumente in der Inhaltserschließung benutzt werden, selbst zu entwickeln – sowohl klassische Klassifikationen und Thesauri als auch moderne Ontologien.
Bilddokumentation
Die Bilddokumentation wird im Rahmen des OSA beispielhaft als eines unserer Studienangebote zur dokumentarischen Erschließungsarbeit vorgestellt. Große Bilderdatenbanken werden heutzutage nicht nur von Presseagenturen betrieben, auch viele anderweitige Einrichtungen unterhalten foto- und audiovisuelle Sammlungen.
Wie strukturiert man diese Bestände? Wie werden sie aufbereitet, um dem Nutzer einen schnellen, vollständigen und ballastfreien Zugang zu gewähren? Mit diesen Fragestellungen befasst sich die Bilddokumentation. Im Rahmen dieses Themenfeldes reflektieren Sie das Medium „Bild“ und alle Ebenen der Erschließung – von den formalen Daten über inhaltsdeutende Angaben bis hin zur Sacherschließung. Sie lernen bestehende Methoden und Instrumente sowie aktuelle textbasierte und visuelle Retrievalsysteme kennen.