Inhaltserschließung

Infor­mation-Retrie­val, Data- und Text-Mining, Inhalts­erschlie­ßung

Spä­tes­tens seit­dem die erste in­de­xie­ren­de Web-Such­ma­schi­ne Alta­vista im Jahre 1995 an den Start ging, ist In­forma­tions­re­cher­che im In­ter­net all­tags­taug­lich ge­wor­den. Mittels Such­ma­schinen ist heutzutage jede Person an jedem Ort und zu jeder Zeit in der Lage, re­le­van­te und größ­ten­teils per­sona­li­sierte In­forma­tionen zu „er­goo­geln“ – und das in allen me­dialen For­men: als Text, Bild, Kar­te, Audio, Video etc.

Damit Such­an­fragen ma­schi­nell „ver­stan­den“, In­forma­tionen ge­funden und auch nutzer­ge­recht auf­be­rei­tet werden können, sind kom­plexe Al­go­rith­men er­for­der­lich, die für den Nut­zer weit­ge­hend un­sicht­bar im Hinter­grund aus­ge­führt werden.


Information-Retrieval

Wie müssen Daten und In­forma­tionen be­schaf­fen sein, damit sie wieder­ge­funden werden? Wie fun­ktio­nieren Such­ma­schinen? Wie können Ob­jekte in Bil­dern er­kannt werden oder wie er­kennt ein Pro­gramm, wel­ches Musik­stück gerade ge­spielt wird? Das sind nur einige Frage­stel­lungen, auf die im Themen­be­reich In­forma­tion-Re­trie­val ein­ge­gan­gen wird.


Data-, Text- und Web-Mining

Gigan­tische Daten­mengen, rie­sige Doku­menten­samm­lungen, un­zählige Web­seiten (bei Google in­de­xierte Web­seiten: ca. 25 Mil­liar­den) oder hoch­aktive Medien­­platt­formen (YouTube 2013: pro Mi­nute ca. 100 Stun­den Video­mate­rial hoch­ge­laden) bieten neue Mög­lich­kei­ten – wie im Berg­bau – Infor­mations­schätze aus einer großen Menge von Daten zu ge­win­nen. Ver­fahren zur Analyse, Ex­trak­tion und Aus­wer­tung von Daten und Texten lernen Sie in den Themen­ge­bieten Data- bzw. Text-Mining kennen.


Inhaltserschließung

Stellen Sie sich die folgende Situa­tionen vor: Sie suchen In­forma­tionen über den Strauß, den größ­ten leben­den Vogel der Erde. Zu Ihrem großen Er­stau­nen be­kommen Sie eine Treffer­liste mit An­gaben zu Blumen­sträu­ßen oder mit Bio­gra­phien über den deut­schen Poli­tiker Franz Josef Strauß. Alternativ: Sie brauchen die tech­ni­schen Daten von einem Fahr­stuhl und bekommen keine In­forma­tion – obwohl Ihre Kolle­gin alles gefunden hat, weil sie nach „Auf­zug“ gesucht hat. In beiden Fällen haben wir es mit sprach­lichen Phäno­menen zu tun, die Zu­gang zu Daten erschweren.

Genau mit diesen Pro­blem­fel­dern be­fasst sich die In­halts­er­schlie­ßung: Während des Stu­diums ent­wic­keln Sie einen Überblick und sichere Vor­­stel­­lungen über die Funk­tions­weise der natür­lichen Sprache sowie über wesent­liche Sprach­phäno­mene. Sie er­ler­nen Metho­den, mit denen Sie einen rei­bungs­losen, in­halt­lichen Zu­gang zu Daten schaf­fen können. Nach dem Stu­dium werden Sie in der Lage sein, di­verse Be­griffs­systeme, die als In­stru­mente in der In­halts­er­schlie­ßung be­nutzt werden, selbst zu ent­wic­keln – so­wohl kla­ssische Klassi­fika­tionen und The­sauri als auch mo­derne On­tolo­gien.


Bilddokumentation

Die Bild­doku­menta­tion wird im Rahmen des OSA bei­spiel­haft als eines unserer Studien­an­gebote zur doku­menta­rischen Er­schlie­ßungs­arbeit vor­ge­stellt. Gro­ße Bilder­daten­banken werden heut­zu­tage nicht nur von Presse­agen­turen be­trie­ben, auch viele ander­weitige Ein­rich­tungen unter­halten foto- und audio­vi­suelle Samm­lungen.

Wie struk­tu­riert man diese Be­stände? Wie werden sie auf­be­reitet, um dem Nut­zer einen schnel­len, voll­stän­digen und ballast­freien Zu­gang zu ge­wäh­ren? Mit diesen Frage­stel­lungen be­fasst sich die Bild­doku­menta­tion. Im Rah­men dieses Themen­feldes re­flek­tieren Sie das Me­dium „Bild“ und alle Ebe­nen der Er­schlie­ßung – von den for­malen Daten über in­halts­deu­tende An­gaben bis hin zur Sach­er­schlie­ßung. Sie ler­nen be­ste­hende Me­thoden und In­stru­mente sowie ak­tuelle text­ba­sierte und vi­suelle Re­trie­val­sys­teme kennen.