Studiengang Informationswissenschaft (Master of Science)
Themenbereich: Business Information Engineering
Modulbezeichnung | Methoden-Workshop: Web Science Mining (Methodological-Workshop: Web Science Mining) |
---|---|
Belegnummer | 4109 |
Studiengang / Verwendbarkeit | Masterstudiengang Informationswissenschaft und MA&S, OJ, WJ |
Modulverantwortliche(r) | Prof. Dr. Bernd Jörs |
Dozent(in) | Prof. Dr. Bernd Jörs |
Dauer | 1 Semester |
Credits | 5 CP |
Prüfungsart | Prüfungsleistung: Klausur oder mündliche Prüfung |
Sprache | deutsch |
Inhalt | Die Arbeitswelt der Masterabsolventen wird derartige Qualifikationen gerade im Bereich des „Information Science and Engineering“ vermehrt abverlangen.
Eine der informationsökonomischen Aufgaben ist es, das richtige methodische, quantitative und qualitative Werkzeug einzusetzen, um die Unsicherheit über zukünftige Entwicklungen und Ereignisse informationswirtschaftlich besser abzuschätzen, die Risiken mit verbesserten Wahrscheinlichkeiten zu versehen und damit dem Entscheider eine bessere Informationsbasis zu geben. |
Angestrebte Lernergebnisse (Learning Outcome) |
Das von Sir Tim Berners-Lee, dem Begründer des World Wide Web, ins Leben gerufene interdisziplinäre Forschungsfeld der „Web Science“ (web science trust, webscience.org) vereinigt eine Vielzahl von Wissenschaftsdisziplinen: Computer Science, Media, Economics, Law, Social-cultural, Sociology, Ecology, Biology, Psychology, Artificial Intelligence, Web Engineering und Mathematics. Zu den wichtigsten Voraussetzungen, um im zukunftsträchtigen Web Science-Segment tätig zu sein, sind die Kenntnis, Beherrschung und Anwendung von Methoden des Data- und Web Mining, insbesondere in Bezug auf das Forschungsterrain des knowledge engineering und den Methoden der artificial intelligence (Künstliche Intelligenz). Dies gilt sowohl für die Analyse strukturierter als auch, und in Zukunft vermehrt, für die Aufbereitung und Auswertung unstrukturierter Daten und Informationen, wie z.B. im „Web 2.0“. Studenten des informationswissenschaftlichen Bachelor und Master haben durch ihre einschlägigen Qualifikationen eine ausgezeichnete Voraussetzung, in diesem multidisziplinären, über den eigenen Tellerrand schauenden Zukunftsbereich tätig zu sein. Um die bestehenden Fähigkeiten dieser Studierenden zu erweitern und zusätzliche, praxistaugliche Alleinstellungsmerkmale zu vermitteln, soll in diesem Fachmodul ein methodisch-operatives Rüstzeug im Umgang mit Business Intelligence-, insb. Data- und Web Mining-Verfahrenstechniken bzw. Maschinellen Lernverfahrensansätzen mit auf den Weg gegeben werden. AbsolventInnen des Masterstudiengangs sollen später schnell, kostengünstig und zielführend für verschiedene Kunden, Nutzer und Entscheider Informations(vermarktungs)dienstleistungen auf hohem qualitativem und wissenschaftlichem Niveau vollbringen. Auf einem der wichtigsten beruflichen Arbeitsfelder der Zukunft, der Aufbereitung von strukturierten und unstrukturierten (Massen-)Daten, nicht zuletzt durch die aufgekommene „Big Data“-Diskussion angestoßen, sind zur Erlangung von arbeitsmarktrelevanten, wettbewerbsfähigen Qualifikationsalleinstellungsmerkmalen u.a. gute methodische skills zur Analyse derartiger strukturierter und unstrukturierter Datenmengen dringend notwendig. Dazu muss man u.a. auf die in der „scientific und practice community“ bekannten und akzeptierten quantitativ-qualitativen,heuristisch-statistischen Verfahren zurückgreifen. Aber dies nicht kritiklos und „blind“. Das moderne Management benötigt Mitarbeiter, die fundierte (empirische) Analyse-, Klassifikations- und Prognosemethoden kennen und beherrschen, aber auch deren Aussagekraft und Grenzen bei der Datenerhebung, -aufbereitung, -analyse und –aufbereitung richtig einschätzen können; gerade im Zeitalter der (webbasierten) Massendatenproduktion („Big Data“) ist hier ein kritisch-wacher Sachverstand notwendig, denn die Ankündigungen sind beeindruckend:
Carolin Kaiser stellt in ihrem Buch „Business Intelligence 2.0“ die richtigen Ausgangsfragen:
Was sind das für Analyse-, Klassifikations- und Vorhersagemethoden, was können sie und was können sie nicht?
Warum wird über eine vereinfachte Darstellung nicht die eigentliche (begrenzte) Substanz dieser oft sehr mathematisch formelhaft komplex dargestellten Methoden offen gelegt, wie in diesem Fachmodul vorgesehen? Warum fällt es so schwer, sich neuen Erkenntnissen und Verfahrenstechniken der qualitativ-intuitiven Prognostik oder der webbasierten Datenerhebungs- und -analysetechniken für die Analyse-, Forschungs- und Prognosearbeit zu öffnen, die nachweislich bessere Ergebnis- und Vorhersagequalitäten besitzen, wie Auswertungen bei Google Analytics oder elektronischen Plattformen wie „prediction markets“ belegen ? Wie gehe ich insbesondere mit der Analyse strukturierter und vor allem durch das Text- und Web Mining vorgegebener unstrukturierter Daten um. Können die traditionellen, multivariaten Analysemethoden hier mithalten? Im Fokus der Lehrveranstaltung steht das Qualifikationsziel der anwendungsorientierten Vermittlung von Verfahrenstechniken des empirisch-experimentellen Data- und Web-Mining, insbesondere mit Bezug auf die Grundlagen Maschinellen Lernens (als Bestandteil des Knowledge Discovery in Databases KDD). Ausgangspunkt sind die methodischen Anaylsetechniken des Data-Mining, das versucht – wie in Wikipedia allgemein formuliert – „aus einem Datenberg etwas Wertvolles (zu) extrahieren“. Methodenbasis für eine systematische Auswertung der Daten, die häuifg wertvolles implizites Wissen enthalten, ist die Anwendung bestimmter, anerkannter deskriptiver und induktiver statistischer Analyseverfahren „mit dem Ziel, neue Muster zu erkennen.“ Text- und Web-Mining nutzen diese methodischen Grundlagen des Data Mining, um solche Muster (pattern) aus eher unstrukturierten Daten herauszufiltern.
Wie lassen sich aus Vergangenheitsdaten (Trainingsdaten) Regelhaftigkeiten, Muster, Zusammenhangs- und Abhängigkeitsbeziehungen, Prognosepotenziale, Ähnlichkeiten, Klassifikationen (Cluster, Assoziationen) oder Netzwerkverbindungen herleiten und anhand von Testdaten sowie durch überwachtes oder nicht-überwachtes maschinelles Lernen überprüfen?
Es bedarf also dreier grundsätzlicher Qualifikationsziele:
Die Vermittlung mathematisch/heuristischer-statistischer, insb. „multivariater Verfahren“, löst oftmals ein „ungutes“ Gefühl aus, deshalb werden stellen sich für den Dozenten besondere Herausforderungen. Die Lehrveranstaltung soll daran gemessen werden, ob sie den kritisch-rationalen Anmerkungen von Karl Popper Folge geleistet haben. |
Niveaustufe / Level | Fortgeschrittenes Niveau (advanced level course) |
Lehrform / SWS | Seminar (4 SWS) |
Arbeitsaufwand / Workload | 128 Stunden |
Units (Einheiten) | |
Notwendige Voraussetzungen | |
Empfohlene Voraussetzungen | Interesse an einer methodisch-wissenschaftlichen Qualifikation für Aufgaben im Business Intelligence-, Online-Marketing-, Wirtschafts- und Finanz-, Marktforschungs- oder Wissenschaftsbereich. Da die Lehrveranstaltung als (geblockter) Methodenworkshop angeboten werden soll und die Teilnehmer schon während der Veranstaltung die Anwendung der Methoden üben sollen, wird die Bereitschaft zur aktiven und ernsthaften Teilnahme eine elementare Voraussetzung sein. Interessenten, die andere für sich arbeiten und rechnen lassen wollen, in der Lehrveranstaltung lieber online googeln, sollten diese Lehrveranstaltung nicht belegen. |
Häufigkeit des Angebots | |
Anerkannte Module | Siehe § 19 ABPO |
Medienformen | |
Literatur |