Studiengang Informationswissenschaft (Master of Science)

Themenbereich: Informationsarchitektur

Modulbezeichnung Texttechnologie   Modulbeschreibung als pdf laden
(Text Technology)
Belegnummer 2105
Studiengang / Verwendbarkeit Masterstudiengang Informationswissenschaft
Modulverantwortliche(r) Prof. Dr. Melanie Siegel
Dozent(in) Prof. Dr. Melanie Siegel
Dauer 1 Semester
Credits 5 CP
Prüfungsart Hausarbeit
Sprache deutsch
Inhalt

In der Texttechnologie geht es um die Eigenschaften elektronischer Dokumente und Methoden zu deren Erstellung und Verarbeitung.
Die technologischen Mittel für die Textanalyse sind u.a.:

  • Tokenisierung
  • POS-Tagging
  • Morphologieanalyse
  • Grammatikanalyse
  • Named Entity Recognition

Wir werden uns mit XML und XSLT für die Textstrukturierung beschäftigen.
Anwendungen für die Texttechnologie sind z.B. Informationsextraktion, automatische Indexierung und automatische Textzusammenfassung.

Im Sommersemester 2019 werden wir gemeinsam ein System zur automatischen Analyse von Produktbewertungen in Social Media - Sentimentanalyse - programmieren. Alle, die am Projekt teilnehmen, müssen bereit sein zu programmieren.

Wenn möglich, bitte eigene Laptops mitbringe, mit darauf installiertem Python (Version 3.6)

Angestrebte Lernergebnisse
(Learning Outcome)

WAS? Die Studis können ein System zur automatischen Klassifikation von Meinungsäußerungen programmieren


WOMIT?  Python-Übungen, dieses Mal nicht in Gruppen


WOZU? um eigenständige Programmierungen umzusetzen, Business Analytics zu betreiben

Niveaustufe / Level Mittleres Niveau (intermediate level course)
Lehrform / SWS Seminar (4 SWS)
Arbeitsaufwand / Workload 128 Stunden
Units (Einheiten)
Notwendige Voraussetzungen
Empfohlene Voraussetzungen

Semantik I, Semantik II, Information Retrieval

Häufigkeit des Angebots
Anerkannte Module Siehe § 19 ABPO
Medienformen Vorlesungsbegleitende Unterlagen und Übungen
Literatur

Wird in der Veranstaltung und im Moodle bekannt gegeben.

Stand: 19.02.2019, 15:33:27. Ältere Versionen im Archiv.