Quantitative Analyse von Modulhandbuchtexten mit NLP-Methoden

Quantitative Analyse von Modulhandbuchtexten mit NLP-Methoden

Die Arbeitsgruppe verfügt über einen großen Datensatz über die Inhalte der Modulhandbücher informations- und bibliothekswissenschaftlicher Studiengänge im deutschsprachigen Raum. Insbesondere die textuellen Inhalte dieses Datensatzes besitzen großes Potential, aus ihnen Einblicke über die gelehrten Inhalte dieser Studiengänge zu gewinnen. Aufgrund der großen Datenmenge bietet sich ein quantitativer Analyseansatz an. Beispielsweise können die Texte der Modulinhaltsbeschreibungen für ein Clustering herangezogen werden, um Themengebiete zu isolieren und Schlüsselbegriffe zu identifizieren. Mögliche Fragestellungen wären etwa: Welche Themenfelder lassen sich studiengangsübergreifend identifizieren? Wie groß ist der relative Anteil eines bestimmen Themenkomplexes (etwa informationstechnische Inhalte) in den einzelnen Studiengängen? Wie verändert sich dies über die Zeit? In Ansprache mit den Betreuern können auch gern eigene Fragestellungen eingebracht werden.

Anforderungen

  • Programmierfertigkeiten, z.B. Python
  • Grundkenntnis von geeigneten NLP-Verfahren wie Topic Modeling, Word Embeddings, Clustering
  • Kenntnisse in Statistik

Abschlussarbeit

Abschluss
BA
Bearbeiterin
n.a.