Domain Specific Sentiment Expression: Twitch Emotes Sentiment Lexicon
In der Sentiment Analyse werden Texte hinsichtlich ihres geäußerten Sentiments untersucht, also wie positiv oder negativ ein Text konnotiert ist. In Sentiment Lexikons wird die mit Tokens verknüpfte emotionale Konnotation festgehalten. Bisherige Lexikons enthalten in der Regel kaum Informationen zu Emojis, insbesondere nicht zu plattformspezifischen Emojis. Sentiment Analyse von Texten, in denen diese Emojis zum Ausdrücken von Sentiments verwendet werden, kann so nicht das tatsächliche geäußerte Sentiment erfassen. Das Fehlen von Sentiment Lexikons für Emojis lässt sich mit dem hohen Aufwand erklären, der mit der herkömmlichen Methode zur Bestimmung von Sentiment Werten, manueller Annotation, verbunden ist. In eine Arbeit von Haak aus dem Jahr 2021 (s.u.) wurde jedoch gezeigt, dass es möglich ist, ohne manuelle Annotation effektiv Sentiments von Emojis über große Korpora abzuleiten.
Neben UTF-8 Emojis werden auf vielen Plattformen auch plattformspezifische Emojis genutzt. Auf der Streamingplattform Twitch sind die so genannten Twitch Emotes das meistgenutzte Mittel, um Sentiments zu äußern. Für diese Emojis existiert jedoch noch kein umfassendes Sentiment Lexikon. Ziel dieser Arbeit ist es, mithilfe der in Haak (2021) genutzten Methodik ein universelles Twitch Emote Sentiment Lexikon zu produzieren. Dafür müssen verschiedene NLP Techniken genutzt werden um zunächst einen Korpus zu erstellen und aufzubereiten. Tests sollen abschließend Aufschluss über die Effektivität des Lexikons geben.
Relevante Literatur und Links
ESUPOL - Einfluss von Suchmaschinen auf die politische Meinungsbildung
Anforderungen
- Grundkenntnisse in Statistik und Python, insbesondere Natural Language Processing und Sentiment Analyse
- Interesse, sich multidisziplinarischen Problemen zu stellen
- Spaß am Aufbereiten und Analysieren größerer Datensätze
- Idealerweise: Kenntnisse der Plattform Twitch.tv und der plattformspezifischen Kommunikation