“Domain-o’-Effect”: Comparison of Domain Specific Sentiment Connotation
In der Sentiment Analyse werden Texte hinsichtlich ihres geäußerten Sentiments untersucht, also wie positiv oder negativ ein Text konnotiert ist. In Sentiment Lexikons wird die mit Tokens verknüpfte emotionale Konnotation festgehalten. Bisherige Lexikons enthalten in der Regel kaum Informationen zu Emojis, insbesondere nicht zu plattformspezifischen Emojis. Sentiment Analyse von Texten, in denen diese Emojis zum Ausdrücken von Sentiments verwendet werden, kann so nicht das tatsächliche geäußerte Sentiment erfassen. Das Fehlen von Sentiment Lexikons für Emojis lässt sich mit dem hohen Aufwand erklären, der mit der herkömmlichen Methode zur Bestimmung von Sentiment Werten, manueller Annotation, verbunden ist. In eine Arbeit von Haak aus dem Jahr 2021 (s.u.) wurde jedoch gezeigt, dass automatisch auf Basis von nicht annotierten Korpora erzeugte Emoji Sentiment Lexika die tatsächlich mit Emojis verknüpften Sentiments widerspiegeln. Es wurde jedoch auch die Vermutung aufgestellt, dass besonders plattformspezifische Emojis in verschiedenen Domänen unterschiedlich genutzt werden. Zusätzlich wurde dabei festgestellt, dass bestimmte Wörter und Ausdrücke ebenfalls domäenspezifische Bedeutungen und Konnotationen haben können. Beispielsweise ist das Verb “kill” im allgemeinen Sprachgebrauch negativ belegt, wohingegen es in vielen Videospielen das primäre Ziel darstellt und daher positiv belegt ist.
Ziel dieser Arbeit ist die Entwicklung eines Systems zur Erfassung von domänenspezifischen Tokens und N-Grams, die mit Sentiment konnotiert sind.
Relevante Literatur und Links
ESUPOL - Einfluss von Suchmaschinen auf die politische Meinungsbildung
Anforderungen
- Grundkenntnisse in Statistik und Python, insbesondere Natural Language Processing
- Spaß am Aufbereiten und Analysieren größerer Datensätze