Die Algorithmen und Informationssysteme, die das Funktionieren von Internet-Suchmaschinen wie Google oder Bing ermöglichen, sind sogenannte “Black Boxes”. Wir wissen nicht genau, wie die Algorithmen funktionieren und welche Faktoren (z.B. Sprache, Region, Suchvolumen des Suchbegriffs, Aktualität des Suchbegriffs, Suchhistorie) einen Einfluss auf die angezeigten Ergebnisse und das Ranking haben. Da sich aber immer mehr Menschen Online über politische Themen informieren, kann die Auswahl und das Ranking einen entscheidenden Einfluss auf die Wahrnehmung der Nutzer haben. Deswegen ist ein genaueres Verständnis der Systeme wichtig, um mögliche soziale Folgen besser abschätzen zu können. Während schon einiges zu Suchergebnissen geforscht wurde, standen die Suchvorschläge bisher erst wenig im Fokus.
Ziel dieser Arbeit ist deswegen ein Vergleich der verschiedenen Autocomplete-Systeme von Internet Suchmaschinen. Welche Faktoren haben einen Einfluss auf das Ranking? Auf theoretischer Ebene können in der Literatur bekannte Systeme zur automatischen Vervollständigung vorgestellt werden. Da aber die Funktionsweise der in der Praxis eingesetzten Systeme von Google, Bing usw. nicht im Detail bekannt ist, sollen anhand von bereits bestehenden realen Daten die verschiedenen Autocomplete-APIs analysiert werden. Es können die schon bestehenden Datensätze genutzt werden oder neue Daten (beispielsweise zu Suchvorschlägen auf “Youtube”) erhoben werden. Die verschiedenen Rankings der Vervollständigungen können danach miteinander verglichen werden.
- “A Similarity Measure for Indefinite Rankings”, Webber et al, 2010
- “Automatische Vervollständigung bei der Suche nutzen”, Google, 2018
- “A Survey of Query Auto Completion in Information Retrieval”, Fei Cai and Maarten de Rijke, 2016
- Spaß am wissenschaftlichen Arbeiten und dem Lesen aktueller Literatur
- Erste praktische Erfahrung in der Programmierung mit Python und/ oder R