Crawl Your Prof - Fact-Crawling von Hochschulseiten

Crawl Your Prof

Auf Hochschul-Webseiten schlummern viele Informationen über Professoren und andere Personen. Z.B. kann man die Veröffentlichungen finden, aber auch Modulhandbücher, Postings in Foren, Personenwebseiten, usw. - All diese Informationen ergeben ein relativ umfängliches Bild einer Person. In diesem Fall von Professoren.

Im Rahmen dieser Bachelorarbeit soll zunächst händlich evaluiert werden, welche öffentlich verfügbaren Informationen sich über Professoren auf Hochschulwebseiten zusammentragen lassen. In einem weiteren Schritt soll anhand einer Prototypen-Implementation auf den Webseiten der TH möglichst viel an Fakteninformationen über einzelne Professoren gecrawlt werden. Das Ziel sollte es sein, hier natürlich von einem Einzelfall auf alle Professoren einer Hochschule skalieren zu können.

Die Prototypen-Implementierung kann z.B. auf Crawling-Frameworks wie Scrapy oder OXPath, etc. aufsetzen.

Anforderungen

  • Erste praktische Erfahrung in der Programmierung mit z.B. Python oder R
  • Spaß am wissenschaftlichen Arbeiten

Abschlussarbeit

Abschluss
B.Sc.
Bearbeiterin
Ruben Bischkopf