HaSPI – Hate Speech Prevention through Imitation

Mit Imitation Learning effektiv gegen Hassrede im deutschsprachigen Netz vorgehen.

Hintergrund und Projektinhalt

Hassrede und Hasskommentare sind ein allgegenwärtiges Problem in den sozialen Medien, Foren und auf ähnlichen Webseiten. Dagegen vorzugehen ist mit hohem technischen und personellen Aufwand verbunden. Es existieren zwar automatisierte Tools für die Erkennung und Löschung von Hasskommentaren, allerdings sind diese nicht für Inhalte im deutschsprachigen Raum optimiert. HaSPI schließt diese Lücke und entwickelt eine Software, die problematische Inhalte erkennen und moderierend eingreifen (Moderationssoftware) kann.

Zielgruppen

Eine Zielgruppe für unsere Software sind Betreiber*innen von deutschsprachigen Foren, die offene und transparente Diskussionen bieten, aber auch Hasskommentaren einen Riegel vorschieben wollen. Zu dieser Gruppe zählen gewerbliche Anbieter*innen und private Personen, die zum Beispiel Blogs verfassen.

Außerdem wollen wir die wissenschaftliche Gemeinschaft und Entwickler*innen von Content-Moderation-Software ansprechen und ihnen den Nutzen von Imitation Learning (Software lernt an Beispielen von User*innen) näherbringen.

Eine weitere Zielgruppe sind die Nutzer*innen von Online-Foren. Das Aufspüren (und die Löschung) von Hasskommentaren soll zu einen besseren Diskussionskultur und zu mehr Meinungsvielfalt beitragen; unter anderem weil Personen, die sich von Hass im Netz einschüchtern haben lassen, auf die Plattformen zurückgeholt werden können.

Methodik und Funktionsumfang

Unsere Software nutzt Machine Learning Methoden, die mit einem Datensatz von Kommentaren und Einträgen von der standard.at („One Million Posts“-Corpus von denen etwa 11.000 werden gelabelt werden) trainiert werden. Die Software lernt so von den Nutzer*innen-Aktionen und ist danach in der Lage diese zu imitieren (Imitation Learning). Durch die Einbeziehung von plattformspezifischen Kontextinformationen, wie der Nutzer*innenhistorie und die thematische Ausrichtung von Inhalten, erhöhen wir die Genauigkeit und Leistungsfähigkeit unserer Lösung. Außerdem vergleichen wir sie mit anderen derzeit gebräuchlichen Modellen und testen, ob sie zur Moderation von Foreninhalten auf derstandard.at erfolgreich eingesetzt werden kann.

Wir bauen ein nutzer*innenfreundliches Interface für unsere Software, mit dem Beiträge auf einfache Weise als problematisch klassifiziert werden können. Die Erkennung und Löschung von Hasskommentaren soll damit schneller und effizienter abgewickelt werden können.

Ergebnis und Ausblick

In dem HaSPI Projekt entwickeln wir eine Software-Lösung, die auf Imitation Learning setzt, um Hassrede automatisiert erkennen und entfernen zu können. Die Software wird für den Einsatz im deutschsprachigen Netz optimiert sein und frei zur Verfügung stehen. Um seinen Funktionsumfang zu erweitern, soll das Programm mit weiteren Daten-Corpora trainiert werden (z.B. mit dem Datensatz der Rheinischen Post). Darüber hinaus soll die Nützlichkeit des Modells auch auf kleinerer Foren und Blogs getestet werden.

Sie wollen mehr wissen? Fragen Sie nach!

Senior Researcher Institut für IT Sicherheitsforschung
Department Informatik und Security
Arbeitsplatz: B - Campus-Platz 1
Finanzierung
IPA (NetIdee)
Laufzeit
01.03.2025 – 31.05.2026
Projektstatus
laufend
Beteiligte Institute, Gruppen und Zentren
Forschungsgruppe Data Intelligence
Institut für IT Sicherheitsforschung