
Wenn Algorithmen Bewerbungen aussortieren
Persönlichkeitstests, Fragebogen, Sprachproben: Manche Personalabteilungen filtern Bewerbungen mittlerweile automatisiert vor. Mit welchen Konsequenzen? Gespräch mit einem Forscher.
Interview: Maria Al-Mana
Konrad Lischka ist Projektmanager der Bertelsmann-Stiftung im Zentrum internationale Foren und Trends. Im Mai 2017 hat er gemeinsam mit Anita Klingel für die Stiftung als Herausgeberin das Arbeitspapier „Wenn Maschinen Menschen bewerten“ verfasst.
Im Vorwort heißt es, dass solche Programme bereits seit Jahren im Einsatz sind. Sie "kategorisieren Menschen ohne große Debatte über Fairness, Erklärbarkeit, Überprüfbarkeit oder Korrigierbarkeit der Verfahren.“ Welche Chancen und Risiken solche Programme bieten, wollten wir von Konrad Lischka, einem der Autoren des Papiers, wissen. Er sagt ganz deutlich: „Ich bin kein Experte für Recruiting, ich beschäftige mich mit algorithmischen Prozessen und deren Wirkung auf die Gesellschaft.“
Die Bertelsmann-Stiftung betont bereits in der Ankündigung ihres Arbeitspapiers: „Damit maschinelle Entscheidungen den Menschen dienen, braucht es gesellschaftliche Gestaltung, zum Beispiel in Form von Gütekriterien für algorithmische Prognosen. Handlungsbedarf besteht nicht allein auf der technischen Ebene.“ Lischka ergänzt: „Wir stellen klar, dass diese Verfahren zum Guten gestaltet werden müssen, damit sie zum Wohle aller wirken können. Das passiert nicht von allein.“
WILA Arbeitsmarkt: Welche Arten automatisierter Auswahlverfahren der Personalrekrutierung gibt es derzeit überhaupt?
Konrad Lischka: Eine wichtige Rolle spielen in den USA und Großbritannien zum Beispiel Persönlichkeitstests. Online ist ihr Einsatz erheblich günstiger, aber die Methode war auch schon offline im Einsatz. Bei solchen Verfahren beantworten Kandidaten Fragen und werden dann in ein Persönlichkeitsmodell eingruppiert.
Danach werden sie, basierend auf Hypothesen, bewertet: Welche Persönlichkeitsausprägungen passen zu welchen Stellen? Die Informatikerin Cathy O’Neil nennt als ein Beispiel für solche Strategien diese Annahme: Kandidaten mit einem vorwiegend „kreativen“ Profil bleiben länger auf einer Stelle.
Es sind auch Fragebögen mit anderen Grundannahmen im Einsatz. Bekannt ist ein Beispiel, in dem ein Call-Center-Betreiber die Entfernung zwischen Wohnort der Kandidaten und dem Arbeitsort in die Auswertung einbezog. Zu lange Anfahrtswege führten zur automatisierten Aussonderung der entsprechenden Kandidaten. Denn Mitarbeiter mit langen Wegen kündigten bei diesem Arbeitgeber statistisch gesehen eher als andere.
- Fachterminus für die Entscheidungsfindung über Algorithmen ist „algorithmic decision making“, kurz ADM. Es geht dabei um die Möglichkeit für Firmen, ihre Personalgewinnung zu automatisieren, wenigstens über eine Vorauswahl.
- Welche Kriterien deutsche Firmen dabei zugrunde legen, wird (noch) nicht offen kommuniziert – dennoch sind Auswirkungen dieser Verfahren bereits deutlich erkennbar.
Die US-Firma strich dieses Kriterium jedoch später, weil es systematisch Menschen aus ärmeren Vierteln mit vorrangig schwarzer Bevölkerung diskriminieren könnte, die sich Wohnungen in der Nähe des Unternehmens nicht leisten können. Bekannt sind auch Tests, die mit einer Stimmanalyse arbeiten. Nicht der Inhalt des Gesagten, sondern die Sprachprobe an sich wird dabei genutzt, um auf Persönlichkeitsmerkmale zu schließen. Zudem werden von manchen Firmen Online-Spiele eingesetzt, die die Fertigkeiten und Kompetenzen von Bewerbern prüfen sollen.
Wie verbreitet sind solche Verfahren?
Das ist schwierig zu sagen, weil es keinen Branchenstandard zur Untersuchung gibt und außerdem unterschiedliche Definitionen davon, was genau unter algorithmischen Prozessen bei der Bewerberauswahl zu verstehen ist. In den Vereinigten Staaten und Großbritannien sind algorithmische Verfahren seit einigen Jahren im Einsatz.
Zur Verbreitung gibt es Einschätzungen von Branchenbeobachtern und Umfragen unter Unternehmen: 2014 schätzte die Beratungsfirma Bersin, dass in den USA 60 bis 70 Prozent der Bewerber einen Online-Persönlichkeitstest absolvieren. Aus Medienberichten ist bekannt, dass damals in den USA vor allem große Einzelhandelsketten und Dienstleister algorithmische Prozesse einsetzten. In Großbritannien nutzen der Association of Graduate Recruiters (AGR) zufolge 71 Prozent aller Arbeitgeber eine Form psychometrischer Testverfahren – darunter fallen auch Online-Persönlichkeitstests.
Und wie sieht es in Deutschland aus?
Hier nutzen einer Umfrage aus dem Jahr 2016 zufolge sechs Prozent der 1.000 größten Unternehmen aktuell computergesteuerte Auswahlverfahren. 47,5 Prozent der befragten Unternehmen bejahen die Frage, ob eine computergesteuerte und automatische Selektion von Bewerbungen in Zukunft häufiger zum Einsatz kommen wird. Eine Befragung unter Stellensuchenden und Karriereinteressierten kam jedoch zu einem anderen Ergebnis: 40 Prozent der Befragten gaben an, mindestens einmal im Rahmen der Stellensuche mit computergesteuerten und automatisierten Auswahlinstrumenten konfrontiert worden zu sein.
Welche Chancen, welche Risiken automatisierter Rekrutierungsverfahren sind derzeit absehbar?
Eine Besonderheit algorithmischer Prozesse ist die Konsistenz ihrer Anwendung: Algorithmische Systeme arbeiten zuverlässig die vorgegebene Entscheidungslogik in jedem Einzelfall ab. Im Gegensatz zu menschlichen Entscheidern ist Software nicht tagesformabhängig und wendet nicht willkürlich in Einzelfällen neue, unter Umständen ungeeignete Kriterien an. Das kann eine Chance sein. Wir wissen aus empirischen Studien, dass der Nachname und die Hautfarbe von Bewerbern eine Rolle bei manchen menschlichen Entscheidern spielen kann. Solche Formen der Diskriminierung könnte man mit einem algorithmischen System leichter vermeiden.
Aber die Konsistenz der Anwendung kann auch ein Risiko sein, denn auch eine fehlerhafte Entscheidungslogik wendet ein ADM-System zuverlässig in jedem Einzelfall an. Und selbst wenn Diskriminierung über Faktoren wie Geschlecht, fremd klingende Namen, Bewerberfotos oder offen kommunizierte Behinderungen in einem algorithmischen Verfahren unterbunden wird, kann das System dennoch über Umwege nach diesen Kriterien unterscheiden. So wie zum Beispiel bei dem algorithmischen Prozess, der die Entfernung des Wohnorts der Bewerber zum Arbeitsplatz in die Analyse einbezog – und damit einen Hinweis auf Armut, beziehungsweise in den USA auch mittelbar einen Hinweis auf Hautfarbe lieferte.
Lässt sich schon feststellen, welche Auswirkungen solche Systeme auf Arbeitsuchende und deren Chancen haben werden?
Die erste Schwierigkeit hat einen finanziellen Hintergrund: Wenn notwendige Daten digital vorliegen, kostet es in der Regel weniger, ein algorithmisches System zu skalieren als den rein menschlichen Entscheidungsprozess zu nutzen. Das kann Konzentrationen begünstigen: Wenn digitale Auswahlverfahren weniger Anbieter bei vielen Firmen im Einsatz sind, fallen mögliche Verzerrungen dieser Systeme viel stärker ins Gewicht. Solche Verzerrungen können durch die Schwierigkeit zur Falsifizierung der genutzten Parameter entstehen.
Das bedeutet ganz klar: Für den einzelnen Arbeitssuchenden wird es schwierig, sich der Breitenwirkung der genutzten Systeme zu entziehen. Es kann gut sein, dass von solchen Verzerrungen insgesamt weniger Menschen betroffen sind als bei rein menschlichen Entscheidungen, wo Diskriminierung über Nachnamen zum Beispiel empirisch belegt ist. Aber das hilft im Einzelfall nicht, wenn Arbeitssuchende wenige Ausweichmöglichkeiten haben.
Denn bezogen auf die genutzten Systeme gibt es eine grundsätzliche Herausforderung: Wie stellt man deren Falsifizierbarkeit sicher? Alle ADM-Systeme liefern ja nur Prognosen. Wie aber bemerkt ein Unternehmen, wenn ein Auswahlverfahren systematisch Kandidaten aussortiert, die eigentlich für die Stelle geeignet wären? Wenn diese Menschen nicht eingeladen oder eingestellt werden, ist eine Falsifikation der Prognose ja gar nicht möglich.
Abgesehen von diesen grundsätzlichen Besonderheiten algorithmischer Prozesse gibt es bei der konkreten Umsetzung eines Verfahrens je nach Methode spezifische Chancen und Risiken. Bei Testverfahren ist es je nach Gestaltung möglich, dass etwa formale Qualifikationen weniger zählen als bei herkömmlichen Auswahlverfahren. Wenn also Kompetenzen mehr zählen als Kreditpunkte, Arbeitsmarktbedarfe mehr als Abschlüsse, würde das durchaus Chancen für bisher benachteiligte Gruppen eröffnen, wie etwa Langzeitarbeitslose oder Niedrigqualifizierte.
Der Artikel ist im WILA Arbeitsmarkt erschienen. Jede Woche werden im gedruckten Heft oder E-Paper rund 550 aktuelle Stellen zusammengestellt – speziell für Akademiker*innen mit einem generalistischen Studienhintergrund.
- Die Abonnentinnen und Abonnenten erhalten durch den redaktionellen Teil und die Stellenübersicht einen breiten und dennoch konkreten Überblick über derzeitige Entwicklungen in Tätigkeits- und Arbeitsmarktfeldern, können sich anhand der ausgewählten Jobs beruflich orientieren und bleiben so bei der Jobsuche am Ball. Unsere Erfahrung: Viele Abonnent*innen stoßen auf Tätigkeiten, die sie für sich gar nicht auf dem Schirm hatten.
- Erstabonnent*innen können kostenlos ein zweiwöchiges Schnupperabo bestellen. Mehr Infos hier.