Ein überraschender Weg, um Gender Bias in Leistungsbeurteilungen zu bekämpfen

Ein überraschender Weg, um die geschlechtsspezifische Verzerrung in Leistungsbeurteilungen zu verringern

Als Nadia Comăneci bei den Olympischen Spielen 1976 auf den Stufenbarren eine perfekte 10 für ihre Routine erzielte, schrieb sie Geschichte. Keine andere Turnerin hatte jemals eine so makellose Note bei den Spielen erhalten, und sie verdiente in diesem Jahr in Montreal sechs weitere davon – zusammen mit drei Goldmedaillen. Ihre umwerfenden Darbietungen und diese perfekten Zehner haben sich als eine Geschichte der Brillanz in das kollektive Gedächtnis eingebrannt.

Die Geschichten über Brillanz, die wir uns in unserem täglichen Leben, bei der Arbeit und insbesondere in bestimmten Bereichen erzählen, zeigen jedoch eher männliche Protagonisten. Und wenn es um Leistungsbeurteilungen geht, erzielen Männer mit weitaus größerer Wahrscheinlichkeit perfekte Zehner, und Frauen, die in denselben Rollen an ihrer Seite arbeiten, sehen viel seltener ähnliche Noten – selbst wenn sie durch andere Maßnahmen genauso gut abschneiden.

So sagt Forschung vor kurzem in der veröffentlichten American Sociological Review. Aber hier ist der überraschende Teil: Wenn die Bewertungen auf einer Sechs-Punkte-Skala statt auf einer 10-Punkte-Skala basierten, verschwand die Kluft zwischen den Geschlechtern praktisch.

Die Ergebnisse deuten darauf hin, dass nur eine kleine Änderung der Art und Weise, wie wir Bewertungssysteme entwerfen – selbst eines, das so scheinbar belanglos ist wie die Anzahl möglicher Bewertungen auf einer Skala – die geschlechtsspezifische Tendenz stören könnte.

Die Autoren der Studie untersuchten zunächst echte Lehrbewertungen an einer namenlosen Universität in Nordamerika, die zufällig von einer 10-Punkte-Skala auf eine 6-Punkte-Skala übergingen. Vor dem Wechsel erhielten männliche Professoren in von Männern dominierten Fachgebieten in 31,4% der Fälle Bestnoten oder „10“, verglichen mit nur 19,5% der Fälle bei weiblichen Professoren. Nach dem Wechsel erhielten Männer und Frauen in 41,2% bzw. 42,7% der Fälle die Bestnote 6.

Mit anderen Worten, die neue Skala bedeutete, dass Frauen – in vielen Fällen genau dieselben Professoren, die genau dieselben Klassen unterrichteten, die sie zuvor unterrichtet hatten – plötzlich genauso oft Bestnoten erhielten wie ihre männlichen Kollegen.

Die Autoren waren sich sehr bewusst, dass einige Kritiker (und viele Sexisten) argumentieren würden, dass die männlichen Professoren einfach eher außergewöhnlich sind und dass alles, was die neue kondensierte Skala tat, das Wasser trübte und es schwieriger machte, das sehr Gute vom Guten zu unterscheiden wirklich brillant.

Ihre zweite Studie kontrollierte also mögliche Unterschiede in der tatsächlichen Unterrichtsqualität. Sie zeigten den Online-Teilnehmern das Protokoll einer Vorlesung, die angeblich von einem Professor gehalten wurde (tatsächlich basierte es auf einem TED-Vortrag), aber einigen wurde gesagt, der Ausbilder sei John Anderson und andere, es sei Julie Anderson.

Wenn die Teilnehmer eine 10-Punkte-Skala verwendeten, erreichte „John“ in 22% der Fälle die Bestnote, verglichen mit 13% bei „Julie“. Wenn andere Teilnehmer eine Sechs-Punkte-Skala verwendeten, gaben sie in 25% bzw. 24% der Fälle Bestnoten für „John“ und „Julie“.

„Während die Bestnote auf einer 10-Punkte-Skala Bilder von außergewöhnlicher oder perfekter Leistung hervorrief – und infolgedessen aktivierte Geschlechterstereotypen der Brillanz sich in dem Zögern der Bewerter manifestierten, Frauen Bestnoten zuzuweisen – die Bestnote auf der Sechs-Punkte-Skala hatte keine so starken Leistungserwartungen “, schreiben die Autoren des Papiers, Lauren A. Rivera von der Northwestern University und András Tilcsik von der University of Toronto. „Im Rahmen des Sechs-Punkte-Systems erkannten die Bewerter eine größere Vielfalt von Leistungen – und kritisch auch die Darsteller – als Bestnoten an.“

Obwohl sich diese Studien auf die Wissenschaft konzentrierten, sollten die Ergebnisse jeden und jeden dazu bringen, darüber nachzudenken, wie fair die vermeintlich objektiven Instrumente sind, mit denen sie die Leistung tatsächlich messen. Die Autoren weisen darauf hin, dass die Zahl 10 eine einzigartige kulturelle Bedeutung hat, und daher war eine Skala, die sich darauf stützte, möglicherweise besonders anfällig dafür, Vorurteile zu reflektieren.

Das Fazit ist, dass Sie die Bewertungen auswerten müssen. Wenn zwischen den Gruppen eine Leistungslücke zu bestehen scheint, fragen Sie und untersuchen Sie, ob das Problem die Leistung selbst ist oder wie Sie sie messen.

Es mag so aussehen, als wären dies kleine, unbedeutende Unterschiede im großen Schema der Dinge, aber Bewertungen wirken sich auf alles andere aus. „Angesichts der Tatsache, dass Leistungsbewertungen häufig an wichtige Belohnungen wie Gehälter, Boni und Beförderungen gebunden sind, können Bewertungssysteme direkte Auswirkungen auf die Karriere der Mitarbeiter haben“, schreiben die Autoren.

Die Vorspannung baut sich auf. Wenn Frauen etwas schlechtere Leistungsbeurteilungen erhalten, ist es weniger wahrscheinlich, dass sie Erhöhungen und Beförderungen erhalten als ihre männlichen Kollegen, und der Zyklus wiederholt sich, da immer weniger Frauen es auf die höchsten Ebenen schaffen, insbesondere in von Männern dominierten Branchen. Dies an sich bestärkt die Auffassung, dass Männer eher brillant und würdig für jene Machtpositionen sind, die die ursprünglichen Stereotypen befeuern. Und herum und herum gehen wir.

Hier ist eine wichtige Einschränkung: Die Forscher betonen, dass die Sechs-Punkte-Skala zwar die geschlechtsspezifische Kluft bei den Bewertungen beseitigt, die geschlechtsspezifischen Vorurteile jedoch nicht auf magische Weise beseitigt hat. Die neue Skala hat lediglich geändert, inwieweit das Tool vorhandene Verzerrungen widerspiegelt. Die Teilnehmer der zweiten Studie verwendeten immer noch viel häufiger Superlative, um „John“ zu beschreiben, als „Julie“, wenn sie „die Worte teilten, die ihnen zuerst in den Sinn kamen, als sie an die Unterrichtsleistung des Lehrers dachten“. Es ist nur so, dass sich diese Unterschiede weniger wahrscheinlich in den numerischen Bewertungen widerspiegeln.

Während das Ändern einer Skala an der Oberfläche und auf kurze Sicht hilfreich sein könnte, bleibt noch viel zu tun, um die Welt von der zugrunde liegenden Tendenz zu befreien – und es ist noch ein langer Weg bis zu unseren Geschichten über Brillanz in jedem Feldstern Frauen in den Hauptrollen genauso oft wie Männer.