Zensuren und Sitzenbleiben

Gepostet von

„Lehrer und Noten – Warum Zensuren an Schulen nicht gerecht sein können“ (SPIEGEL ONLINE, 01.02.2019

Sitzenbleiben hat natürlich mit Zensuren zu tun. Um es vorweg zu sagen: Es gibt keine objektiven Zensuren, die als verlässliche Indikatoren für die Leistungsfähigkeit eines Schülers in einem Fach gelten können.

Hier ein paar Begründungen:

(Diese Probleme und Fehler bei der Notengebung sind in der schulpädagogischen Literatur oft und seit Jahrzehnten beschrieben worden. Deshalb nur ein exemplarischer Verweis auf die Veröffentlichung von Karlheinz Ingenkamp: Die Fragwürdigkeit der Zensurengebung. Texte und Untersuchungsberichte. Zusammengestellt und kommentiert von Karlheinz Ingenkamp. 9.Auflage 1995. Beltz Verlag, Weinheim und Basel)

Lehrer und Schüler finden keinen Draht zueinander.

Es fängt schon bei der Vermittlung der Unterrichtsinhalte und -ziele an. Wer hat nicht am eigenen Leib erfahren oder bei seinen Mitschülern, seinen Kindern, im Freundes- oder Verwandtenkreis hören können: „Seit unser Kind einen anderen Mathematiklehrer hat, sind seine Zensuren deutlich besser (oder schlechter) geworden.“
Das gibt es in der Tat. Das mag mit Sympathie oder Antipathie zu tun haben; es gibt Fälle, in denen die Chemie zwischen Kind und Lehrer einfach nicht stimmt. Es kann aber auch an der persönlichen Unterrichtsmethode des Lehrers liegen: Manche Kinder brauchen die Anschauung, anderen ist das gesprochene Wort, das Gehörte, wichtig. Einige können gut mit Texten lernen, andere lernen mit einem Diagramm oder einer Grafik besser.
Es ist einfach wahr: Kinder lernen auf ganz verschiedene Weisen, daher ist die Individualisierung in vielen Schulgesetzen verankert. Und wenn der Lehrer nur einen Weg wählt, entscheidet er auch über den individuellen Lernerfolg seiner Schüler.
Auch der Einsatz von Anerkennung, Zuspruch, Anregung und Ermutigung wirkt sich positiv auf die Leistung aus, während Häme, Ironie und Geringschätzung sie hemmen.

Es gibt auch Lehrer, die in ihrem Beruf wenig leisten (können).

Nicht zu vergessen: Manche Lehrer sind einfach nicht gut genug, um effektiv zu unterrichten. Was die Lernschwachen unter den Schülern sind, sind die Wanderpokale unter den Lehrern, die von Klasse zu Klasse oder gar von Schule zu Schule wechseln. Manche von ihnen können weder gut unterrichten noch gut Leistungen beurteilen.
In manchen Zeiten haben diese Lehrer die Zweite Staatsprüfung bestanden, weil der Lehrermangel groß war. – Für alle Beteiligten – Schüler, Eltern, Kollegen und Vorgesetzte – wäre es besser gewesen, wenn sie nicht bestanden hätten, ihre Leistung also ehrlicher bewertet worden wäre.

Subjektivität in den Anforderungen

Milde und Strenge bei Anforderungen und Zensierung

Dieses Problem steht in unmittelbarem Zusammenhang mit dem Anspruchsniveau des jeweiligen Lehrers. Mancher neigt zu einer unangemessen strengen, ein anderer zu einer unangemessen milden Weise, Schülerleistungen zu bewerten. Letzteres kommt nach der Erfahrung des Autors dieses Posts zum Beispiel dann vor, wenn man meint, dem Prüfling unter Umständen die Chance auf einen Ausbildungsplatz zu verbauen. Oder bei Lehramtsprüfungen in Zeiten der Lehrerarbeitslosigkeit, mit einer schlechten Zensur dem Kandidaten die Aussicht auf einen Arbeitsplatz zu nehmen. In beiden Fällen lügt man sich hier „etwas in die Tasche“, weil durch die bessere Note weder ein Ausbildungsplatz noch eine Lehrerstelle entsteht.
Umgekehrt gibt es streng zensierende Lehrer, zum Beispiel in Gymnasien, die auf diese Weise dokumentieren wollen, dass ein viel zu großer Teil der Schülerschaft in dieser Schulform unterrichtet wird: „Der N. N. gehört nicht aufs Gymnasium!“

Es sind ausgerechnet die in ihrem Fach guten Lehrer, also der Musiklehrer, der besonders gut in Musik, der Mathematiklehrer, der besonders gut in Mathematik ist, die ihre Schüler systematisch überfordern. Sie haben die Erfahrungen des schwachen Schülers in ihrem Fach nicht gemacht und setzen intuitiv voraus, dass es doch kein Problem sein könne, die Summe der Innenwinkel im Dreieck zu beweisen oder rasch die Töne aufzuzählen, die einen B-Dur-Akkord ausmachen.

In verschiedenen Fächern wird mit unterschiedlicher Strenge zensiert, die Strenge nimmt mit der Bedeutung des Faches in der Stundentafel zu, “stark selektive Hauptfächer” haben die strengste Notengebung.

Oelkers, Jürgen: Leistungsbeurteilung als Problem und Chance der Schulentwicklung. Vortrag anlässlich der Fortbildungstagung des Freien Gymnasiums Zürich in der Kartause Ittigen am 30. April 2001

Subjektive Kriterien in allen Fächern

Das Anforderungsniveau in der Benotung wechselt: Da gibt es den Test, in dem 30 Punkte zu erreichen sind. Manche Lehrer vergeben ein „Sehr gut“ nur beim Erreichen von 30, andere schon bei 29 oder nur 28 Punkten. Manche Lehrer setzen die Grenze zwischen ausreichend und mangelhaft bei der Hälfte der maximal erreichbaren Punktzahl an, andere haben andere Vorstellungen von dem, was noch ausreichend ist. (Wieder andere legen die Grenze erst nach der ersten Durchsicht fest, um eine Häufung von guten oder schlechten Noten zu vermeiden. Es gab Zeiten, und in manchen Bundesländern gibt es sie noch heute, in denen eine Häufung von schlechten Noten zur Wiederholung der Klassenarbeit oder zur Vorlage beim Schulleiter führen konnten. Das wollten Lehrer in der Regel vermeiden.) – Schulen und ihre Fachkonferenzen sind gehalten, zumindest auf der Ebene der Einzelschule zu Absprachen zu kommen, wie solche Maßstäbe angelegt werden.
Auf der Ebene eines ganzen Bundeslandes, in Hamburg, hat es im Jahre 2017 einen denkwürdigen Vorgang gegeben: Als in einer Probeklausur im Fach Mathematik zur Vorbereitung auf ein bundeseinheitliches Zentralabitur die Noten im Schnitt nur bei 3,9 lagen, ordnete der Schulsenator Ties Rabe die Anhebung der Noten um eine Notenstufe an.

Zwar schon länger her, aber noch immer interessant: Robert Ulshöfer berichtete 1949 von einem Reifeprüfungsaufsatz, der im Fach Deutsch von 42 Lehrern beurteilt wurde; alle Noten von „sehr gut“ bis „ungenügend“ waren vertreten. (Quelle: Klaus Ingenkamp, s. o.)

Auch in dem Fach, in dem man meint, es gehe eindeutig mit „richtig“ oder „falsch“ objektiv zu, in Mathematik, wird subjektiv beurteilt.

Eine deutsche Studie zeigte, dass einige Mathematiklehrkräfte von den Fehlern, andere von den richtigen Lösungen ausgingen, um zur Zensur zu gelangen. Die Ansichten über die Bewertung von Faktoren wie Sauberkeit, Schrift, formal-mechanischem Rechnen im Vergleich zum Finden des Lösungsansatzes oder zum mathematischen Denken variierten erheblich.

vgl. Haecker, H. (1971): Subjektive Faktoren im Leistungsurteil der Lehrer. In: Schule und Psychologie, 18 Jg., 74-84; zit. nach Oelker 2001, a. a. O.


1971 befragte Haecker 64 Lehrer, welche Kriterien der Bewertung ihnen wichtig seien. Das Ergebnis war unterschiedlich. Während einige besonders Wert auf Sauberkeit und Schrift legten, war anderen das formal- mechanische Rechnen, das Finden des Lösungsansatzes oder das mathematische Denken wichtig.

vgl. Herzberg, Konstanze: Leistung und Leistungsbewertung in der Grundschule, München, GRIN Verlag, 1999
https://www.hausarbeiten.de/document/4762

Nehmen wir an, beim Lösen einer Aufgabe sind 4 Punkte zu erreichen; der Schüler verrechnet sich, indem er an einer Stelle subtrahiert, an der er hätte addieren müssen. – Wie viele Punkte werden abgezogen? Einer, weil der Fehler nur ein Versehen ist, oder weil bis auf diesen unbedeutenden Aussetzer der komplexe Lösungsweg richtig ist? Oder alle vier, weil die Lösung eben falsch ist? Natürlich kann ein Lehrer dies vorher festlegen und damit sicherstellen, dass er an dieser Stelle alle Schüler der Lerngruppe gleich behandelt, aber die Auswirkung auf das Gesamtergebnis eines Schülers kann erheblich sein. Die Entscheidung des Lehrers schreibt der Aufgabe und dem durch sie repräsentierten Inhalt einen subjektiv festgelegten Wert im Gesamtgefüge des Faches und der Leistungsbeurteilung zu.

Unterstellt wird die Vergleichbarkeit der Notengebung an allen Orten, während die tatsächlichen Bewertungen von Schule zu Schule und von Fach zu Fach variieren, zum Teil erheblich und nicht selten ärgerlich.


Oelkers 2001, a. a. O.

Fehler in der Notengebung

Der Hofeffekt (oder auch Haloeffekt)

Dieser Effekt ist nach dem Phänomen benannt, dass man aus der Optik kennt: Eine Lichtquelle überstrahlt – mehr oder weniger – ihre Umgebung, Dass der Mond einen „Hof“ hat, hört man häufig, aber auch die Scheinwerfer des entgegen kommenden Autos überstrahlen die weniger hellen Stellen in ihrer Umgebung. Wer in der Dunkelheit beim Abendspaziergang dem Jogger mit Stirnlampe begegnet, kann sein Gesicht vielleicht nicht erkennen, weil es vom „Hof“ des Lampenscheins überlagert ist.

Da unterrichtet zum Beispiel ein Lehrer in der 7 b das Fach Mathematik, in dem Marie besonders gut ist. Nun wird die Physiklehrerin versetzt und der Mathematiklehrer bekommt die 7 b auch in Physik dazu. Die Chancen für Marie stehen damit gut, auch in Physik gut bewertet zu werden, selbst wenn ihre Leistungen hier schwächer als in Mathematik sind.
Es können aber auch ganz andere Vorinformationen sein, die den „Hof“ ausmachen: Lehrer bewerten dieselbe schriftliche Leistung mit signifikanter Wahrscheinlichkeit besser, wenn die Vorinformation über den Schüler lautet, er sei ein guter Schüler, als bei dem, von dem es heißt, er sei ein schwacher Schüler.

Zensuren sind von verschiedenen Faktoren abhängig. Eine Untersuchung von Weiss (1964) ergab, dass die Notengebung von Erwartungen und Vorurteilen abhängig ist. Bei der Untersuchung wurden Lehrern zwei Aufsätze gegeben. Einem Aufsatz teilte man einen positiv auffallenden Schüler, dem anderen Aufsatz einen negativ auffallenden Schüler zu. Dies geschah ganz wahllos. Das Ergebnis war eindeutig. Der “gute” Schüler erhielt immer eine bessere Beurteilung.

vgl. Herzberg 1999, a. a. O.

Vermeidung von extremen Noten (sehr gut/ungenügend)

In der Statistik fällt auf, dass Lehrer dazu neigen, die extremen Zensuren zu vermeiden. Die Motive mögen unterschiedlich sein, zum Beispiel ist es nicht unwahrscheinlich, dass Mitleid bei der Vermeidung von „ungenügend“ eine Rolle spielt; bei wirklich oder vermeintlich häufigem „sehr gut“ kann es die Sorge vor Rechtfertigungsdruck von Seiten der Fachkollegen sein, die den Beurteiler zögern lässt. Die schulfachliche Unsicherheit kann ein weiterer Grund für die Vermeidung von Extremnoten sein.

Der Autor dieses Posts hat in unzähligen Prüfungsausschüssen mitgearbeitet, in denen Studenten, Lehrer oder Schüler geprüft wurden. Die unterschiedlichen Wahrnehmungen von der Leistung des Prüflings führten oft zu Verhandlungen über die Leistungsnote, deren Ergebnis wegen deutlich unterschiedlicher Positionen ein Kompromiss waren – und damit eher zum Mittelfeld der Zensurenskala tendierten.

Einfluss der Reihenfolge

Auch hier lehren Fachliteratur und Erfahrung, dass der Platz in der Reihenfolge der mündlichen Prüfungen wie auch in der Bewertung der schriftlichen Arbeiten nicht unwichtig ist. Eine besonders gute Leistung zu Beginn weckt beim Beurteiler Erwartungen, die Nachfolger nicht erfüllen; und umgekehrt ist die schwache Leistung zu Beginn eine Folie, vor der die nachfolgenden glänzen können.
Es entwickelt sich ein klasseninternes Bezugssystem, das die Vergleichbarkeit mit anderen Klassen oder Schulen erschwert.

Coffman zieht ein Fazit:

– Verschiedene Beurteiler neigen dazu, demselben Aufsatz verschiedene Noten zu geben
– Der einzelne Beurteiler neigt dazu, für denselben Aufsatz zu verschiedenen Zeiten unterschiedliche Zensuren zu geben
– Die Differenzen werden um so größer, je mehr Freiheit das Thema erlaubt

vgl. Coffman, W. E., & Kurfman, D. (1968). A comparison of two methods of reading essay examinations.American Educational Research Journal, 5, 99–107; zit. nach Ingenkamp 1995, S. 69 ff

Sachfremde Erwägungen

Natürlich gibt es sachfremde Erwägungen bei der Bewertung von Leistungen, auch solche, die bewusst eingesetzt werden. Bei der Besetzung von Beamtenstellen spielt die dienstliche Beurteilung eine entscheidende Rolle. Urteile von Verwaltungsgerichten zu diesen Beurteilungen zeigen auf, dass manche Bewertung den anzulegenden Kriterien nicht standhält. Mögliche Motive sind etwa die Umgehung von Vorgaben, dass bei gleicher Leistung eine Frau oder ein Schwerbehinderter zu bevorzugen sei, stattdessen aber der gewünschte männliche Bewerber die Stelle bekommen sollte. Ein weiteres Motiv mag die Unterstützung einer politisch motivierten Präferenz durch eine besonders gute Leistungsnote sein.

Auch die Vergabe von Zensuren an Schüler kann von der Schulaufsicht oder vom Verwaltungsgericht auf Fehler überprüft werden. Das Gericht kann allerdings nur formale und grobe Verstöße feststellen; die eigentlich schulfachliche Bewertung unterliegt nicht seinen Kompetenzen. Die Schulaufsicht kann schulfachlich allerdings tätig werden und eine Leistungsnote gegebenenfalls ändern.

Im Schulbereich ist eine solche sachfremde Erwägung sicherlich die Sorge mancher Lehrkraft, bei einer negativen Bewertung Konflikte mit Eltern durchstehen zu müssen, beispielsweise bei der Schulformempfehlung nach der Grundschule. Auch die Angst vor einem Widerspruch, einer Überprüfung durch die Schulaufsicht oder gar dem Verwaltungsgericht ist ein nicht auszuschließendes Motiv für wohlwollende Beurteilungen von Kindern, die nicht durch ihre Leistungen gedeckt sind.

Fazit

Sicher ist seit dem ersten Erscheinen von Ingenkamps Buch einiges geschehen, um die aufgezeigten Fehlerquellen bewusst zu machen. Dennoch: Die Anforderungen, die Auswahl der Prüfungsaufgaben, die angewandte Methode zur Leistungsermittlung und dann zur Leistungsbewertung, die Vielzahl von Prüfungen und Klausuren, die Sorge vor einer Anfechtung der Note oder auch nur vor einem Konflikt mit den Eltern des Kindes mit schlechter Note – alles das zeigt, dass die Zensuren nicht immer eine verlässliche Basis für eine so einschneidende Maßnahme wie eine Nichtversetzung sind.