BdWi - Bund demokratischer Wissenschaftlerinnen und Wissenschaftler

»Wissenschaft ist also ein prinzipielles Gegen-den-Strom-Schwimmen.«

Klaus Holzkamp

Newsletter abonnierenKontaktSuchenSitemapImpressum
BdWi
BdWi-Verlag
Forum Wissenschaft

Soziale Selektion oder Förderung?

15.05.2005: Was Evaluation zur schulischen Bildungsreform beitragen kann

  
 

Forum Wissenschaft 2/2005

Die deutsche Schule schafft es nicht, Schülerinnen und Schülern mit schlechten Startchancen die Kompetenzen zu vermitteln, die als Fundament für ein chancenreiches Leben gelten können. Der Schulerfolg der Kinder ist in extremem Maße von ihrer sozialen Herkunft abhängig. Und gleichzeitig gehört Deutschland zu den "underperforming countries" mit schlechten empirischen Ergebnissen in internationalen Schulleistungstest. Wolfgang Böttcher und Michaela Brohm analysieren Eingriffsmöglichkeiten und beschreiben, wie schlecht es derzeit mit Schulevaluation steht - aber auch, wie sie, sinnvoll konzipiert und realisiert, zur Minderung des Grundübels schulischer Bildung beitragen könnte.

PISA hat nicht nur die genannten skandalösen Tatbestände dokumentiert; die internationale Vergleichsstudie hat auch klar demonstriert, dass es möglich ist, gute Ergebnisse zu erreichen und gleichzeitig diejenigen zu fördern, die aus bildungsfernen Elternhäusern kommen. Es scheint, als reagiere die Bildungspolitik auf die Befunde. Soziale Auslese und der insgesamt mittelmäßige Leistungsstand deutscher Schüler1 führen seit einiger Zeit zu bildungsreformerischen Aufschwüngen, die getragen werden von dem Gedanken, das veraltete System der Steuerung des deutschen Schulwesens in eine "Outputsteuerung" zu überführen. Dieses - aus unserer Sicht - überfällige Vorhaben ist freilich höchst anspruchs- und voraussetzungsvoll. Wird das missachtet, droht eine Verschärfung der Situation. Wir wollen dies an einem Beispiel, der Evaluation, skizzieren.

Ergebnisorientierung

Wenn Schulen bzw. das Schulsystem in der Zukunft über Ergebnisse gesteuert werden sollen,2 dann liegt dieser Rede die Vorstellung zugrunde, Systeme ließen sich mit einem "Input-Prozess-Output"-Modell fassen: Systeme benötigen Ressourcen (Personal, Zeit, Rohstoffe, Technologien), um in Arbeitsprozessen Ergebnisse (Produkte, Dienstleistungen) zu "produzieren". Dieses Modell vermag auf durchaus elegante Weise zwischen grundsätzlichen Maximen der Steuerung zu unterscheiden und prinzipielle Defizite von Systemen auszuleuchten. Es hilft zu verdeutlichen, dass beim Management des mit gesellschaftlichen Kernaufgaben betrauten Unternehmens (Allgemeinbildende) Schule bislang im Bereich der Prozesse nur wenige - zudem die professionelle Arbeit eher behindernde - Instrumente zum Tragen kamen (z.B. Klassenbildungserlasse, Stundentafeln) und im Bereich der Ergebnisse (sieht man vom wenig steuerungsfähigen Instrument der in manchen Bundesländern angewandten zentralen Anschlussprüfungen ab) auf systematische Einflussnahme vollständig verzichtet wurde. Selbst im Bereich der Inputs kann man nur unter Vorbehalten von Steuerung sprechen: Es wurde gehofft, akademisch ausgebildete Beamte in ordentlichen Schulgebäuden und Klassenzimmern, ausgestattet mit Vorgaben durch Lehrpläne und Erlasse, seien in der Lage, Kinder und Jugendliche zu bilden, zu erziehen und zu beraten. Dieses "Hoffnungs-Paradigma" wird nunmehr mit dem "Output-Paradigma" konfrontiert. Schließlich liegt es nicht so fern, ein kostspieliges und aufwändiges System, das seine Berechtigung aus der Tatsache ableitet, dass es Aufgaben übernehmen soll, die in der komplexen Gesellschaft ansonsten nicht gemeistert werden könnten, auch daran zu messen, ob es erwartete Ergebnisse auch erzielt hat.

Wenigstens zwei Probleme, die sich hieraus ergeben, sollen kurz genannt werden. Erstens verführt das unterkomplexe Modell dazu, reale Probleme der Steuerung und die Praxis des Wandels eines so großen wie traditionsverhafteten Systems von der Input- zur Outputsteuerung zu unterschätzen. Der Blick auf drei grobe Dimensionen lässt leicht übersehen, dass sich soziale Systeme durch Individuen - mit Neigungen, Wünschen, Sturheiten, Ängsten etc. - und ihren komplexen Interdependenzen konstituieren und dass die Einheiten oder Ebenen in manchen Systemen (z.B. Abteilungen untereinander oder Leitungs- und ausführende Ebene) nur locker miteinander in Beziehung stehen.3 Das schematische Modell suggeriert aber eine schlichte und mechanische Steuerungsmöglichkeit. Zweitens drängt sich uns der Eindruck auf, dass die selbst diesem schlichten Modell inhärente Komplexität unterschätzt wird. Im Modell der Outputorientierung fällt der Blick darauf, was die Organisation "erzeugt" oder "bewirkt". Ergebnisse sind aber nicht unabhängig von Inputs (Ressourcen wie Zeit oder Lehrmaterial z.B.) und Prozessen (z.B. Nutzung von Medien, Übersetzung von Bildungsstandards in Unterricht oder Einsatz von Lehrmethoden). Outputsteuerung will sichern, dass vorab definierte und erwünschte Ergebnisse erreicht werden. Bei negativer Bilanz im Vergleich von Soll und Ist wird die Steuerung in Inputs oder Prozesse eingreifen müssen. Outputsteuerung ist demnach die konsequenzenhaltige Analyse von Ergebnissen, die sich an vorab definierten Ergebnisstandards messen lassen müssen. Nicht auszuschließen ist auch, dass die Ergebnisstandards einer Kritik zu unterziehen sind. Wenn wir weiterhin bedenken, dass Ergebnisse nicht komplikationslos messbar sind, wird deutlich, dass Outputsteuerung aufwändige wissenschaftliche Analysen und Bewertungen voraussetzt, die konkrete Hinweise dafür beibringen müssen, an welcher Stelle bzw. welchen Stellen im System zu intervenieren ist. Wir befassen uns im folgenden Absatz zunächst mit einem herausragenden Element der Ergebnissteuerung.

Bildungsstandards

Eine grundlegende Voraussetzung ergebnisorientierter Steuerung ist die Formulierung von intendierten Ergebnissen. Im Feld der Bildung reden wir aktuell von Bildungsstandards,4 die Erwartungen an Kenntnisse und Fähigkeiten der Schüler aufgrund schulischer Interventionen beschreiben. Wenn Bildungsstandards fachliche Kernaufträge der Schule benennen, lassen sich Schulpolitik und ihre Steuerungsinstrumente sowie schulische und unterrichtliche Aktivitäten auf sie ausrichten. Angesichts der PISA-Befunde könnte es nahe liegen, Schule auf ihren grundgesetzlichen Auftrag zu verpflichten, den ihr möglichen Beitrag zur Reduktion von Ungleichheit zu realisieren.5

Mit den Bildungsstandards erhalten also Inputinstrumente in einem System der Outputsteuerung eine große Bedeutung. Die Protagonisten von Bildungsstandards betonen, diese würden nicht in die Prozessebene eingreifen. Diese Aussage stimmt insofern, als sie vernünftigerweise keine Vorschriften für die Prozessebene beinhalten. Aber im Paradigma einer Neuen Steuerung sind Bildungsstandards sehr wohl prozessrelevant. Sollte sich nämlich erweisen, dass Standards nicht erreicht werden, ergibt sich die Frage, welche Rolle der Prozessebene dabei zukommt. Erweist sich die pädagogisch-didaktische Prozessgestaltung einer Schule als wesentlicher Grund für unterschrittene Ergebniserwartungen, wird eine ernst zunehmende Outputsteuerung selbstverständlich dort eingreifen. Erweisen sich mangelhafte oder fehlende Ressourcen als Grund, müsste dort interveniert werden.6 Wir haben das Prinzip oben erläutert. Man sieht, dass Ergebnissteuerung nicht "nur" Ergebnisse dokumentieren, sondern auch Zusammenhänge aufdecken muss. Sie ist auf wissenschaftliche Forschung angewiesen.

Damit aber Pädagogik die Wirksamkeit ihres Handelns belegen kann, sollten Bildungsstandards bestimmte Charakteristika aufweisen.7 Insbesondere sollten sie Anforderungen konkret und überprüfbar beschreiben. Standards, die Unklarheit darüber lassen, was genau gelernt werden soll und wie ermittelt werden kann, wo ein Schüler tatsächlich steht, sind in Bezug auf das Vorhaben, Bildung zu steuern, "schwach".

"Starke" Standards sind neben Klarheit und Messbarkeit u.a. auch dadurch gekennzeichnet, dass sie formulieren, was alle (!) Schüler mindestens erreichen müssen. Dieses Merkmal kann sichern, dass die deutsche Schule nicht "ungeschoren" davon kommt, wenn sie mehr als 20% der Schüler mit Kompetenzen entlässt, die sie von Lebenschancen abschneiden.

Die Bildungsstandards, auf die die KMK sich geeinigt hat, erfüllen aus unserer Sicht diese Mindestkriterien nicht: Sie sind unklar und lassen nicht erkennen, wie Lehrer ihr Erreichen messen sollen. Durch Musteraufgaben, entwickelt im neu gegründeten Institut zur Qualitätsentwicklung im Bildungswesen (IQB), soll versucht werden, diese Mängel auszugleichen und Lehrer zu orientieren.8 Die Standards sind zudem als Regelstandards formuliert. Sie gehen also davon aus, dass lediglich ein - wie auch immer zu definierender - Durchschnitt der Schüler sie erreicht. Sie legitimieren als normal, wenn Schüler an ihnen scheitern. Solche Standards sind auf Selektion programmiert.

Evaluation und Evidenz

Das Instrument, Evidenzen für schulische Wirksamkeit zu ermitteln, ist Evaluation. Sie befasst sich forschungsbasiert mit der Analyse und Bewertung von Maßnahmen und Interventionen und sie gibt Anstöße, wie diese in der jeweils nächsten Durchführungsrunde zu verbessern sind. Sie hat, verstanden als Teilbereich eines Qualitätsmanagements, die Aufgabe, Prozesse zu verbessern; die Organisationen sollen sich also entwickeln. Betrachten wir bildhaft Qualitätsentwicklung als spiralförmig emporstrebenden Prozess, so könnten Evaluationsergebnisse als Anstoß für die jeweils nächste Spiralrunde verstanden werden.

Evaluation prüft, was wirkt und warum und was verbessert werden kann. Neben ihrer Erkenntnis- und Entwicklungsfunktion haben Evaluationen immer auch eine gewisse Kontrollfunktion. Gerade auch diese Tatsache erfordert Ernsthaftigkeit und Korrektheit des Verfahrens. Schließlich dienen sie in aller Regel auch der Legitimierung von Entscheidungen. Auch das ist nicht negativ, wenn die vier Funktionen in einem gewissen Gleichgewicht sind. Überwiegen jedoch die beiden letztgenannten Funktionen, droht das Instrument zerstört zu werden.

Wir verstehen Evaluation als Teilbereich der empirischen Sozialforschung, welcher, soll er Wirksamkeitsforschung im hier verstandenen Sinne sein, charakteristischen Kriterien genügen muss. Neben der Achtung einer spezifischen Wissenschaftsethik (Distanz zum Forschungsgegenstand, Schutz der Betroffenen, Wertfreiheit usw.) ist es besonders essenziell, im Vorfeld der Evaluation die bisher geleistete Grundlagenforschung in den Blick zu nehmen. Zudem verpflichten sich Evaluatoren darauf, die Gütekriterien der empirischen Sozialforschung, wie etwa Objektivität, Transparenz der Dokumentation, Gültigkeit (Validität) und Zuverlässigkeit der Befunde (Reliabilität) zu berücksichtigen. Diese Kriterien gelten unabhängig davon, ob Evaluatoren bei der Organisation beschäftigt sind, die sie bewerten, oder ob es sich um Externe handelt. Sie gelten auch unabhängig davon, ob sich Evaluationen (eher) auf Organisationsprozesse oder (eher) auf Organisationsergebnisse beziehen.9

Die Gütekriterien werden in der empirischen Sozialforschung durch komplexe Forschungsdesigns gesichert. So könnten sich beispielsweise die Evaluatoren eines Programms für ein experimentelles, dreistufiges Design mit Effektivitätsprüfung durch verschiedene Erhebungsarten entscheiden: Die Untersuchungsstichprobe setzt sich dann aus zwei Versuchsgruppen mit unterschiedlichen Versuchsanordnungen und einer Kontrollgruppe zusammen. Dem "präaktionalen Test" vor der Durchführung des zu bewertenden Programms folgt die Durchführung des zu evaluierenden Programms, und diesem wiederum der "postaktionale Test". Eine zweite Experimentalgruppe erhält ein anderes "Treatment". Die Messungen erfolgen entsprechend der ersten Experimentalgruppe. Eine dritte Gruppe (Kontrollgruppe) erhält kein Treatment, wird aber ebenfalls zu den gleichen Zeitpunkten gemessen, um bei der Beurteilung der Wirksamkeit Störfaktoren wie etwa entwicklungspsychologisch bedingte Veränderungen im Interventionszeitraum ausschließen zu können. Das ganze Programm basiert auf einem Kontrollgruppenplan mit zweifacher Treatmentanordnung. So kann eher angenommen werden, dass bestehende Unterschiede zwischen Experimental- und Kontrollgruppe für einen Treatment-Effekt sprechen. Zeichnen sich in der/den Experimentalgruppen andere Veränderungen als in der Kontrollgruppe ab, ist dieses aber immer noch kein "sicherer Beleg für die kausale Wirksamkeit des Treatments".10 Es könnte sein, dass der Effekt auf andere Einflussfaktoren zurückzuführen ist (z.B. Leistungsstärke der untersuchten Gruppe, andere Zusammensetzung Mädchen/Jungen im Vergleich zur Kontrollgruppe). Daher sind Experimental- und Kontrollgruppen in ihrer Zusammensetzung möglichst ähnlich zu wählen. Zudem werden zur Datenerhebung verschiedene Instrumente und Methoden eingesetzt: Neben Fragebögen zur Selbsteinschätzung können etwa Interviews im Umfeld der Testpersonen (peer-group-review), Tests, Videosamples und teilnehmende Beobachtungen eingesetzt werden.

Man mag solche Designs für allzu puristisch halten und für weniger anspruchsvolle Evaluationen von pädagogischen Interventionen plädieren. Man muss dann aber belegen, dass die Ergebnisse solcher Analysen das Niveau aufweisen, das es rechtfertigt, auf ihrer Grundlage Entscheidungen zu treffen, zu unterlassen oder zu modifizieren. So oder so: Sachgerechte Evaluationen durchzuführen ist ein anspruchsvolles Unterfangen, das tiefgreifende Methodenkenntnis und aufwändige personelle und zeitliche Ressourcen in Anspruch nimmt.

Sollen Bildungsstandards nunmehr in allen Bundesländern die Grundlage für die pädagogische Arbeit in den Klassenzimmern sein, so werden Evaluationen zum Mittel der Wahl, wenn es um Belege für Prozesse und Leistungen der Schule geht. Schulische Qualität, was auch immer das genau meint, soll zukünftig regelmäßig überprüft werden. Sehen wir uns, um ein Beispiel zu nennen, den Entwurf zum neuen hessischen Schulgesetz an: In einem Satz, der dem § 88 des alten Gesetzes beigefügt werden soll, heißt es lapidar, der Schulleiter habe für die innere Evaluation zu sorgen. Hessische Schulen müssen sich auch, so lesen wir im neuen § 98, einer nicht weiter definierten externen Evaluation stellen und an ihr mitwirken. Im nordrhein-westfälischen Erlass zur Schulprogrammarbeit und internen Evaluation11 heißt die Anforderung, die interne Evaluation der Schule solle die "Mindeststandards für Selbstevaluation" berücksichtigen. Zusätzlich zur internen Evaluation plant Nordrhein-Westfalen flächendeckende Schulinspektionen nach internationalem Vorbild. Weiter heißt es: "Die Schule führt neben den Parallelarbeiten (…) in jedem Schuljahr mindestens eine auf einen bedeutsamen Entwicklungsschwerpunkt der Schule bezogene Evaluationsmaßnahme durch, die sich auf den Unterricht oder die Erziehungsarbeit der Schule bezieht. (…) Die Schulen legen zum 31.12.2004 der zuständigen Schulaufsichtsbehörde ihr Schulprogramm zusammen mit einem Bericht über die Schulprogrammarbeit und Evaluation vor".12 In allen Bundesländern werden zentrale Prüfungen z.B. mittels standardisierter Tests vorbereitet oder eingeführt.

Gerade wenn man die Absicht teilt, Schulen aus Innen- und Außenperspektive zu beobachten und systematisch zu verbessern und eine Vergleichbarkeit der Arbeitsergebnisse zu sichern, wird man fragen müssen, wie die Schulen eine interne Evaluation methodologisch bewerkstelligen sollen, wer die Kompetenzen und wer die Zeit hat oder auf welche bisherigen Aktivitäten verzichtet werden soll. Gleichermaßen unreif sind bislang Verfahren der externen Evaluation. Sicherlich können Tests eine Rolle spielen, aber welche? Was weiß die Politik über Effekte von Tests? Was über die Entwicklung von Schulinspektion als sozialen Prozess?

Es handelt sich allesamt um bedeutende Interventionen in ein komplexes System, die ohne systematische Analyse bisheriger Forschung - und dann noch in der Regel großflächig - durchgeführt werden sollen. Wo sind die Evidenzen dafür, dass Inspektion und Testmarathons die Schule verbessern? Die Bedeutung der hoch selektiven gegliederten Schulstruktur ist allemal besser belegt als die Effekte der aktuellen Vorhaben. Sicher : Politik und Verwaltung können heute auf vielfältige Aktivitäten verweisen, aber Aktionismus ist in der Regel eher ein Ausdruck für einen Mangel an Sorgfalt. Das muss insbesondere auch darum überraschen, weil man aus den Erfahrungen der Staaten lernen könnte, die ihre Systeme schon vor 10 oder mehr Jahren reformiert haben.

Man könnte sich zum Beispiel an Konzepten schulinterner Evaluation orientieren, die in englischen Schulen gewonnen wurden.13 Hier sieht man, wie Evaluationen von externen Profis gemeinsam mit Lehrerinnen und Lehrern entwickelt werden können, um z.B. sowohl Partizipation als auch den Sachverstand zu sichern, der nötig ist, die Komplexität der sozialen Organisation Schule im Sinne pädagogischer Ziele wie z.B. der Förderung benachteiligter Schüler zu verändern. Strategisch betrachtet sind in komplexem und relativ unbekanntem Gelände Pilotversuche und zeitlich begrenzte Modelle besser geeignet als schwer revidierbare Globalinstrumente.

"Evidenz"?

Es kann nicht ausreichen, die Lehrenden ohne Kenntnisse der empirischen Schulforschung mit ihren Schülern gemeinsam die Qualitätsindikatoren von Unterricht und Schule entwickeln zu lassen. Wirksamer Unterricht deckt sich nicht unbedingt mit dem, was sie unter "gutem" Unterricht verstehen. Die Bedeutung einzelner Elemente des Unterrichts kann nicht mit Punktekleben an der Moderationswand ermittelt werden. Es genügt nicht, Lehrer und Schüler Fragebögen erstellen zu lassen, die empirischen Standards nicht genügen. An sich kann das alles durchaus sinnvoll sein, aber es ist keine Evaluation. Punktekleben an der Moderationswand ist Punktekleben, ein Fragebogen ist ein Fragebogen. Mehr nicht.

Die Definition dessen, was schulische Qualität ist und wie sie evaluiert wird, kann nicht der Einzelschule allein überlassen werden. Schließlich muss gesichert sein, dass die Schule auch dort evaluiert, wo es "weh tut". Dazu gehören "die gröbsten Abweichungen vom Lehrplan, offenkundiges Versagen von Lehrpersonen, auffällige Störungen eines ordentlichen Schulbetriebs oder die gröbsten Verstöße gegen das Chancengleichheitspostulat".14 Weitere messbare Indikatoren sind Unterrichtsausfall, Lehrerfehlzeiten, die Zahl der Nichtversetzungen auf den einzelnen Klassenstufen, Lehrerfortbildungsmaßnahmen, Schulwechsel, Übergang zu höheren Schulen, Berufseintrittsquoten nach Schulabschluss usw.15

Insbesondere misst sich Schulqualität aber an der Unterrichtswirkung, also der Lernleistung der Schüler. Wie hoch der Anteil an Wirksamkeitsrecherche ist, wenn Schulen nicht hierauf verpflichtet werden, ist im Fall von Selbstevaluation fraglich. Es mag interessant sein, nach dem Schulklima, dem Vorhandensein innovativer Unterrichtsformen, besonderer Ausstattung usw. zu forschen. Letztlich geht es aber darum herausfinden, was solche Merkmale zu den Bildungs- und Aneignungsprozessen beitragen.

Dies führt uns kurz zu den Bildungsstandards zurück. Die Effekte "schwacher" Standards sind nicht nur, dass Lehrer Materialien "nach Lust und Laune" verwenden und somit nicht mehr garantiert ist, dass alle Kinder mit einem Curriculum anspruchsvoller Inhalte lernen.16 Schwache Standards erschweren auch die interne Ergebnisevaluation der pädagogischen Interventionen. Nur wenn klar ist, was erwartet wird, kann ich auch mit entsprechender Sicherheit Ergebnisse überprüfen. Starke Standards ermöglichen die eindeutige Formulierung von inhaltlichen und stoffbezogenen Kerncurricula sowie verbindliche Zeitpläne für das Erreichen der curricularen Ziele.17 Sie erleichtern die interne Kontrolle der schulischen "Produktion". Je stärker Standards sind, desto eher kann externe Kontrolle der Organisationsleistung zugunsten interner Evaluation reduziert werden. Wenn aber ein Steuerungsinstrument - nämlich die ergebnisorientierte Selbstevaluation - ausfällt, weil mit ihm keine validen Daten erhoben werden können, so liegt der Schluss nahe, dass ein anderes das drohende Steuerungs-Vakuum füllen wird. Und hier kommen dann externe Tests ins Spiel. Wir argumentieren nicht gegen den Einsatz von Tests, warnen aber davor, dass sie das dominante, wenn nicht das einzige Instrument der Messung schulischer Arbeit werden und damit "Qualität" amputieren. Die Entwicklung in den USA zeigt, wie qualitätsreduzierend es wirken kann, wenn die Tests eine solche Dominanz erlangt haben, dass man sie als "Testimonia", als Test-Krankheit, bezeichnen kann.

Wer muss den Job machen: Lehrer oder Staat?

Anders als die Managementaufgaben, die im Rahmen der Prozesse der Erweiterung der schulischen Selbständigkeit an die Schule und ihre Lehrer delegiert werden, sind bedeutende Aspekte der Selbstevaluation durchaus dem pädagogischen Kerngeschäft zuzurechnen. Professionelle Selbstreflexion oder Leistungsprüfungen, Klärung der Lernvoraussetzungen und Lernfortschritte der Lerner und Lernerinnen gehören dazu. Aber weil Evaluation mehr als das ist, kann sie nicht ohne Qualifizierung erfolgen. In den Bereichen des Verfahrens, deren Kenntnis man einem Lehrer nicht mehr zumuten muss, bedarf es auch personeller Unterstützung. Eine Lösung könnte darin bestehen, die monoberufliche Struktur der Schule aufzuheben und ein professionelles Miteinander zweier Professionen - Lehrern und Evaluatoren - zu etablieren. Wenigstens wäre daran zu denken, interessierte Lehrer als Evaluatoren zu qualifizieren. Es ist nicht verwerflich, wenn die Bildungspolitik gewisse Erwartungen an die Fähigkeit zur Selbstevaluation formuliert; unanständig wird es nur, wenn diese Erwartungen im Nebel bleiben und Lehrern für anspruchsvolle neue Aufgaben nicht die nötige Weiterbildung angeboten wird. Wenn die Lehrer es nicht schaffen, eine ergebnisbezogene und wissenschaftlich rigide Evaluation zu bewerkstelligen, kann die Politik die Schuld von sich weisen, und die Einführung von Batterien externer Abschlusstests scheint unausweichlich. Sie ersetzen dann kontrollierte Qualitätsentwicklung durch Fremdkontrolle.

Es muss gefragt werden, welche Rolle dem Staat in der Reform zukommt. Es genügt nicht, mit Begriffen wie Evaluation, Qualität oder Standards rhetorisch an die internationalen Debatten anzuknüpfen. Der Staat, der an der Reduktion von Ungleichheit und der Steigerung allgemeiner Leistungen interessiert ist, müsste sich erhebliche Verpflichtungen aufbürden: Er würde starke Standards einführen und systematische und empirisch geprüfte Fördermaßnahmen für diejenigen anbieten, die Gefahr laufen, die Standards zu verfehlen. Er würde für solche Lehrer oder Schulen Hilfen anbieten, die Probleme mit der Vermittlung der Standards haben. Er würde Konzepte der Evaluation befördern, die Qualität des Lernens und professionelle Kompetenz entwickeln. Er würde die Standards einer regelmäßigen Evaluation unterziehen, denn sie sollen ja definieren, was unter Grundbildung heute zu verstehen ist. Er würde Wirkungsforschung fördern und die Verbreitung der Forschungsergebnisse auf eine Art und Weise sichern, die für die Praxis brauchbar ist. Er würde transparente Systeme der Bildungsfinanzierung schaffen, die denjenigen helfen, die unter schweren Bedingungen pädagogisch arbeiten. Ein verantwortlicher Staat würde schließlich auch seine eigenen Maßnahmen evaluieren.

Angesichts der Komplexität des intendierten Wandels, nämlich der Umstellung eines gewaltigen und traditionsverhafteten Systems auf Outputsteuerung mittels Bildungsstandards als Inputinstrumente und Evaluation als Messung von Prozessen und Ergebnissen, bedarf es eines umfassenden Change-Managements, also wissenschaftlich begründeter Konzepte, die sich mit dem Problem des Wandels von und in Organisationen befassen.18 In einem komplexen "Masterplan" wären (z.B.) terminierte und überprüfbare Einzelschritte formuliert, Zielerreichung evaluiert und notwendige Ressourcen benannt. Es würden Operationen beschrieben, die sichern sollen, wie die Ebenen zwischen Ministerium und Schulklasse durchdrungen werden, wie Verbindlichkeit der Arbeit hergestellt wird und wie die Lehrer kommunikativ in die Gestaltungsprozesse eingebunden sind. Umsteuerung kann im Übrigen auch nicht aus der Portokasse bewerkstelligt werden.

Wir befürchten, dass die neueren Aktivitäten der Schulreform die Tradition der sozialen Selektion fortsetzen. Man begreift in Deutschland nur schleppend, dass das Konzept, Leistung durch Selektion erzeugen zu wollen, gescheitert ist. Leistung wird durch Förderung erzielt, das ist die Botschaft der internationalen Leistungsstudien. Unter heutigen ökonomischen und gesellschaftlichen Bedingungen muss das humanistische Ideal einer Allgemeinbildung als "Bildung für alle" nicht mehr illusionistisch bleiben. Vielfältige und gut evaluierte Projekte in vielen Staaten zeigen, dass alle Kinder lernen und Benachteiligungen durchaus mit pädagogischen Mitteln reduziert werden können.


Anmerkungen

1) Bei allen im Folgenden genannten Personengruppen etwa "Schülern", "Lehrern", "Evaluatoren", sind grundsätzlich beide Geschlechter gemeint:

2) Genaueres in: Böttcher, W. (2002): Kann eine ökonomische Schule auch eine pädagogische sein? Schulentwicklung zwischen Neuer Steuerung, Organisation, Leistungsevaluation und Bildung. Weinheim und München

3) vgl. Böttcher, W.: Pädagogik in Organisationen: Potenziale eines ökonomischen Programms der Bildungsreform. In Göhlich, M./Hopf, C./Sausele, I. (Hrsg.): Pädagogische Organisationsforschung. Wiesbaden, erscheint Herbst 2005.

4) vgl. z.B. www.bmbf.de oder www.kmk.org

5) vgl. Böttcher, W./Klemm, K. (2000): Das Bildungswesen und die Reproduktion von herkunftsbedingter Benachteiligung. In: Frommelt, B. u.a. (Hrsg.): Schule am Ausgang des 20. Jahrhunderts. Weinheim und München, S. 11 - 44

6) Aus einer empirischen Analyse könnten sich so auch klare Input- und Prozessstandards ableiten lassen.

7) Zum Folgenden vgl. Böttcher, W.: Bildungsstandards und Kerncurricula - Potenzielle, intendierte und nicht-intendierte Effekte eines zentralen Reformprojektes. In: Schlömerkemper, J. (Hrsg.): Bildung und Standards. Die Deutsche Schule, 8. Beiheft, S. 231 - 244

8) "Das IQB wird", so sein Leiter Olaf Köller, "die nationalen Bildungsstandards in Kooperation mit den Ländern weiterentwickeln und nutzen, um breite Aufgabensammlungen zu generieren, die langfristig Schulen in die Lage versetzen werden, sich selbstständig über das Erreichte im Unterricht zu vergewissern." Vgl.: idw-online.de/pages/de/news?print=1&id=93499 ).

9) Für eine ausführliche Beschreibung von Standards der Evaluation siehe:www.degeval.de

10) Bortz, J./Döring, N. (2003): Forschungsmethoden und Evaluation. Berlin, Heidelberg, New York

11) Ministerium für Schule, Jugend und Kinder des Landes Nordrhein-Westfalen (2003): Erlass, Amtsblatt 55. Jahrgang / Nr. 5, 15.Mai 2003, S. 14-23

12) Vgl. ebd.

13) Vgl. MacBeath, J. et al. (1996): Schools speak for themselves. London

14) Brenner, P. J. (2002): Gutachten zum Projekt Schule & Co. in Nordrhein-Westfalen (1997-2002). Institut für Medienevaluation, Schulentwicklung und Wissenschaftsberatung (IMSW).

15) Vgl. ebd.

16) Dies freilich halten wir für eine unverzichtbare Bedingung einer auf Chancengleichheit orientierten Schulprogrammatik.

17) Vgl. Brenner (Fußnote 13, S. 21) sowie Böttcher, W./Hirsch, E. D. jr. (1999): Zur Notwendigkeit eines verbindlichen Kerncurriculums. In: Die Deutsche Schule. Heft 3, S. 299 - 310.

18) Böttcher, W./Brohm, M. (2004): Die Methodik des Change-Managements und die aktuelle Schulreform: Über das gebrochene Verhältnis von Chancen und Realität. In: Die Deutsche Schule, Heft 3, S. 268 - 278


Dr. Wolfgang Böttcher ist Professor für Erziehungswissenschaft an der Westfälischen Wilhelms-Universität in Münster; er leitet die Abteilung Qualitätsentwicklung und Evaluation. Außerdem ist er Vorsitzender der Kommission für Bildungsorganisation, Bildungsplanung, Bildungsrecht (KBBB) der Deutschen Gesellschaft für Erziehungswissenschaft (DGfE). Dr. Michaela Brohm arbeitet als wissenschaftliche Assistentin an der Abteilung Qualitätsentwicklung und Evaluation der Universität Münster.

Zum Seitenanfang | Druckversion | Versenden | Textversion