Weinig fiducie in vernieuwde gewichtenregeling

Kritiek gewichtenregeling

Het belangrijkste onderdeel van het Onderwijsachterstandenbeleid is de zogenoemde gewichtenregeling. Om onderwijsachterstanden aan te pakken krijgen scholen voor leerlingen uit ‘educatief-zwakke’ milieus extra geld. Op dit moment wordt daarvoor als (enige) indicator het ouderlijk opleidingsniveau gehanteerd, eerder was ook de etnische herkomst, en daarvoor ook nog het ouderlijk beroep bepalend. De achterliggende gedachte is dat een laag opleidingsniveau van ouders een goede voorspelling geeft van geringere onderwijskansen van kinderen. De laatste jaren is veel kritiek geleverd op de indicator(en) voor de gewichtenregeling (bv. Driessen, 2015; Driessen 2017a; Driessen 2017b). Een belangrijk punt was dat de voorspellende waarde ervan altijd al niet bijzonder sterk is geweest (de eerste versie dateert van 1985), maar dat die momenteel helemaal onder de maat is. Reden dat de vorige staatssecretaris, Dekker, het CBS opdracht heeft gegeven een model te ontwikkelen dat een betere voorspelling geeft van te verwachten onderwijsachterstanden en dat tevens minder arbeidsintensief is voor de scholen en het ministerie.

 

Nieuwe regeling

Het CBS heeft in enkele rapportages verslag gedaan van haar analyses, helaas vrij summier en basisinformatie ontbreekt veelal (Posthumus e.a., 2016; Posthumus e.a., 2017). De kern van de nieuwe, inmiddels door de Tweede Kamer geaccepteerde, regeling is dat de scholen geld krijgen op basis van analyses die jaarlijks door het CBS op afstand worden verricht op al voorhanden zijnde gegevens. Belangrijk nadeel is dat de scholen zelf daarbij niet meer betrokken worden en alles anoniem is; de scholen weten daardoor niet meer voor welke leerlingen zij dat extra geld krijgen (ze kunnen dus ook niets meer controleren). Gevolg is dat zij vervolgens toch weer zelf aan de slag moeten om hun doelgroepen te bepalen en moeten gaan berekenen hoe ze het gaat verdelen. Dubbelop, lijkt me. Bovendien valt door deze aanpak niet meer na te gaan of het beleid effectief is. Die effectiviteit is overigens de afgelopen 50 jaar ook nog nooit aangetoond, hetgeen wel essentieel mag worden geacht voor een investering van tientallen miljarden euro’s, maar waar minister Slob van OCW kennelijk niet zo aan hecht. De burger komt er zo nooit meer achter of al dat belastinggeld iets heeft opgeleverd.

Het CBS heeft uiteindelijk gekozen voor de volgende reeks van indicatoren: opleiding vader, opleiding moeder, herkomst ouders, verblijfsduur moeder, ouders in de schuldsanering, gemiddeld opleidingsniveau moeders per school. Hoeveel deze zes indicatoren nu precies een betere voorspelling geven van onderwijsachterstanden dan de huidige indicator, het ouderlijk opleidingsniveau, valt uit de CBS-rapportages niet te op te maken. Dat komt niet alleen omdat belangrijke basisinformatie ontbreekt, maar ook omdat het CBS ervoor heeft geopteerd in haar analyses op verschillende manieren te corrigeren voor de intelligentie van de leerlingen. Concreet: de Cito Eindtoetsscores uit groep 8 worden voorspeld uit een reeks gezins-, school- en buurtkenmerken, waarbij steeds gecorrigeerd is voor de resultaten op een (quasi-)intelligentietest die is afgenomen in groep 5. Ik heb zo mijn twijfels bij deze benadering, niet alleen bij de correctie met behulp van de intelligentietest, maar evenzeer bij het gebruik van toetsscores eind basisschool in plaats van start basisschool. In het resultaat zit nu immers ook nog de invloed van 8 jaar onderwijs en Onderwijsachterstandbeleid verstopt.

 

Kritiek analyses

Om meer duidelijkheid te krijgen over de verdelingskenmerken van de indicatoren en de samenhangen daartussen, heb ik geprobeerd informatie daarover bij het CBS te verkrijgen. Dat bleek geen sinecure. Een eerste poging via de betrokken onderzoekers liep op niets uit, een tweede door gebruik te maken van de WOB ook. Pas nadat ik liet weten het gebrek aan medewerking bij het verkrijgen van inzicht in de analyses aan te gaan kaarten via de sociale media, volgde per omgaande de reactie van het CBS dat men graag wilde meewerken. Vervolgens had het CBS echter nog ruim anderhalve maand nodig om wat uiterst simpele basistabelletjes te produceren (Posthumus, 2018).

Het eerste wat me opvalt bij lezing van de tabellen, is dat er steeds evenveel vaders zijn als moeders, terwijl in COOL-cohortonderzoeken, die de basis vormden voor de analyses, altijd rond de 10 procent van de kinderen niet in een twee-ouder, maar met name in een eenoudergezin opgroeide. (En niet onbelangrijk: in veel Amerikaans onderzoek is het opgroeien in een eenoudergezin het kenmerk dat onderwijsachterstanden het beste voorspelt). Waar de gegevens van die niet-aanwezige ouders op gebaseerd zijn wordt me niet duidelijk. Verder zijn enkele kenmerken dusdanig (extreem) scheef verdeeld, dat het vermoeden gerechtvaardigd is dat het om zeer specifieke situaties gaat. Bijvoorbeeld met betrekking tot verblijfsduur moeder blijkt alleen de categorie 5-15 jaar relevant, maar daarbij gaat het om nog geen 6 procent van de moeders. Nadere bestudering brengt aan het licht dat zij vooral uit Turkije, (waarschijnlijk) Marokko en een restcategorie Afrika, Azië en Latijns-Amerika komen. De moeders uit Turkije en Marokko betreffen waarschijnlijk vrouwen die in verband met huwelijksmigratie op latere leeftijd naar Nederland zijn gekomen. De vraag is hoelang dit fenomeen nog blijft bestaan. De categorie 0-5 jaar telt (immers) niet meer dan 1,5 procent van de moeders, en dit is de categorie die in de toekomst opschuift naar de categorie 5-15 jaar. Hoe zinvol is het daarom dit kenmerk nog als indicator op te nemen? Een nog extremer scheef-verdeeld kenmerk is ouders in de schuldsanering. Dat is voor slechts 1 procent van de gezinnen van toepassing (in absolute zin vooral autochtone laagopgeleide ouders). Ronduit bizar: wat is de zin van het opnemen van een dergelijke indicator? En hoe gedragen dergelijke kenmerken zich in de statistische analyses? Een indicator waarover ik ook sterke twijfels heb, betreft het gemiddelde opleidingsniveau van de moeders op een school. De samenhang (correlatie) daarvan met de Cito-scores is, gecorrigeerd voor intelligentie, 0,24. De gemiddelde opleiding is echter een kenmerk op het niveau van de school, terwijl de Cito-score op het niveau van de leerling ligt. Het betreft dus een zogenoemde meerniveau situatie, waarvoor strikt genomen multilevel statistische analyses verricht zouden moeten worden, hetgeen niet gebeurd is. Hoe het ook zij, het effect van deze indicator is niet significant. Wat die dan toevoegt aan het geheel wordt niet duidelijk gemaakt.

 

Much ado about nothing

Volgens het CBS lukt het in het uiteindelijk geselecteerde model met de zes indicatoren 41,8 procent van de verschillen in Cito Eindtoetsscores te verklaren (waarbij dus moet worden aangetekend dat de verklaring door gemiddelde opleiding moeders per school en verblijfsduur moeder 0-5 jaar allebei niet significant zijn). Volgens het CBS is dat veel. Is dat zo? Van belang is immers dat het hier gaat om analyses waarbij is gecorrigeerd voor intelligentie. In een model zonder intelligentie blijft nog minder dan de helft van de verklaring over, namelijk 19,8%. Het CBS heeft in haar rapportage veel tabellen opgenomen, helaas niet altijd die tabellen die ertoe doen en een goed inzicht zouden kunnen geven. Wat ik vooral zou willen zien is hoeveel elk van de indicatoren afzonderlijk toevoegt aan het verklaringsmodel. Ik heb hierboven al gewezen op twee (extreem) scheef verdeelde indicatoren. Uit de tabel waarin niet gecorrigeerd is voor intelligentie kan worden afgelezen dat de samenhang tussen Eindtoetsscores en verblijfsduur moeder niet meer dan 0,03 bedraagt en die met ouders in de schuldsanering 0,08, verwaarloosbaar dus. Dat kan toch niets toevoegen? Waarom opnemen dan?

 

Conclusies

Ik heb verschillende bezwaren tegen de nieuwe gewichtenregeling. Niet alleen in theoretische en praktische zin, maar ook in methodologisch opzicht. Het CBS had als opdracht een regeling te ontwikkelen die een betere voorspelling geeft van achterstanden en die scholen minder werk bezorgt. Wat dit minder werk betreft, moet ik nog zien hoe dit allemaal vertaald gaat worden in de praktijk. En wat voor werk scholen er juist bijkrijgen om het nu toch weer voor zichzelf uit te moeten gaan vogelen. Wat die betere voorspelling aangaat heeft de aanvullende informatie die ik met zeer veel moeite heb kunnen lospeuteren bij het CBS mijn fiducie in de regeling allesbehalve vergroot, integendeel. Als we de drie, naar mijn idee dubieuze, indicatoren schrappen die ik hiervoor heb besproken, houden we nog opleiding en herkomst over, inderdaad, de twee indicatoren die tot 2006 bepalend waren voor het leerlinggewicht. Merkwaardig is echter, dat toen door het ministerie van OCW werd gesteld dat herkomst niet meer voldeed en geschrapt moest worden. Nu, zoveel jaar later, wordt het weer van stal gehaald omdat het kennelijk wel weer voldoet.

Wat nu de meerwaarde is van de nieuwe regeling wordt door het CBS nergens uit de doeken gedaan, niet hoeveel beter de voorspelling is, en evenmin hoeveel minder werk de scholen zullen krijgen.

 

Dit artikel is op 16 augustus 2018 gepubliceerd op DidactiefOnline.