VVE effectief? Dat blijkt al evenmin uit de Pilot Startgroepen

Het ministerie van OCW gaat de komende jaren honderden miljoenen euro’s extra investeren in het Onderwijsachterstandbeleid in het algemeen, en in voorschoolse educatie (VE) in het bijzonder. Het grootste deel van dit budget gaat naar een urenuitbreiding voor de peuters. Minister Slob (2018) stelt, net als zijn voorganger staatssecretaris Dekker (2016), dat uit internationaal en Nederlands onderzoek blijkt dat VVE een positieve bijdrage kan leveren aan de ontwikkeling van doelgroeppeuters. Voorwaarde daarbij is dat het aanbod van hoge kwaliteit is.

Bij deze nieuwe investering zet de minister in op een breed monitorings-, evaluatie- en onderzoeksprogramma. De Inspectie van het Onderwijs zal de kwaliteit van VVE in beeld brengen. Daarnaast zal onderzoek aanbesteed worden om de implementatie van de investeringen in de voorschoolse educatie te volgen en de vraag te beantwoorden hoe gemeenten hun middelen besteden. Ook zal, gekoppeld aan de urenuitbreiding, onderzocht worden hoe de ontwikkeling van (doelgroep)peuters verloopt. Parallel aan de uitvoering van het programma wordt gewerkt aan een manier om ook op de middellange- en lange termijn op een structurele manier de ontwikkeling te monitoren van kinderen die deelnemen aan VE.

Inmiddels heeft het NRO (het Nationaal Regieorgaan Onderwijsonderzoek, de afdeling van NWO die een belangrijk deel van het Nederlandse onderwijsonderzoek financiert) een call for proposals (NRO, 2018) uitgezet voor een quasi-experimenteel onderzoek naar VVE. Doel van dat onderzoek is vast te stellen of en in hoeverre de urenuitbreiding gevolgen heeft gehad voor leerprestaties en sociale ongelijkheden, en waarom wel of niet. Waarom niet eens een keer een echt experimenteel onderzoek wordt geëntameerd is onduidelijk. Bovendien wordt kennelijk alleen onderzocht of de urenuitbreiding effectief is. Aan wat de centrale vraag zou moeten zijn, of VVE überhaupt effectief is, wordt gemakshalve voorbijgegaan. Die is volgens het NRO al beantwoord, want volgens het NRO (2017) is dat gewoon zo. Het baseert zich daarbij in het bijzonder op drie studies (die worden overigens ook steeds door het ministerie als bewijs opgevoerd), te weten van het CPB (2016), het Pre-COOL-onderzoek (2017) en de Pilot Startgroepen (2016). Eerder (Driessen, 2016, 2018) heb ik op basis van harde cijfers laten zien dat die bewering voor de eerste twee studies geen hout snijdt en eerder gebaseerd lijkt op wishful thinking. Resteert het effectenonderzoek naar de Pilot Startgroepen. Om na te gaan in hoeverre de bewering van het NRO dat die pilot aantoont dat VVE effectief is door de feiten gestaafd wordt, is het de moeite waard het onderzoeksrapport ter hand te nemen.

De uitvoering van dat onderzoek Pilot Startgroepen bleek geen sinecure. De vorming van de controlegroep op basis van de Pre-COOL-data bleek – op z’n zachts gezegd – niet probleemloos. (Hetgeen overigens door de onderzoekers keurig is gerapporteerd.) In Pre-COOL is van slechts de helft van de kinderen bekend of ze VVE hebben gevolgd. Daarnaast bevat het weinig kinderen met een niet-Westerse etnische achtergrond en een laag ouderlijk opleidingsniveau (N.B. juist de VVE-doelgroep). Om dit probleem te ondervangen moest daarom een weging worden toegepast. Hierdoor tellen veel leerlingen dubbel of driedubbel mee en wegen individuele trajecten daardoor zwaar en zijn onevenredig bepalend voor de uitkomsten. Dat bleek ook uit het feit dat de normaal vereiste multilevel-analyses niet konden worden uitgevoerd en moest worden uitgeweken naar reguliere regressie-analyses. Ook waren er problemen omdat de startleeftijd van de kinderen in beide groepen te zeer verschilden. Uit het grote Pre-COOL-bestand met duizenden kinderen resteerden er uiteindelijk na allerlei kunstgrepen nog slechts maximaal 206 die geschikt leken.

Volgens het ministerie van OCW dienen VVE-programma’s zich te richten op vier ontwikkelingsgebieden: taal, rekenen, sociaal-emotioneel, en fysiek. In het onderzoek zijn alles bij elkaar niet meer dan vijf verschillende toetsjes/taken afgenomen, waarvan drie in de voorschoolse fase (op het gebied van taal, rekenen en selectieve aandacht), en drie vergelijkbare in de vroegschoolse fase. Dat geeft dus slechts een uitermate beperkte representatie van de vier onderscheiden domeinen. Op taal in de voorschoolse fase was er geen significant effect, evenmin op rekenen in de vroegschoolse fase. Het effect op rekenen in de voorschoolse fase (0,40) en het effect op taal in de vroegschoolse fase (0,26) was klein. Het effect op selectieve aandacht is alleen voor de voorschoolse fase gerapporteerd; dat was eveneens klein (0,20). Om een indruk te geven van de interpretatie van de sterkte van een effect: volgens Cohen (1988) en het NJI (2018) is een effect tot 0,20 verwaarloosbaar; van 0,20 tot 0,50 klein, van 0,50 tot 0,80 middelgroot, van 0,80 tot 1,30 groot, en 1,30 en hoger zeer groot.

Grofweg samengevat laat dit experiment dus zien dat er van de vijf effecten twee niet significant waren, twee volgens de algemeen-geldende regels nagenoeg verwaarloosbaar waren en één klein was. Desondanks suggereren de verantwoordelijke bewindslieden van OCW dat hiermee is aangetoond dat VVE effectief is. Veel kwalijker is dat onze nationale onderzoeksfinancier het NRO (2017)  dat ook zonder voorbehoud beweert. Veel verstand van onderzoek doen hebben ze daar helaas dus niet.