Werk

Centraal Bureau voor de Statistiek

Van 1978 tot 2014 werkte ik als survey-methodoloog bij het Centraal Bureau voor de Statistiek (CBS). Het CBS verzamelt gegevens over allerlei aspecten van de Nederlandse samenleving. Die gegevens worden omgezet in bruikbare statistische informatie voor de overheid, wetenschap en verder iedereen die daarin is geïnteresseerd.

Het Centraal Bureau voor de Statistiek in Den Haag.

Steekproeven

Het CBS maakt vaak gebruik van steekproeven om gegevens te verzamelen. Daarmee wordt de enquêtedruk laag gehouden, de kosten zijn lager en de gegevens komen sneller beschikbaar. Op basis van steekproefgegevens kunnen vrij nauwkeurig schattingen worden gemaakt van allerlei karakteristieken van de hele populatie. Dan moet de zo’n steekproef wel op verantwoorde wijze worden getrokken. Dat is het werkterrein van de survey-methodologie.

De survey-methodologie schrijft voor dat steekproeven moeten worden geloot uit een populatie. Daarbij wordt niemand bevoordeeld of benadeeld. Dat wordt een aselecte steekproef genoemd Het experiment hieronder laat zien dat dit werkt.

In een bepaalde streek van Samplonië staan 169 boerderijen. Met een aselecte steekproef de gemiddelde mestproductie per boerderij geschat. Dat trekken van steekproeven wordt een groot aantal malen herhaald. Het resultaat van elke steekproef wordt weergegeven als een blauw blokje.

Om een reeks simulaties uit te voeren, moet eerst de omvang van de steekproef worden ingesteld. Dat kan door klikken op het groene vierkantje onder Steekproef. Na elke keer klikken verschijnt een andere waarde. Er kan worden gekozen uit een omvang van 10, 20, 40 of 80. Door klikken op Start wordt de simulatie gestart.

De uitkomsten van de steekproeven liggen keurig symmetrisch om de werkelijk (te schatten) waarde. Ook blijkt uit deze experimenten dat bij een grotere omvang van de steekproef de schattingen dichter om de werkelijke waarden geconcentreerd liggen. Dus een grotere steekproef leidt tot nauwkeuriger schattingen.

Universiteit Leiden

Vanaf 2012 werk ik eén dag per week bij de Faculteit Sociale Wetenschappen (Instituut voor Politieke Wetenschap) van de Universiteit Leiden. Ik geef daar college en doe onderzoek op het terrein van de survey-methodologie. De nadruk ligt op online onderzoek.

Het Pieter de la Court gebouw van de Faculteit Sociale Wetenschappen van de Universiteit Leiden.

Survey-methodologie

Bij het vak survey-methodologie komen onder meer aan de orde het opzetten van een survey-onderzoek, het maken van een vragenlijst, het trekken van een steekproef, het verzamelen van gegevens, de problematiek van non-respons, analyse van de verzamelde gegevens, en de verslaglegging van de uitkomsten. Er wordt in het bijzonder aandacht besteed aan de methodologische haken en ogen van dataverzameling via het internet.

Non-respons

Bij enquêtes treedt vaak non-respons op. De gewenste gegevens komen niet beschikbaar omdat mensen hun medewerking weigeren, ze bijna nooit thuis zijn of ze niet in staat zijn mee te werken (bijvoorbeeld door taalproblemen.

Door non-respons wordt de representativiteit van de steekproef aangepast: bepaalde groepen zijn daardoor over- of ondervertegenwoordigd in de steekproef.

Mijn onderzoeksterrein is het ontwikkelen van nieuwe technieken om steekproef te corrigeren op zodanig wijze dat het wel mogelijk is om goede schattingen te maken. Dit is het terrein van het wegen van steekproeven.

Web-surveys

Web-surveys zijn erg populair. Dat komt omdat via het Internet snel en goedkoop veel gegevens kunnen worden verzameld. Maar er zitten allerlei methodologische haken en ogen aan. Web-surveys zijn vaak niet representatief omdat mensen zonder Internet worden uitgesloten van het onderzoek.

De personen die meedoen aan een web-survey zijn vaak niet netjes geloot. Mensen kunnen zichzelf opgeven voor het onderzoek. Dat wordt zelfselectie genoemd. Zelfselectie kan de representativiteit in ernstige mate aantasten.