Centraal Bureau voor de Statistiek
Het Centraal Bureau voor de Statistiek (CBS) verzamelt gegevens over allerlei aspecten van de Nederlandse samenleving. Die gegevens worden omgezet in bruikbare statistische informatie voor de overheid, wetenschap en verder iedereen die daarin is geïnteresseerd.
Het CBS maakt vaak gebruik van steekproeven om gegevens te verzamelen. Daarmee wordt de enquêtedruk laag gehouden, de kosten zijn lager en de gegevens komen sneller beschikbaar. Op basis van steekproefgegevens kunnen vrij nauwkeurig schattingen worden gemaakt van allerlei karakterstieken van de hele populatie. Dan moet de zo'n steekproef wel op verantwoorde wijze worden getrokken. Dat is het werkterrein van de survey-methodologie.
Steekproeven
De survey-methodologie schrijft voor dat steekproeven moeten worden geloot uit een populatie. Daarbij wordt niemand bevoordeeld of benadeeld. Dat wordt een aselecte steekproef genoemd Het experiment hieronder laat zien dat dit werkt.
In een bepaalde streek van Samplonië staan 169 boerderijen. Met een aselecte steekproef de gemiddelde mestproductie per boerderij geschat. Dat trekken van steekproeven wordt een groot aantal malen herhaald. . Het resultaat van elke steekproef wordt weergegeven als een blauw blokje.
Om een reeks simulaties uit te voeren, moet eerst de omvang van de steekproef worden ingesteld. Dat kan door klikken op het groene vierkantje onder Steekproef. Na elke keer klikken verschijnt een andere waarde. Er kan worden gekozen uit een omvang van 10, 20, 40 of 80. Door klikken op Start wordt de simulatie gestart.
De uitkomsten van de steekproeven liggen keurig symmetrisch om de werkelijk (te schatten) waarde. Ook blijkt uit deze experimenten dat bij een grotere omvang van de steekproef de schattingen dichter om de werkelijke waarden geconcentreerd liggen. Dus een grotere steekproef leidt tot nauwkeuriger schattingen.
|
Universiteit van Amsterdam
Eén dag per week werk zit ik bij de Faculteit der Economische Wetenschappen en Econometrie van de Universiteit van Amsterdam. Daar studeren ongeveer 3500 studenten. Ik geef daar college in het vak Survey-methodologie en soms ook in andere statistiekvakken.
Survey-methodolgie
Bij het vak survey-methodologie komen onder meer aan de orde het opzetten van een survey-onderzoek, het maken van een vragenlijst, het trekken van een steekproef, computer gestuurd enquêteren, de problematiek van non-respons, analyse van de verzamelde gegevens, en de verslaglegging van de uitkomsten. Er wordt ook aandacht besteed aan programmatuur op dit vakgebied.
Non-respons
Bij enquêtes treedt vaak non-respons op. De gewenste gegevens komen niet beschikbaar omdat mensen hun medewerking weigeren, ze bijna nooit thuis zijn of ze niet in staat zijn mee tewerken (bijvoorbeeld door taalproblemen .
Door non-respons wordt de representativiteit van de steekproef aangepast: bepaalde groepen zijn daardoor over- of ondervertegenwoordigd in de steekproef.
In de simulatie hieronder is het zo dat vooral mensen met een hoog inkomen weigeren mee te doen. Daardoor zitten er te veel lage inkomens de steekproef en vallen schattingen voor het gemiddeld inkomen heel vaak te laag uit.
Mijn onderzoeks terrein is het ontwikkelen van nieuwe technieken om steekproef te corrigeren op zodanig wijze dat het wel mogelijk is om goede schattingen te maken. Dit is het terrein van het wegen van steekproeven.
|