Statistiek voor hoopvollen en statistici
In een normale democratie zou onderhand het stadium van berusting en uitvoering van de volkswil zijn aangebroken, maar dit is Nederland waar referenda wel worden gedoogd. En niet meer dan dat, omdat legalisering ‘gelukkig’ altijd ingewikkelder blijkt dan wenselijk.
Zondag in Buitenhof kregen we de onvermijdelijke discussie tussen twee voorstanders van het JA, gevolgd door enig onderwijskundig gedreutel van iemand die meent het altijd beter te weten omdat hij lid is van ‘de onderwijspartij’. Daarmee overigens wèl overtuigend aantonend dat begrip van het belang van goed rekenen hem ten enenmale ontging.
iets dergelijks was zondag ook te bewonderen bij Peil.nl, de site waarop Maurice de Hond wekelijks het uithangbord van zijn negotie etaleert: de politieke weerberichten. Afgelopen woensdag had Maurice nog een slechte dag beleefd, aangezien hij halverwege het #GeenPeil-referendum staande probeerde te houden dat een opkomst van circa 26% het maximum zou zijn. Zodat hij wat uit te leggen had nadat er was afgevlagd bij 32,2%. Het leuke van die onderzoekjes op Peil.nl was echter, dat het antwoord er wel stond, maar alleen voor fijnproevers en goede lezers – goed kunnende lezen en rekenen.
Waarmee overigens ook een verklaring wordt gegeven voor de onwil van D66-achtigen om goed rekenwonderwijs te bevorderen, maar dat is nogal achterdochtig geredeneerd. Eigenlijk.
Maar enfin, waar zat nu de clou? Zie hieronder:
Àlle inkomens zaten een paar procent boven de uitslag in het NEE-kamp, behalve de hoge inkomens, die er totaal 9% onder zaten. Dat komt er op neer, dat van de mensen van alle gemeten inkomens circa 2/3 tot de hoge inkomens behoort. Dat is een afwijking van betekenis. (Saldo hoog = -9, saldo anders is +5, in evenwicht moet gelijk zijn aan 61% => hoog moet 1,8 maal groter zijn dan de rest totaal). Doordat de antwoorden vooral uit de hoge inkomens kwamen – die het minst geporteerd waren van een NEE, en sowieso van stemmen – werd de berekening sterk beïnvloed en werd de uitkomst onbetrouwbaar.
Uit ditzelfde staatje kun je nog een aardige conclusie trekken: circa een kwart van de hoogopgeleiden heeft geen hoog inkomen. Waar deze hoogopgeleiden politiek worden gevonden kan interessant zijn voor toekomstige onderzoeken, dus houden we dat nog even in gedachten.
De kern van dit artikel klopt niet. Je vermenigvuldigt ergens kennelijk terwijl je daar had moeten delen.
Ik heb zelf een paar jaar geleden enkele keren ook dergelijke fouten gemaakt; tot mijn verbazing en schaamte. Dat zijn harde, maar nuttige lessen. Wat ik ervan heb geleerd is dat je niet zulke sterke uitspraken moet doen op grond van vage berekeningen; altijd even wachten met posten; eerst zorgvuldig narekenen; liefst ook iemand anders raadplegen.
Mijn berekening voor bovenstaande statistieken is als volgt. Neem de volgende definities:
nH = het aantal mensen met hoge inkomens in de peiling
nL = het aantal mensen met andere inkomens in de peiling
n = nH + nL het totaal aantal mensen in de peiling
Dan is het totaal aantal nee-stemmers in de peiling:
61% * n
en uitgesplitst is het:
52% * nH + 63% * nL
(Even aannemende dat 63% geldt voor alle gepeilde mensen met niet-hoge inkomens)
Daarom:
0.61*n = 0.61*(nH+nL) = 0.52*nH + 0.63*nL
0.09*nH = 0.02*nL en
0.11*nH = 0.02*(nL+nH) = 0.02*n
nH = 2/9 *nL en
nH = 2/11*n
Dus nH/n = 2/11 = 18%
Dus slechts 18% van de ondervraagden hebben een hoog inkomen.
Dat is zeer aannemelijk; vooral ook omdat de definitie van een hoog inkomen
wel iets zal zijn als de bovenste 10%, 15% of 20%.
Omdat de 63% dicht bij de 61% ligt (en er was een 62% bij) is de berekening
onnauwkeurig: er kan een flinke afwijking in zitten, maar 18% is wel een evenwichtige schatting.
Check met de ja-stemmers; dat zijn er
38% * n
en uitgesplitst is het:
47% * nH + 36% * nL
Daarom:
0.38*n = 0.38*(nH+nL) = 0.47*nH + 0.36*nL
Gelukkig zien we hieruit weer:
0.09*nH = 0.02*nL en
0.11*nH = 0.02*(nL+nH) = 0.02*n
Ik ben bang dat je gelijk hebt. Merci.