Wetenschap

Casper Albers en de grote getallen

Statisticus met een missie

Statistiek is eigenlijk best eenvoudig. Maar hoe vertel je dat aan het grote publiek? Casper Albers kwam uit zijn ivoren toren om het uit te leggen. ‘Ik wil de mensen wapenen.’
Door Christien Boomsma / Foto’s Reyer Boxem

Het is allemaal niet zo moeilijk; de basis van statistiek is gewoon common sense, iedereen kan het begrijpen. Waarom mensen het dan toch zo ingewikkeld vinden? ‘Ze praten het elkaar aan’, zegt adjunct hoogleraar toegepaste statistiek Casper Albers. ‘Kijk alleen maar naar de flyer voor de studie psychologie. Daarin staat maar liefst drie keer dat statistiek moeilijk is en dat studenten dat goed moeten beseffen voor ze de studie kiezen.’

Ja ja, makkelijk gezegd, verzucht de eerstejaars psychologie die gezakt is voor Statistiek I. Bullshit, gromt de onderzoeker wiens artikel is afgewezen, omdat de statistische onderbouwing gaten vertoonde.

Wanneer een statisticus zegt dat zijn vak niet moeilijk is, klinkt dat toch als die wiskundedocent die maar niet kan begrijpen dat niet elk kind moeiteloos kan worteltrekken of integraalrekenen. En toch, zegt Albers, is het echt waar. ‘Vergelijk het met een auto. Om er goed mee om te kunnen gaan, hoef je de auto niet te kunnen repareren als hij kapot is, je hoeft alleen de verkeersregels te kennen.’

Gloeiende plaat

Het échte werk, het bouwen van programma’s die de berekeningen moeten uitvoeren, het nadenken over toegestane deviaties, p-waarden en significanties, dat kun je natuurlijk beter overlaten aan een vakwetenschapper, maar de rest? Dat is prima uit te leggen.

We weten niet waaróm mensen statistiek zo moeilijk vinden

Maar hoe? De meeste mensen staan niet direct te trappelen bij de gedachte aan een lesje kansberekening. En hoewel Albers columns schrijft voor de Volkskrant, het Nieuw Archief voor Wiskunde en UKrant, zijn dat druppeltjes op de gloeiende plaat. Bijkomend probleem: ‘We weten eigenlijk helemaal niet waaróm mensen statistiek zo moeilijk vinden.’

Dus, betoogde Albers dinsdag in zijn oratie in het Academiegebouw, gaat hij dat de komende jaren uitvogelen. Daarnaast gaat hij onderzoeken hoe je statistische informatie effectief kunt overbrengen.

Statistiek is immers belangrijk. Computers verwerken aan de lopende band terabytes aan informatie. Ze maken polls voor verkiezingen, berekenen het risico om kanker te ontwikkelen door het eten van broccoli, of geven informatie over criminaliteit onder allochtone jongeren. Een schat aan informatie, ja, maar ook informatie die gemakkelijk verkeerd geïnterpreteerd kan worden of zelfs misbruikt. ‘Men zegt niet voor niets There’s lies, damn lies and statistics’, zegt Albers. ‘Je kunt statistische informatie gebruiken om mensen op het verkeerde been te zetten. Bewust, voor je eigen politieke agenda, maar ook onbewust.’

Selectief shoppen

Zelfs onderzoekers die in principe van goede wil zijn, gaan gemakkelijk de fout in, weet Albers. ‘Je hebt een mooi onderzoek gedaan, een interventie uitgedacht en je verwacht – met goede redenen- een bepaalde uitkomst. Vervolgens kijk je in de data, maar komt het er niet echt uit. Wat doe je dan?’

Verwacht je een resultaat, dan ben je geneigd dat te zien.

Te vaak gaat zo’n onderzoeker nog eens even héél goed kijken en komt tot de conclusie dat het eigenlijk logischer is om die-en-die factor buiten beschouwing te laten. En ineens komt er wél een significant resultaat uit. ‘Zulk selectief shoppen in resultaten is statistisch niet toegestaan’, zegt Albers, ‘maar het is wel aantrekkelijk. Je hebt een paper, een publicatie. Bovendien: je verwachtte een resultaat, dus bent geneigd het ook te zien.’

Of – wat ook veel voorkomt – je verwachte resultaat blijft uit omdat je te weinig proefpersonen had en vervolgens voeg je er nog een aantal aan toe, waarna je plotseling wél resultaat hebt.

Valsspelen

Alweer: dat is statistisch valsspelen. ‘Vergelijk het met twee keer achtereen zes gooien. Die kans is 1/6 maal 1/6. Maar wat nu als je bij de eerste keer drie gooit en dan zegt: weet je wat? Ik pas mijn hypothese aan naar twee maal drie gooien… Dan is de kans natuurlijk niet langer 1/36, maar 1/6. Je hebt echt geen hogere wiskunde nodig om dat te snappen.’

Op andere momenten is het rekenwerk prima op orde, maar gaat het mis in de communicatie van met de buitenwereld. Bij een onderzoek dat aantoonde dat bacon kankerverwekkend is, bijvoorbeeld. Dat liet zien dat wanneer mannen tien jaar lang dagelijks 100 gram bacon aten, ze in plaats van vijf, zés procent kans hadden om darmkanker te krijgen.

‘Dat belandde in de pers met “Twintig procent hogere kans op kanker”’, herinnert Albers zich. ‘Maar als je het in procentpunten uitdrukt, is het verschil echt minimaal. Om maar niet te spreken van het feit dat níemand tien jaar lang honderd gram bacon eet. Bovendien: als je zo veel vet vlees eet, ga je niet dood aan darmkanker; voor die tijd ben je al overleden aan een hartaanval.’

Ivoren toren

Dat moet anders, vindt Albers. En het kán anders, weet hij. Niet zoals in zijn eerste jaren als onderzoeker, toen hij vooral bezig was met het schrijven van ingewikkelde psychometrische modellen. ‘Dan publiceer je daarover en heb je na vijf jaar een handvol citaties.’ Een ivoren toren, noemt hij die situatie, waarin hij modellen bouwde die door niemand gebruikt werden.

Statistiek is logisch nadenken en dat kunnen mensen best goed

Maar toen hij een jaar of vijf geleden voor zijn werk begon te twitteren, merkte hij dat er buiten zijn bubbel een wereld was van mensen voor wie statistiek abracadabra was. Mensen die je bovendien maar moeilijk kunt bereiken.

Dát werd zijn doel: uitzoeken hoe hij statistiek bij het grote publiek kon brengen. ‘De richtlijnen die we nu hebben, zijn gebaseerd op esthetische elementen: hou er rekening mee dat een deel van je publiek 50-plus is, dus gebruik een groter lettertype; gebruik geen groen en blauw naast elkaar, want dat is lastig voor mensen die kleurenblind zijn.’

Maar niemand denkt aan de psychologische factoren die een rol spelen als we naar visualisaties kijken. ‘Neem een staafdiagram’, zegt Albers. ‘Die kun je verticaal neerzetten, maar je kunt hem ook een kwartslag draaien.’

Beperkt

In het eerst geval focussen mensen zich meteen op de hoogste ‘staaf’ – de VVD is de grootste, constateren ze dan. In het tweede geval hebben mensen meer moeite met het lezen van de diagram. ‘Waarschijnlijk zullen ze constateren dat de verschillen tussen de partijen beperkt zijn’, zegt Albers.

De informatie in de grafiek is hetzelfde. Dus moet de onderzoeker zich afvragen welke boodschap hij wil overbrengen aan zijn publiek.

Of neem de netwerkmodellen die tegenwoordig vaak opduiken in publicaties. In zo’n ‘bolletjesgrafiek’ worden de factoren die een rol spelen in een bolletje weergegeven en vervolgens via dikkere of dunnere lijntjes met elkaar verbonden. Handig, want zo kun je behoorlijk veel informatie in de visualisatie stoppen. ‘Er zijn soms echt honderden lijntjes mogelijk’, zegt Albers.

Onvoorzien

Maar wie zo’n model onder ogen krijgt, ziet meestal precies wat hij verwachtte, ontdekte Albers. ‘Het trekt de aandacht weg van de informatie die nieuw is, of onvoorzien. En dan heb je er dus helemaal niets aan.’

En dus heeft Albers een missie. Een missie waarin hij onderzoekers probeert uit te leggen hoe statistiek werkt en hoe ze met hun eigen resultaten moeten omgaan. Maar tegelijk eentje waarbij hij het publiek wil uitleggen hoe ze de krantenkoppen moeten lezen. ‘Ik wil mensen wapenen’, zegt hij. ‘Statistiek is eigenlijk logisch nadenken over getallen. En dat kunnen de meeste mensen best goed.’

English