Wat is de definitie van datajournalistiek? Wat doe je precies als datajournalist? Het boek Handboek datajournalistiek geschreven door Hille van der Kaa en Henk van Ess kan een definitie geven. “Datajournalistiek is journalistiek waarbij grote hoeveelheden documenten of cijfers eerst toegankelijk moeten worden gemaakt voordat een relevant verhaal mogelijk is.” Dit is een begin van de definitie, maar Simon Rogers, voormalig medewerker bij The Guardian komt met een makkelijkere definitie. Hij ziet datajournalistiek als een manier van verhalen vertellen vanuit data.

Verhalen vertellen vanuit data dus, maar waar komt de data vandaan? Over de jaren heen zijn de overheden en bedrijven steeds meer cijfers en data gaan publiceren. Een gedeelte van deze cijfers zijn terug te vinden via het openbare internet, vandaar dat de term open data hiervoor wordt gebruikt. Een voorbeeld waar veel data van de nationale overheid samenkomt, is bij het Centraal Bureau voor de Statistiek (Statline). Voor de cijfers van landen in de Europese Unie kan Eurostat hulp bieden.

De cijfers die niet zichtbaar zijn, moeten in het geval van de overheden in Nederland via de Wet Openbaarheid van Bestuur gaan, oftewel WOB. Via een WOB-verzoek kan de datajournalist aan meer informatie komen. Voor cijfers van bedrijven kan er in de jaarverslagen worden gekeken of moet de datajournalist in gesprek gaan met het bedrijf.

Analyseren van de data

De data is binnen. Wat nu? De journalist begint nu met het ordenen en ‘schoonmaken’ van de data. Voordat de datajournalist begint met het analyseren van de cijfers, wordt er eerst gekeken naar wat de cijfers precies inhouden, hoe ze zijn verzameld en of er nog oneffenheden in de data zichtbaar zijn. Pas als alle oneffenheden uit de dataset zijn gehaald, kan de journalist beginnen met het analyseren. Een voorbeeld van een oneffenheid is dat tijdens het importeren van de data de komma’s in punten zijn veranderd. Dit kan tijdens de analyse tot andere resultaten leiden, dus is het de taak aan de datajournalist om dit aan te passen. 

Tijdens het analyseren kijkt de datajournalist naar bepaalde trends en worden er verschillende cijfers met elkaar vergeleken. Een trend kan bijvoorbeeld een stijging of een daling zijn over de jaren heen of een gebied dat afwijkt van anderen gebieden. Hoe groter de verschillen zijn, hoe interessanter het verhaal kan worden. Tijdens het analyseren is het ook mogelijk dat de datajournalist erachter komt dat er toch geen verhaal in zit en dan moet de journalist opnieuw beginnen. Het kan namelijk zo zijn dat de data niet compleet is of er niet echt grote verschillen zijn. Dan moet de datajournalist beslissen of het verhaal wel de moeite waard is. Als de cijfers wel een verhaal laten zien, dan kan de datajournalist voorzichtig een conclusie trekken en de resultaten weergeven.

Toetsen bij betrokkenen en experts

Het is mogelijk dat de datajournalist een verkeerde conclusie trekt. Het zijn tenslotte ook mensen. Om dit te voorkomen gaat de datajournalist in gesprek met betrokkenen en experts. De datajournalist legt de resultaten en conclusies voor uit de data-analyse om zo zekerheid te krijgen. Het voorleggen van de data leidt meestal tot een interview dat kan helpen om het verhaal menselijker te maken. Vaak zitten er betrokkenen achter de cijfers en kan het van belang zijn om deze betrokkenen een kans te geven het woord te krijgen. Over het algemeen zou een verhaal nooit alleen maar uit data moeten bestaan.

Zodra de interviews erop zitten, kan de datajournalist het verhaal gaan schrijven. In dit verhaal moeten dus de interviews en de data een plek krijgen en dit kan soms een puzzel zijn. Data kan ervoor zorgen dat het verhaal minder vaart krijgt en dus moeilijker leesbaar wordt. Een manier om dit te voorkomen, is om niet de data letterlijk uit te typen, maar om een visualisatie te maken. Deze visualisatie zorgt voor duidelijkheid. Het maken van de juiste visualisatie is ook een secuur werk. Er wordt dan onder andere gekeken naar welke grafiek of tabel er gebruikt moet worden, welke kleuren er nodig zijn en hoe het in het verhaal past. De belangrijkste bevindingen die in de visualisatie staan, kunnen dan nog in de tekst worden benoemd.

Dit is de basis van een datajournalistiek verhaal. De datajournalist begint bij het verzamelen en opschonen van de data. Daarna gaat de datajournalist aan de slag met het analyseren. Nadat de data-analyse klaar is, worden de conclusies en resultaten getoetst bij het publiek, betrokkenen of experts. Zodra alle interviews binnen zijn, kan de datajournalist het verhaal gaan maken met behulp van onder andere visualisaties.