Betrouwbaarheid
Bij nauwkeurigheid gaat het om hoe precies de meting is. Bijvoorbeeld is een verplaatsing 6 kilometer lang of 6,423 km? Het tweede is veel nauwkeuriger. Is deze lengte exact via precisie instrumenten opgemeten of is dit een respondent inschatting?
Betrouwbaarheid gaat over hoe betrouwbaar een uitspraak is. Bijvoorbeeld als we weten van die ene verplaatsing dat deze 6 km lang is, kun we zeggen: alle verplaatsingen zijn gemiddeld 6 km lang. Voor deze specifieke dataset klopt dit, alleen kunnen we dit niet zomaar voor alle verplaatsingen zeggen. Op basis van één meting zeggen dat alle verplaatsing gemiddeld 6 km lang zijn, is zeer onbetrouwbaar. Wanneer we 1.000 verplaatsingen meten met als uitkomst dat de gemiddelde verplaatsing een lengte heeft van 6 kilometer, dan wordt de uitspraak ‘een gemiddelde verplaatsing is 6 kilometer’ veel betrouwbaarder. Naast het aantal metingen is de werkelijke variatie in wat we meten van belang: maakt iedereen in werkelijkheid verplaatsingen tussen de 5 en 7 kilometer of is die variatie veel groter, bijvoorbeeld tussen de 1 en 60 kilometer?
Nauwkeurigheid en betrouwbaarheid van een uitspraak hangen nauw samen. De uitspraak de gemiddelde lengte van een verplaatsing ligt tussen de 1 en 100 kilometer is zeer betrouwbaar maar ook zeer onnauwkeurig. Met behulp van de steekproeftheorie kan berekend worden wat de statistische betrouwbaarheid is van een uitspraak.
De validiteit van een meting is daarnaast ook van belang voor de betrouwbaarheid van een uitspraak. Meten we wel wat we zouden moeten meten? In geval van een steekproef van verplaatsingen kan deze selectief zijn (bijvoorbeeld alleen woon-werk verplaatsingen) waardoor een verkeerd beeld ontstaat. Ook de definitie van een verplaatsing kan een verstorende rol spelen (onderweg met de auto iemand afzetten: zijn dat dan 1 of 2 verplaatsingen?). Validiteit kan bij nieuwe (big) databronnen een belangrijk aspect zijn: heel veel metingen maar wel met een bepaalde selectiviteit. Denk bijvoorbeeld aan OV9292: informatie over heel veel reizen, maar dit betreffen de niet-reguliere reizen.
Over de validiteit van een meting zegt de statistische betrouwbaarheid niets (en andersom).
Bij de beoordeling van betrouwbaarheid wordt dit als een combinatie van statistische betrouwbaarheid en validiteit gezien.
De scores kennen een 5-puntsschaal, vormgegeven middels sterren (vijf sterren is zeer goed, één ster is zeer slecht). De scores zijn op basis van expert judgement tot stand gekomen.