Data is geen Informatie.

bayesiaanse statistiek cursus

Dit kan een verrassing zijn, maar het is waar. Data zijn niets anders dan de juiste administratie van metingen of waarnemingen, en niets minder. De gegevens zijn een lijst van waarden of getallen.

Informatie een functie over een verdeling. En deze verdeling is gebaseerd op onze kennis van zaken.

Stel dat iemand gooit een vijfmaal dobbelsteen met de uitkomsten 1,4,6,3 en 6. Dit zijn de gegevens. Men vermoedt niets bijzonders aan deze getallen en men gaat ervan uit dat de dobbelstenen eerlijk is.

Totdat we leren dat de dobbelsteen werd geworpen door een professionele gokker, die zijn geld op deze manier verdient. Nu lijken de twee 6-en minder onschuldig als voorheen.

De gegevens zijn nog steeds dezelfde reeks getallen 1,4,6,3 en 6, maar onze stand van kennis is veranderd. En daarmee onze verwachtingen voor de volgende worp van de dobbelsteen.