Gebruik alles wat je weet

You cannot do inference without making assumptions – Sir David MacKay (1967 – 2016)

In  Wat is je Model? werd de vraag gesteld: Hoeveel denk je morgen te verdienen als je vandaag €200 verdiend hebt? En gisteren €100, eergisteren €200 en drie dagen geleden €100?

Dit zijn je data en deze worden weergegeven door vier oranje punten. Hier komt de Bayesiaanse aanpak.

De eerste vraag is: Wat weet je over je data? Echte data hebben altijd een onzekerheid. In ons geval is de €200 wel wat we in handen hebben, maar dit is niet de exacte omzet. Er zijn afrondingen gemaakt, fouten bij het wisselen, enz. De exacte omzet is dus onbekend.

De tweede vraag is: Wat weet je over het proces? In dit geval over hoe het geld verdiend wordt. Is vraag en aanbod vrijwel altijd constant of is het een groeimarkt? En hoe groot is die groei dan? Hoeveel kennis over de markt heb je?

Het antwoord op de eerste vraag is weergegeven door de blauwe fouten-grenzen bovenop de data. Meestal wordt hiervoor een Gauss functie gekozen. De vier Gauss functies tezamen geven de Likelihood van de data.

Het antwoord op de tweede vraag wordt weergegeven door het blauwe gebied. Ook dit is een Gauss functie die uitwaaiert naarmate we verder de toekomst in gaan. Dit gebied beschrijft onze kennis van de markt en heet de Prior.

Tezamen vormen de Likelihood en de Prior de Posterior, die eveneens een Gauss functie is. Het maximum van deze Posterior is de rode functie. De rode punt is de voorspelling voor de omzet voor morgen (€ 178), met bijbehorende fouten-grens (€ 43).

Dit is de Bayesiaanse aanpak in vogelvlucht. De jonge Carl Friedrich Gauss (1777 – 1855) kijkt ons met een bemoedigende glimlach aan.