Wat is mijn IQ?

Lees meer

Wat is mijn IQ?

Wat is mijn IQ? Ik heb één keer meegedaan aan een IQ-test en scoorde 120 punten. Als data scientist vraag ik mij af: Wat is mijn werkelijke IQ?  Want dit is maar één test. Volgens Wikipedia is de nauwkeurigheid van de IQ-test ongeveer 3 punten. Dus mijn werkelijke IQ...

Lees meer

Gebruik alles wat je weet

Lees meer

de Bayesiaanse aanpak

Gebruik alles wat je weet You cannot do inference without making assumptions - Sir David MacKay (1967 – 2016) In  Wat is je Model? werd de vraag gesteld: Hoeveel denk je morgen te verdienen als je vandaag €200 verdiend hebt? En gisteren €100, eergisteren €200 en drie...

Lees meer

De beste fit is niet het beste model

Lees meer

Wat is je model?

De beste fit is niet het beste model Hoeveel denk je morgen te verdienen als je vandaag € 200 verdiend hebt? En gisteren € 100, eergisteren € 200 en drie dagen geleden € 100? Dit zijn je data en deze worden weergegeven door vier oranje punten. Om te voorspellen heb je...

Lees meer

Toepassing van Simulated Annealing

Lees meer

Matching van vraag en aanbod

Toepassing van Simulated Annealing Mijn vrouw heeft een terugkerend probleem. Ze werkt aan een universiteit waar ze ieder jaar zo’n 200 studenten moet toewijzen aan 20 scriptiebegeleiders. Met Excel als haar enige instrument en vele combinaties, een ondankbare taak....

Lees meer

In Amsterdam wordt je gemiddeld binnen 3,5 minuten opgehaald.

Lees meer

Wachten op Uber

In Amsterdam wordt je gemiddeld binnen 3,5 minuten opgehaald. Althans volgens Uber die de volgende disclaimer toevoegt  Deze aanrijtijden kunnen wegens drukte of andere omstandigheden variëren. Nu, hoe lang van tevoren moet u uw rit boeken? Je zou als volgt kunnen...

Lees meer

Onzekerheid is overal.

Lees meer

De onvermijdelijke onzekerheid

Onzekerheid is overal. Een belangrijk concept in de data-analyse is dat van onzekerheid. Het komt voort uit zowel de ruis in de metingen, alsmede door de eindige grootte van datasets. Kansrekening biedt een samenhangend kader om alle aanwezige informatie op te...

Lees meer

Die verbazingwekkende Gauss.

Lees meer

Gauss heeft nog een geheim

Die verbazingwekkende Gauss. De bekende Gaussische verdeling blijkt de unieke oplossing voor een ander belangrijk probleem. Stel, je weet alleen het eerste moment (gemiddelde) en het tweede moment (ruis vermogen)? Wat is "de beste" kansverdeling, gegeven deze weinige...

Lees meer

Data is geen Informatie.

Lees meer

Informatie en Data

Data is geen Informatie. Dit kan een verrassing zijn, maar het is waar. Data zijn niets anders dan de juiste administratie van metingen of waarnemingen, en niets minder. De gegevens zijn een lijst van waarden of getallen. Informatie een functie over een verdeling. En...

Lees meer