Data Analysis a Bayesian tutorial
Boekbespreking Data Analysis, a Bayesian tutorial. De tweede editie van dit boek is geschreven door Devinder Sivia (hoofdstukken 1 t/m 8) met John Skilling (hoofdstukken 9 en 10). Het boek geeft een bondige (in 250 pagina's), maar volledige beschrijving van de...
PRML
Boekbespreking Pattern Recognition and Machine Learning Pattern Recognition and Machine Learning is het vaak eerste boek dat ik raadpleeg als ik iets over een data onderwerp wil weten. Het is geschreven door Christopher Bishop in een heldere, vlotte stijl. Het is...
Hoe slim ben ik?
Wat is mijn IQ? Ik heb één keer meegedaan aan een IQ-test en scoorde 120 punten. Als data scientist vraag ik mij af: Wat is mijn IQ werkelijk? Want dit is maar één test. Volgens Wikipedia is de nauwkeurigheid van de IQ-test ongeveer 3 punten. Dus mijn werkelijke IQ...
de Bayesiaanse aanpak
Gebruik alles wat je weet You cannot do inference without making assumptions - Sir David MacKay (1967 – 2016) In Wat is je Model? werd de vraag gesteld: Hoeveel denk je morgen te verdienen als je vandaag €200 verdiend hebt? En gisteren €100, eergisteren...
Wat is je model?
De beste fit is niet het beste model Hoeveel denk je morgen te verdienen als je vandaag € 200 verdiend hebt? En gisteren € 100, eergisteren € 200 en drie dagen geleden € 100? Dit zijn je data en deze worden weergegeven door vier oranje punten. Om te voorspellen heb je...
Matching van vraag en aanbod
Toepassing van Simulated Annealing Mijn vrouw heeft een terugkerend probleem. Ze werkt aan een universiteit waar ze ieder jaar zo’n 200 studenten moet toewijzen aan 20 scriptiebegeleiders. Met Excel als haar enige instrument en vele combinaties, een ondankbare taak....
Wachten op Uber
In Amsterdam wordt je gemiddeld binnen 3,5 minuten opgehaald. Althans volgens Uber die de volgende disclaimer toevoegt Deze aanrijtijden kunnen wegens drukte of andere omstandigheden variëren. Nu, hoe lang van tevoren moet u uw rit boeken? Je zou als volgt kunnen...
De onvermijdelijke onzekerheid
Onzekerheid is overal. Een belangrijk concept in de data-analyse is dat van onzekerheid. Het komt voort uit zowel de ruis in de metingen, alsmede door de eindige grootte van datasets. Kansrekening biedt een samenhangend kader om alle aanwezige informatie op te...
Gauss heeft nog een geheim
Die verbazingwekkende Gauss. De bekende Gaussische verdeling blijkt de unieke oplossing voor een ander belangrijk probleem. Stel, je weet alleen het eerste moment (gemiddelde) en het tweede moment (ruis vermogen)? Wat is "de beste" kansverdeling, gegeven deze weinige...
Informatie en Data
Data is geen Informatie. Dit kan een verrassing zijn, maar het is waar. Data zijn niets anders dan de juiste administratie van metingen of waarnemingen, en niets minder. De gegevens zijn een lijst van waarden of getallen. Informatie een functie over een verdeling. En...