Ik vertel je dat ik twee kinderen heb en vraag je wat de waarschijnlijkheid is dat ik twee jongens heb. Om deze vraag te beantwoorden ga je onderzoeken wat je kent aangaande het gegeven. Dat wat je kent (en kan meten) zal het aantal mogelijke toestanden bepalen die moeten beschouwd worden. Je beseft bijvoorbeeld dat elk kind ofwel een jongen, ofwel een meisje is. Hieruit volgt dat ik me in 3 elkaar uitsluitende toestanden kan bevinden: ik heb twee jongens, twee meisjes, of een jongen en een meisje. Dus je besluit dat de waarschijnlijkheid dat ik twee jongens heb 1 toestand is, gedeeld door het totaal van elkaar uitsluitende toestanden, dus 1/3. Inderdaad: kijk je naar mijn twee kinderen dan zie je een van de drie elkaar uitsluitende toestanden. Je beschikt dus over een ervaarbare experimentele setting.
Maar nu kan ik je erop wijzen dat je meer kent en dat er een waarnemingssetting mogelijk is waarbij dat wat je meer kent een rol gaat spelen. Kinderen worden een voor een geboren, zelfs bij tweelingen is er een eerstgeborene (met jouw toestemming verwaarlozen we het geval waarbij er met een keizersnede een tweeling geboren wordt). Dus nu besef je dat ik me in 4 toestanden kan bevinden: jongen-jongen, jongen-meisje, meisje-jongen, meisje-meisje. Dus is het gevolg voor jou: de waarschijnlijkheid dat ik twee jongens heb is 1/4. We merken nu op dat dit een voorwaardelijke waarschijnlijkheid is: het is de waarschijnlijkheid dat ik twee jongens heb, gegeven dat ik twee kinderen heb en ik er rekening mee houd dat er een eerstgeborene is (en dat dit onderscheid dus belangrijk is en meespeelt in de manier waarop ik de hypothese ervaarbaar zal maken). Inderdaad: nu ga je niet meer naar mijn twee kinderen kijken, als waarnemingssetting zal je je nu verplaatsen in de situatie die mensen met hun kinderen beleven: het is een normale beleving dat een van de kinderen ouder dan het andere is en dat dit relevant is.
Het zal nu duidelijk zijn dat ik me in veel meer dan 4 toestanden kan bevinden indien we andere aspecten meenemen die belangrijk zijn. Tot nu toe beperkte ik me tot enkel de modellen “geslacht” (expliciet) en “eerst” (impliciet). We kunnen ons natuurlijk verder beperken en het model “naar school gaan” erbij betrekken. De waarschijnlijkheid dat ik twee schoolgaande jongens heb is dan 1/16. Elke specificatie (de oudste, schoolgaand) is equivalent met het gegeven dat we één van de kinderen op één andere manier zouden kunnen kennen die potentieel ook bij alle kinderen die ik moet beschouwen mogelijk is en in elk kind op een andere manier kan gerealiseerd zijn. We hebben dit het fijner kennen genoemd van een situatie. Naarmate we rekening houden met een steeds grotere fijnheid van kennen van de situatie zal de waarschijnlijkheid van het optreden ervan kleiner zijn.
Veronderstel nu dat ik je met de kennis dat kinderen één voor één geboren worden vertel dat ik twee kinderen heb waarvan één een jongen is. Van de oorspronkelijke 4 toestanden kan ik me nu slechts in 3 toestanden meer bevinden: meisje-meisje is uitgesloten. Dat is voor jou bekend. Gevolg voor jou: de waarschijnlijkheid dat ik twee jongens heb is 1/3. Dit is terug een voorwaardelijke waarschijnlijkheid: dat ik twee jongens heb gegeven dat ik twee kinderen heb en ik er rekening mee houd dat er een eerstgeborene is en dat ik minstens een jongen heb.
Zo kan ik je nog meer vertellen: bijvoorbeeld dat ik twee kinderen heb waarvan de oudste een jongen is. Van de 4 oorspronkelijke toestanden kan ik me nu slechts in 2 toestanden bevinden: jongen-jongen en jongen-meisje. Gevolg voor jou: de waarschijnlijkheid dat ik twee jongens heb is 1/2. Dit is weer een voorwaardelijke waarschijnlijkheid: dat ik twee jongens heb gegeven dat ik twee kinderen heb en ik er rekening mee houd dat er een eerstgeborene is en dat de oudste een jongen is. Wanneer ik je dus vertel dat ik twee kinderen heb is de toestand waarin ik me bevind fijner dan de toestand “ik heb twee kinderen waarvan één een jongen is”, toestand die op zijn beurt fijner is dan de toestand “ik heb twee kinderen waarvan het oudste een jongen is”. Een toestand die fijner moet beschreven worden, en waarvan de kennis dus steeds verder verruimt is ruimer dan een toestand die minder fijn kan beschreven worden en waarvoor geen ruime kennis nodig is. Die toestanden onderscheiden zich doordat ik telkens de context verder inperk, meer specificaties geef, meer onderscheidingen relevant vind en dus de kennis over de toestand verder verruimt. Dit heeft gevolgen voor de kennis van de mogelijke elkaar uitsluitende toestanden waarin ik me kan bevinden, en dus wat ik kan meten.
Niet alle specificaties geven me echter even veel informatie. Sommige specificaties kunnen simultaan gerealiseerd worden. Stel bijvoorbeeld dat ik je meedeel dat ik twee kinderen heb waarvan er één een baard heeft, wat is de waarschijnlijkheid dat ik een schoolgaand meisje heb? Het is duidelijk dat de onafhankelijkheid van specificaties een belangrijke rol zal spelen. We zullen daar op terugkomen en moeten dit nog preciezer omschrijven.
Een voorwaardelijke waarschijnlijkheid geeft weer hoeveel elkaar uitsluitende toestanden moeten onderscheiden worden en is dus afhankelijk van een bepaalde context.
Een voorwaardelijke waarschijnlijkheid wordt conventioneel genoteerd als P(A/B): de waarschijnlijkheid van A, gegeven B (met gerealiseerde of gekende B, B is dus ervaren). Met P(A∩B) wordt dan de waarschijnlijkheid weergegeven dat zowel A als B gegeven zijn (gerealiseerd zijn). Dit is de waarschijnlijkheid van het supremum van A en B, waarvan we veronderstellen dat deze 0 is wanneer A en B elkaar uitsluiten (het supremum is <<>>) en 1 wanneer A en B gerealiseerd zijn (het supremum is <>).
Veronderstel: A kan zich bevinden in a + n toestanden; B kan zich bevinden in b + n toestanden
Het totaal aantal (ruimste) toestanden is a + b + n. In n toestanden zijn zowel A als B simultaan gerealiseerd, en één van de totaal mogelijke toestanden, noem die x, wordt gerealiseerd.
Stel dat nu gegeven is dat B simultaan gerealiseerd is met de gerealiseerde toestand x, dan kunnen we ons afvragen: wat is de kans dat A simultaan gerealiseerd is?
Het is duidelijk dat het aantal mogelijke toestanden die we moeten beschouwen al sterk ingeperkt is, immers B is simultaan gerealiseerd, dus het totaal aantal mogelijke toestanden dat we moeten beschouwen is b + n. Hiervan zal een deel, namelijk n, simultaan A realiseren. Dus de kans dat A simultaan gerealiseerd is is n/(b+n), dus
P(A/B) = n.(b+n)-1
Merk op dat A en B zich in het verleden of de toekomst kunnen bevinden (de volgorde van optreden is in dit vraagstuk geen specificatie) en dat we het aantal toestanden waarin A zich kan bevinden niet moeten kennen, enkel het totaal aantal toestanden waarin B zich kan bevinden en het totaal aantal toestanden waarin ze zich beide kunnen bevinden moet gekend zijn.
Het totaal aantal mogelijke toestanden is a+b+n. Wanneer we teller en noemer nu delen door dit totaal, dus (n.(a+b+n)-1).((b+n).(a+b+n)-1)-1 is het duidelijk dat er met de hoger genoteerde afspraken geldt dat: P(A/B) = P(A∩B)/P(B)
Voorbeelden:
Stel dat ik je vraag wat de waarschijnlijkheid is dat ik twee jongens heb gegeven dat ik twee kinderen heb en er één eerstgeborene is dan is
P(A/B) = de waarschijnlijkheid dat ik twee jongens heb gegeven dat ik twee kinderen heb en er één eerstgeborene is
P(A∩B) = de waarschijnlijkheid dat ik twee jongens heb (kinderen) en er van twee kinderen één eerstgeborene is
P(B) = de waarschijnlijkheid dat er een eerstgeborene is.
P(A/B) = P(A∩B)/P(B) wordt nu P(A∩B)
Stel dat ik je vraag wat de waarschijnlijkheid is dat ik twee jongens heb gegeven dat ik twee kinderen heb waarvan er één een jongen is.
P(A/B) = de waarschijnlijkheid dat ik twee jongens heb gegeven het feit dat er van de twee kinderen reeds één een jongen is = de waarschijnlijkheid dat het tweede kind een jongen is
P(A∩B) = de waarschijnlijkheid dat ik twee jongens heb zonder verdere specificaties (als ik twee jongens heb dan is er simultaan reeds gegeven dat er één een jongen is)
P(B) = de waarschijnlijkheid dat er minstens één jongen is van de twee kinderen die ik heb.
P(A/B) = P(A∩B)/P(B) wordt nu (1/4)/(3/4) = 1/3
Stel dat ik je vraag wat de waarschijnlijkheid is dat ik twee jongens heb gegeven dat ik twee kinderen heb en de oudste een jongen is dan is
P(A/B) = de waarschijnlijkheid dat het tweede kind een jongen is
P(A∩B) = de waarschijnlijkheid dat ik twee jongens heb en er één jongen de oudste is
P(B) = de waarschijnlijkheid dat de oudste een jongen is.
P(A/B) = P(A∩B)/P(B) wordt nu (1/4)/(1/2) = 1/2
Stel nu dat wanneer B optreedt, ook A optreedt.
Stel dat B optreedt, wat is dan de waarschijnlijkheid voor het optreden van A? Per definitie is dat dus P(A/B), en aangezien P(A∩B) = 1 (A treedt simultaan met B op en B treedt op) volgt hieruit dat P(A/B) = P(A∩B)/P(B) geschreven wordt als P(A/B) = 1/1
Veronderstel nu dat wanneer B optreedt, ook A optreedt, en dat A inderdaad optreedt, wat is dan de waarschijnlijkheid voor het optreden van B? Per definitie is dat dus P(B/A), en aangezien P(B∩A) = P(B) (A treedt simultaan met B op en A treedt op, zodanig dat het optreden van zowel A als B enkel van het optreden van B afhangt) volgt hieruit dat P(B/A) = P(B∩A)/P(A) geschreven wordt als P(B/A) = P(B)/1 = P(B).
Contextafhankelijkheid van waarnemingen kunnen we ook demonstreren met een voorbeeld van een calibratie van een meetinstrument.
Studenten industrieel ontwerpen (een generalistische ingenieursopleiding) krijgen de opdracht om een product uit twee componenten te ontwerpen die met elkaar verbonden moeten zijn maar die ook terug moeten losgemaakt kunnen worden. Laten ze zich beïnvloeden door bestaande voorbeelden?
Een onderzoeker bereidt een context voor door 4 getekende voorbeelden te tonen van een snapverbinding en 1 van een moer/bout verbinding. Snapverbinding en moer/bout verbinding sluiten elkaar uit en realiseren simultaan een niet-permanente verbinding in een ingenieursmentaliteit. Men kan zich echter de vraag stellen of een snapverbinding als een niet permanente verbinding herkend wordt door gewone mensen. Aangezien de onderzoeker zichzelf niet als referentiepunt kan nemen hanteert hij een groep eerstejaars ingenieurstudenten als meetinstrument. De veronderstelling is dat ze nog niet zo diepgaand opgeleid zijn om al als ingenieurs te denken terwijl ze toch een natuurlijke interesse zouden kunnen vertonen voor verbindingstechnieken, waardoor ze zullen reageren als gewone mensen die gemotiveerd zijn om een verbinding los te maken. Ze krijgen de opdracht om zoveel mogelijk voorbeelden van getekende snap en moer/bout verbindingen met daarna ook de nieuw ontworpen verbindingen in twee groepen onder te brengen: permanent of niet permanent. De onderzoeker verwacht dat vermoedelijk niet alle snap maar zeker de moer/bout verbindingen zullen herkend worden als niet-permanent. De studenten krijgen daartoe serieel de tekeningen aangeboden gedurende x aantal seconden en noteren hun beslissing, de nieuw ontworpen verbindingen sluiten de rij. Bij analyse van de resultaten van de niet nieuw ontworpen verbindingen blijken hier 10% in de door de onderzoeker niet verwachte categorie geklasseerd te worden. Dat gebruikt hij als calibratie van dit meetinstrument: in 90% van de gevallen wordt een niet-permanente verbinding herkend. In 10% van de gevallen blijkt een niet-permanente als permanente herkend te worden. De categorie waarin de nieuw ontworpen verbindingen terecht komen zijn de effectieve meetresultaten waaruit de onderzoeker wil proberen af te leiden of de geteste ontwerpers zich door voorbeelden hebben laten leiden.
Noem nu H de herkenning van een niet-permanente verbinding bij de meting door de studenten.
Noem nu N de aanwezigheid van een niet-permanente verbinding.
Wat is nu P(N/H)?
De stelling van Bayes geeft:
P(N/H) = P(H/N)P(N)/(P(H/N)P(N) + P(H/<N>)P(<N>))
P(N/H) = 0,9*1/(0,9*1+0,1*0,8) = 0,92 en niet 100%