Aangezien de Bayesiaanse waarschijnlijkheidsrekening conceptueel het dichtst ligt bij het fundament van het haakformalisme is de hele waarschijnlijkheidsrekening op de meest directe manier in het haakformalisme voor te stellen door gebruik te maken van de inzichten van de Bayesiaanse waarschijnlijkheidsrekening. We zullen hiervoor de relatie van relevantie gebruiken waarvan we aangetoond hebben dat we met deze relatie een metrische afstand kunnen definiëren. Inderdaad, een waarschijnlijkheid is een positief getal P(E) tussen 0 en 1 dat we verbinden aan een gebeurtenis E. De gebeurtenis die met zekerheid optreedt en dus maximaal relevant is krijgt het getal 1, de onmogelijke gebeurtenis het getal 0. De gebeurtenis die met zekerheid optreedt is dat er een relevant spoor gerealiseerd wordt uit het universum Ω, universum dat eventueel niet a priori gekend is en dat we dank zij experimenten die sporen achterlaten beter en beter leren kennen. De onmogelijke gebeurtenis is hiervan de tegenpool en met de relatie van relevantie hebben we aangetoond dat de al-nul vector hiermee overeenkomt. De waarschijnlijkheid van een gebeurtenis die enkel kan gebeuren en die dus niet te kiezen is, is 0.

Essentieel is dus dat we de uitdrukking: de waarschijnlijkheid van E, gegeven H, genoteerd als P(E/H) in het haakformalisme kunnen uitdrukken. Hiertoe laten we ons leiden door de volgende hypothesen:

Alle waarschijnlijkheden die te verbinden zijn met E zijn dus het gevolg van een collaps van dezelfde tralie van potentiële punten, die zowel E als H kan opspannen, waarbij H niet onderscheiden wordt van <>. In het algemeen stellen we H dus voor als (<<>>⊕<H>) die enkel maar don't care bits heeft en 0 bits en dus niet te onderscheiden is van <> in een verder irrelevant universum. Daarenboven: een som van waarschijnlijkheden komt overeen met een XOR die niet van een OR kan onderscheiden worden en dus met een creatief product, wat een essentiële voorwaarde is om iets te kunnen gaan tellen.

In elk geval geldt dat de disjunctie <<E><H>><<E>H> niet kan onderscheiden worden van E. Inderdaad <<E><H>><<E>H>∼<<<<E><H>><<E>H>>>∼<<E><<<H>><H>>>∼<<E><H<H>>>∼<<E><<>>>∼<<E>>∼E, en ook wordt <<E><H>><<E>H> bij ervaren H niet anders dan <<E><<>>><<E><>>∼<<E>>∼E. We hebben dit ook genoteerd als het creatief product (E⊗E)H. We merken dan ook op dat de OR van de twee conjuncties <<E><H>> en <<E>H> niet te onderscheiden is van de XOR van deze twee omdat H en <H> elkaar uitsluiten. Dit betekent dat we kunnen tellen en dat er dus geldt de getalvergelijking P(E)=P(E∩H) + P(E∩<H>) met “+” de klassieke getalsom.

In de veronderstelling dat H niet kan onderscheiden worden van <>, en daarmee drukken we uit dat H “gegeven” is, een ervaren aspect van de ervaring nu, treedt het volgende op voor de drie termen

We moeten nu wijzen op een nieuwe notering die volledig compatibel is met de klassieke manier van doen: een product van waarschijnlijkheden geven we aan door gewone nevenschikking van “P” uitdrukkingen, bijvoorbeeld P(x)P(y) die niet onderscheiden is van het vectorproduct P(x)•P(y). Het bestaan van een invers voor het product (en dus normalisatie door de eenheid P(H)) wordt gegrond door het creatief product in geval associativiteit geldt, wat het geval is bij telbare uitdrukkingen (de toegevoegde onderscheiding heeft dezelfde ervaringswaarde als de andere onderscheidingen, ervaringswaarde die in dit geval zelfs gekend is: het is <<>>). Het delen van waarschijnlijkheden geven we aan met hetzelfde streepje als voor de voorwaardelijke waarschijnlijkheid, maar aangezien dit streepje tussen “P” uitdrukkingen staat, is er geen verwarring mogelijk, bijvoorbeeld P(x)/P(y). Als patroon is een deling van getallen niet verschillend van een product van getallen want een getal tussen 0 en 1 kan altijd geschreven worden als een getal 1/x met x groter dan 1 en een getal 1/x met x groter dan 1 kan altijd geschreven worden als een getal (1-y)/(1+y) met y=(x-1)/(x+1). De verhouding (1-y)/(1+y) is altijd te schrijven als een product (1-k)(1+k)=(1-k2) voor een k2=2y/(1+y)=(x-1)/x=1-1/x.

Er geldt dus:

P(E/H)=P(E∩H)/P(H)

Merk op dat dit een verdere specificatie is van de volledig analoge vergelijking waarin we het relevant universum Ω opnemen

P(E/Ω)=P(E∩Ω)/P(Ω)

Het is dus in te zien dat ook H verder kan gespecificeerd worden, bijvoorbeeld als H/H0 of dus H, gegeven H0.

En dus is de volgende vergelijking zinvol:

P(E/(H/H0))=P(E∩H/H0)/P(H/H0) op voorwaarde dat P(H/H0) verschillend is van 0.

P(E/H)=P(E∩H)/P(H) is dus niet te onderscheiden van P(E/(H/Ω))=P(E∩H/Ω)/P(H/Ω), wat de belangrijke rol van Ω onderstreept.

P(E/H)=P(E∩H)/P(H) is ook te schrijven als volgt:

P(E∩H)=P(E/H)P(H) en aangezien de conjunctie symmetrisch is geldt ook

P(E∩H)=P(H/E)P(E)

Dus geldt ook

P(E/H)P(H)=P(H/E)P(E)

of

P(H/E)/P(H)=P(E/H)/P(E)

De waarschijnlijkheid van “H in de collaps E” staat tot de waarschijnlijkheid van H, zoals de waarschijnlijkheid van “E in de collaps H” staat tot de waarschijnlijkheid van E.

De stelling van Bayes

Nu we de Bayesiaanse waarschijnlijkheidsrekening afgeleid hebben voor twee willekeurig gekozen punten E en H kunnen we de stelling van Bayes afleiden.

We maken hiertoe een selectie van elkaar uitsluitende punten A (bijvoorbeeld de AND-atomen <<A>i>). We zullen nu verder gebruik maken van de AND-atomen maar in het achterhoofd houden dat dit een van de vele mogelijke keuzen van elkaar uitsluitende punten is. De OR van de atomen is niet te onderscheiden van de XOR, en ze spannen samen een tralie op, wat betekent dat <> bereikt wordt wanneer de elkaar uitsluitende punten (bijvoorbeeld de AND-atomen) (opeenvolgend bijvoorbeeld) met elkaar nevengeschikt worden. Elke E uit de tralie is te bereiken door een nevenschikking van een selectie van elkaar uitsluitende punten, en als die E dan collapst naar <> wordt hierdoor de <> in een gecollapste tralie bereikt. In de vooronderstelling van waarschijnlijkheden zal een E die te kiezen is waarneembaar zijn als een AND-atoom dat niet te kiezen is en dus gekarakteriseerd kan worden door de waarde <<>>.

Voor elk AND-atoom geldt voor een E uit de tralie:

P(<<A>i>/E)/P(<<A>i>)=P(E/<<A>i>)/P(E) of

P(<<A>i>/E)=P(E/<<A>i>)P(<<A>i>)/P(E) wat een vorm is van de stelling van Bayes.

We kunnen dit nu nog anders noteren. We merkten immers al op dat altijd geldt dat een willekeurige E niet kan onderscheiden worden van een OR van een bepaalde selectie atomen (in het algemeen voor punten waarvan de OR niet te onderscheiden is van XOR). Deze selectie stellen we voor door de index j en we kunnen de verschillende E door de naam Ej voorstellen waarbij geldt dat

Ej↔<<A>i>j

Er geldt dus ook

Ej↔<<Ej><<<A>i>j>>

en dus

Ej↔<<<<Ej><A>i>j>>

Ej↔<<Ej><A>i>j

En aangezien de AND-atomen elkaar uitsluiten geldt dat OR en XOR niet verschillend zijn, zodat we kunnen tellen en er geldt dat de getallen

P(Ej)=P(<<Ej><A>i>j)=ΣjP(Ej∩<<A>i>)=ΣjP(Ej/<<A>i>)P(<<A>i>)

Dus P(<<A>i>/Ej)=P(Ej/<<A>i>)P(<<A>i>)/P(Ej) kan ook geschreven worden als

P(<<A>i>/Ej)=P(Ej/<<A>i>)P(<<A>i>)/ΣjP(Ej/<<A>i>)P(<<A>i>)

Deze laatste vorm van de stelling van Bayes maakt het duidelijk dat ΣjP(Ej/<<A>i>)P(<<A>i>) een normalisatiefactor is die optreedt wanneer een tralie collapst zodanig dat Ej ervaren is.