Werk-in-uitvoering

In levende cellen worden eiwitten gesynthetiseerd door aminozuren met elkaar in een lange keten te verbinden. Eiwitten zijn de bouwstenen van levende materie en de genen van een organisme bepalen welke eiwitten het kan synthetiseren. Aan de hand van de genetische code kan de DNA-sequentie van een gen vertaald worden in de aminozuur-sequentie van een eiwit. Dit proces wordt eiwitexpressie genoemd. Bij de transcriptie wordt het DNA van een gen (een dubbele helix) eerst gekopieerd naar mRNA (een enkelvoudige helix), en het mRNA wordt vervolgens bij de translatie vertaald naar een eiwit door de actie van tRNA.

We hebben aangetoond dat het creatief product een getrouwe modellering is van een essentiële bouwsteen: een triplet in de sequentie. Er zijn veel “dialecten” bekend in de taal die door triplets opgebouwd kan worden en die specifiek zijn voor een organisme. Maar essentieel is dat al deze talen logisch zijn, een triplet is namelijk een lokale interpretatie van conjunctie of disjunctie van onderscheidingen.

Voor elke toepassing zal dus de geschikte vertaling moeten gezocht worden.

Onderzoekers die de genetische code vanuit datastructuren benaderen zijn bijvoorbeeld Diego Luis Gonzalez, Elena Fimmel, Mario Enrique Duarte-Gonzalez, Sergey V. Petoukhov.

Gonzales heeft een alternatieve mathematische structuur voorgesteld die blijkbaar ook op zelfdualiteit gebouwd is en waarmee hij de lokale sterke correlatie van coderingen in het DNA kan aantonen.

Fimmel benadrukt de dichotomie, en dit herkennen we want het is zelfs het basisaxioma van het haakformalisme.

Petoukhov modelleert op basis van matrices, wat uiteraard ook een benadering is die in het haakformalisme beschikbaar is.

Uit alle feiten die bekend zijn over de combinaties van nucleotiden valt het op dat de duplets in een triplet een belangrijke rol spelen. Men kan een onderscheid maken tussen geordende tripletten waarin het eerste duplet bepalend is voor het eiwit dat gesynthetiseerd wordt (die dupletten noemt men “sterk”), en tripletten waarin het laatste nucleotide bepalend is (die dupletten noemt men “zwak”). De vier duplets beginnend met een C zijn sterk, behalve CA en de vier duplets met een G zijn sterk, behalve GA. De vier duplets met een A zijn zwak, behalve AC en de vier duplets met een U zijn zwak, behalve UC. Dit komt overeen “sterk” als drie H-bruggen en “zwak” als twee H-bruggen. Dit resulteert in twee groepen van 32 triplets. Dit wordt in het volgende schema weergegeven die de 26 waargenomen sporen geven van de actie van de 64 triplets bij de productie van de sporen:

Noteer: UGA is een Cys in geval U gelijk is aan T, UGA is een Stop als T gelijk is aan U (zie Gonzalez non-power lijst), nog verder te checken.

64 mogelijkheden is onder verdelen in 4*7+4*9, een som eerste patroon 100, 010 en 001 en 111 (28) en tweede patroon 110, 011, 101 en 000 (36). Dit is niet symmetrisch. Is dit symmetrisch te maken? 4*7+4*(1+1)+4*7 door één extra onderscheiding en wat is die dan?

Er zijn 8 zelfduale kolommen mogelijk en 7 andersduale.

Stel:

Van zes onderscheidingen met één laatst toegevoegde zijn er vijf die overblijven voor de sporen.



Kwadrant met start codon

Tweede codon

Derde codon


Aminozuur

U

U

U, C

x

Phe

U

U

A, G

x

Leu

U

A

U, C

x

Tyr

U

A

A, G


Stop

U

G

U, C

x

Cys

U

G

A, G

x

Stop, Trp

C

A

U, C

x

His

C

A

A, G

x

Gln

A

U

U, C; A

x

Ile

A

U

G

x

Met en Start

A

A

U, C

x

Asn

A

A

A, G

x

Lys

A

G

U, C

x

Ser

A

G

A, G

x

Arg

G

A

U, C

x

Asp

G

A

A, G

x

Glu



Kwadrant met start codon

Tweede codon

Derde codon


Aminozuur

U

C

U, C, A, G

x

Ser

C

U, C, G

U, C, A, G

x

Leu, Pro, Arg

A

C

U, C, A, G

x

Thr

G

U, C, G

U, C, A, G

xxx

Val, Ala, Gly





Er blijkt hieruit dat alle duplets commutatief zijn, behalve twee: CA en AC die zich op dat vlak onderscheiden en UG en GU die zich ook op die manier onderscheiden. Het patroon dat hier naar boven komt is terug het 3&1 schema (2 op 6 duplets) en de niet commutativiteit kan dan voorgesteld worden door het creatief product. Deze informatie is dan ook als volgt voor te stellen (met het symbool * voor een disjunctie):

CCC*CCU*CCA*<CCG>→Pro

CUC*CUU*CUA*CUG→Leu

CGC*CGU*CGA*CGG→Arg

ACC*ACU*ACA*ACG→Thr

UCC*UCU*UCA*UCG→Ser

GCC*GCU*GCA*GCG→Ala

GUC*GUU*GUA*GUG→Val

GGC*GGU*GGA*GGG→Gly



Matrix benadering

Dit betekent dat dit ook met matrices moet kunnen voorgesteld worden. Door het feit dat we elke nucleotide in drie onderscheidingen moeten voorstellen zijn de matrices die overeenkomen met nucleotiden dus 8x8 matrices. De dupletten kunnen we dan in een Hadamard matrix verzamelen in een 1-splitsing universum. Dit genereert de volgende vier Hadamard matrices:

CC

CU


GC

GU


AC

AU


UC

UU

CG

CA


GG

GA


AG

AA


UG

UA

We hebben nu de 16 dupletten in een handige vorm voorgesteld (eigenlijk stellen we elke cel voor als een 16x16 matrix) en dan kunnen we met het Kronecker product overgaan naar tripletten. We geven een voorbeeld met het eerste duplet dat we met het Kronecker product uitbreiden tot een triplet. Elke cel staat dan voor een matrix van 24x24.

CCC

CCU

CUC

CUU

CCG

CCA

CUG

CUA

CGC

CGU

CAC

CAU

CGG

CGA

CAG

CAA

We wijzen er dan op dat de Hadamard structuur behouden blijft.

Op die manier worden de 64 tripletten bekomen, elk in zijn representatie van een 24x24 matrix, die de 20 aminozuren genereren en waarvan drie van de tripletten een “stop” functie hebben.

Nog verder opkuisen en afwerken

De reden dat men maar tot tripletten moet gaan is dat de vierde macht van matrices altijd de eenheid zal geven, zie http://designforeveryone.ugent.be/Werkelijkheid/Uitbreidingen_van_het_1_splitsing_universum.html

We merken op dat in een drie onderscheidingen universum het centraal niveau waar de onderscheidingen zich bevinden bereikt wordt door vier in plaats van door drie vectorproducten van toestanden. Blijkbaar zijn er slechts drie van deze sporen nodig, we kunnen dat als volgt begrijpen: slechts twee combinaties van duplets vormen twee atoomburen die op een twee onderscheidingen universum af te beelden zijn: CG=C•G is <<b><c>> en AG=A•G is <a<b>>. Deze leiden tot een nieuwe binaire codering, de eerste is “strong”, de tweede “weak” als eerste elementen in een triplet. De andere duplets scheiden niet één, maar twee of drie onderscheidingen af, namelijk het gemeenschappelijke in C&A is b want <<a><b><c>><a<b>c> is <<b><<<a><c>><ac>>> is <<b><<a•c>>>, C&U is a want <<a><b><c>><<a>bc> is <<a><<<b><c>><bc>>> is <<a><b•c>>, A&U is <c> want <a<b>c><<a>bc> is <c<<a<b>><<a>b>>> is <c<a•b>>, G&U is <> want <a<b><c>><<a>bc> is <<<>>a<b><c>><<<>><a>bc> is <<<>><<a<b><c>><<a>bc>>> is <<<>><<a•c><<b•c>>> is <<<>><<a•b><<b•c>>>. Het patroon is xAND(XOR van …). Op die manier hebben we de mogelijkheid om de hele tralie voor te stellen die opgebouwd wordt door <<>>, a, b en c. Dit zijn de onderscheidingen en dus ook de afgeleiden naar de vectorproducten. Dat betekent dus dat met een goede selectie van vier toestanden de hele tralie van drie onderscheidingen op te bouwen is!

De waterstofbruggen worden enkel gevormd door CG of <<b><c>> en AU of <c<a•b>>



Relatie met de genetische code

Hebben de drie termen van een creatief product iets te maken met de drie codons?

Elk van de vier componenten, <s•p>, <s•q>, <r•p> en r•q, is af te beelden op een AND atoom van het twee onderscheidingen universum.

Oorspronkelijke tabel: 64 cellen, is 43.


C

C

G

G

U

U

A

A

C

CCC

Pro

CGC

Arg

CUC

Leu

CAC

His


CCG

Pro

CGG

Arg

CUG

Leu

CAG

Gln


CCU

Pro

CGU

Arg

CUU

Leu

CAU

His


CCA

Pro

CGA

Arg

CUA

Leu

CAA

Gln

G

GCC

Ala

GGC

Gly

GUC

Val

GAC

Asp


GCG

Ala

GGG

Gly

GUG

Val

GAG

Glu


GCU

Ala

GGU

Gly

GUU

Val

GAU

Asp


GCA

Ala

GGA

Gly

GUA

Val

GAA

Glu

U

UCC

Ser

UGC

Cys

UUC

Phe

UAC

Tyr


UCG

Ser

UGG

Trp

UUG

Leu

UAG

Stop


UCU

Ser

UGU

Cys

UUU

Phe

UAU

Tyr


UCA

Ser

UGA

Stop

UUA

Leu

UAA

Stop

A

ACC

Thr

AGC

Ser

AUC

Ile

AAC

Asn


ACG

Thr

AGG

Arg

AUG

Met

AAG

Lys


ACU

Thr

AGU

Ser

AUU

Ile

AAU

Asn


ACA

Thr

AGA

Arg

AUA

Ile

AAA

Lys









<s•p>, <s•q>, <r•p> en r•q

<<<s•p>>*<<s•q>>*<<r•p>>*<r•q>>=<<>>, dus <s•p>, <s•q>, <r•p> en r•q sluiten elkaar vier-aan-vier uit, zonder dat ze elkaar twee-aan-twee uitsluiten.

Hieruit volgt

<<<s•p>>*<<s•q>>*<<r•p>>*<r•q>>*s•p=s•p

<<<s•q>>*<<r•p>>*<r•q>>*s•p=s•p op die manier is elk spoor in vier sporen uit te drukken.



<<s•p>>*<<s•q>>*<<r•p>>*<r•q>=<>

Er geldt ook dat <s•p>•<s•q>•<r•p>•r•q=<s•p•s•q•r•p•r•q>=<> en dus geldt dat <<<s•p>>•<<s•q>>•<<r•p>>•<<r•q>>>=<<s•p>>*<<s•q>>*<<r•p>>*<r•q>

<s•p>*<s•q>*<r•p>*<<r•q>>=<s•p>•<s•q>•<r•p>•r•q. Er is dus geen verschil tussen disjunctie (OR) en vectorproduct (XOR). Dit is een eigenschap van welgevormde haakuitdrukkingen die elkaar uitsluiten.