Eiwitsynthese

Werk-in-uitvoering

In levende cellen worden eiwitten gesynthetiseerd door aminozuren met elkaar in een lange keten te verbinden. Eiwitten zijn de bouwstenen van levende materie en de genen van een organisme bepalen welke eiwitten het kan synthetiseren. Aan de hand van de genetische code kan de DNA-sequentie van een gen vertaald worden in de aminozuur-sequentie van een eiwit. Dit proces wordt eiwitexpressie genoemd. Bij de transcriptie wordt het DNA van een gen (een dubbele helix) eerst gekopieerd naar mRNA (een enkelvoudige helix), en het mRNA wordt vervolgens bij de translatie vertaald naar een eiwit door de actie van tRNA.

We hebben aangetoond dat het creatief product een getrouwe modellering is van een essentiële bouwsteen: een triplet in de sequentie. Er zijn veel “dialecten” bekend in de taal die door triplets opgebouwd kan worden en die specifiek zijn voor een organisme. Maar essentieel is dat al deze talen logisch zijn, een triplet is namelijk een lokale interpretatie van conjunctie of disjunctie van onderscheidingen.

Voor elke toepassing zal dus de geschikte vertaling moeten gezocht worden.

Onderzoekers die de genetische code vanuit datastructuren benaderen zijn bijvoorbeeld Diego Luis Gonzalez, Elena Fimmel, Mario Enrique Duarte-Gonzalez, Sergey V. Petoukhov.

Gonzales heeft een alternatieve mathematische structuur voorgesteld die blijkbaar ook op zelfdualiteit gebouwd is en waarmee hij de lokale sterke correlatie van coderingen in het DNA kan aantonen.

Fimmel benadrukt de dichotomie, en dit herkennen we want het is zelfs het basisaxioma van het haakformalisme.

Petoukhov modelleert op basis van matrices, wat uiteraard ook een benadering is die in het haakformalisme beschikbaar is.

Uit alle feiten die bekend zijn over de combinaties van nucleotiden valt het op dat de duplets in een triplet een belangrijke rol spelen. Men kan een onderscheid maken tussen geordende tripletten waarin het eerste duplet bepalend is voor het eiwit dat gesynthetiseerd wordt (die dupletten noemt men “sterk”), en tripletten waarin het laatste nucleotide bepalend is (die dupletten noemt men “zwak”). De vier duplets beginnend met een C zijn sterk, behalve CA en de vier duplets met een G zijn sterk, behalve GA. De vier duplets met een A zijn zwak, behalve AC en de vier duplets met een U zijn zwak, behalve UC. Dit komt overeen “sterk” als drie H-bruggen en “zwak” als twee H-bruggen. Dit resulteert in twee groepen van 32 triplets. Dit wordt in het volgende schema weergegeven die de 26 waargenomen sporen geven van de actie van de 64 triplets bij de productie van de sporen:

Noteer: UGA is een Cys in geval U gelijk is aan T, UGA is een Stop als T gelijk is aan U (zie Gonzalez non-power lijst), nog verder te checken.

64 mogelijkheden is onder verdelen in 4*7+4*9, een som eerste patroon 100, 010 en 001 en 111 (28) en tweede patroon 110, 011, 101 en 000 (36). Dit is niet symmetrisch. Is dit symmetrisch te maken? 4*7+4*(1+1)+4*7 door één extra onderscheiding en wat is die dan?

Er zijn 8 zelfduale kolommen mogelijk en 7 andersduale.

Stel:

Van zes onderscheidingen met één laatst toegevoegde zijn er vijf die overblijven voor de sporen.

Kwadrant met start codon	Tweede codon	Derde codon		Aminozuur
U	U	U, C	x	Phe
U	U	A, G	x	Leu
U	A	U, C	x	Tyr
U	A	A, G		Stop
U	G	U, C	x	Cys
U	G	A, G	x	Stop, Trp
C	A	U, C	x	His
C	A	A, G	x	Gln
A	U	U, C; A	x	Ile
A	U	G	x	Met en Start
A	A	U, C	x	Asn
A	A	A, G	x	Lys
A	G	U, C	x	Ser
A	G	A, G	x	Arg
G	A	U, C	x	Asp
G	A	A, G	x	Glu

Kwadrant met start codon	Tweede codon	Derde codon		Aminozuur
U	C	U, C, A, G	x	Ser
C	U, C, G	U, C, A, G	x	Leu, Pro, Arg
A	C	U, C, A, G	x	Thr
G	U, C, G	U, C, A, G	xxx	Val, Ala, Gly

Er blijkt hieruit dat alle duplets commutatief zijn, behalve twee: CA en AC die zich op dat vlak onderscheiden en UG en GU die zich ook op die manier onderscheiden. Het patroon dat hier naar boven komt is terug het 3&1 schema (2 op 6 duplets) en de niet commutativiteit kan dan voorgesteld worden door het creatief product. Deze informatie is dan ook als volgt voor te stellen (met het symbool * voor een disjunctie):

CCC*CCU*CCA*<CCG>→Pro

CUC*CUU*CUA*CUG→Leu

CGC*CGU*CGA*CGG→Arg

ACC*ACU*ACA*ACG→Thr

UCC*UCU*UCA*UCG→Ser

GCC*GCU*GCA*GCG→Ala

GUC*GUU*GUA*GUG→Val

GGC*GGU*GGA*GGG→Gly

Matrix benadering

Dit betekent dat dit ook met matrices moet kunnen voorgesteld worden. Door het feit dat we elke nucleotide in drie onderscheidingen moeten voorstellen zijn de matrices die overeenkomen met nucleotiden dus 8x8 matrices. De dupletten kunnen we dan in een Hadamard matrix verzamelen in een 1-splitsing universum. Dit genereert de volgende vier Hadamard matrices:

CC	CU		GC	GU		AC	AU		UC	UU
CG	CA		GG	GA		AG	AA		UG	UA

We hebben nu de 16 dupletten in een handige vorm voorgesteld (eigenlijk stellen we elke cel voor als een 16x16 matrix) en dan kunnen we met het Kronecker product overgaan naar tripletten. We geven een voorbeeld met het eerste duplet dat we met het Kronecker product uitbreiden tot een triplet. Elke cel staat dan voor een matrix van 24x24.

CCC	CCU	CUC	CUU
CCG	CCA	CUG	CUA
CGC	CGU	CAC	CAU
CGG	CGA	CAG	CAA

We wijzen er dan op dat de Hadamard structuur behouden blijft.

Op die manier worden de 64 tripletten bekomen, elk in zijn representatie van een 24x24 matrix, die de 20 aminozuren genereren en waarvan drie van de tripletten een “stop” functie hebben.

Nog verder opkuisen en afwerken

De reden dat men maar tot tripletten moet gaan is dat de vierde macht van matrices altijd de eenheid zal geven, zie http://designforeveryone.ugent.be/Werkelijkheid/Uitbreidingen_van_het_1_splitsing_universum.html

We merken op dat in een drie onderscheidingen universum het centraal niveau waar de onderscheidingen zich bevinden bereikt wordt door vier in plaats van door drie vectorproducten van toestanden. Blijkbaar zijn er slechts drie van deze sporen nodig, we kunnen dat als volgt begrijpen: slechts twee combinaties van duplets vormen twee atoomburen die op een twee onderscheidingen universum af te beelden zijn: CG=C•G is <<c>> en AG=A•G is <a>. Deze leiden tot een nieuwe binaire codering, de eerste is “strong”, de tweede “weak” als eerste elementen in een triplet. De andere duplets scheiden niet één, maar twee of drie onderscheidingen af, namelijk het gemeenschappelijke in C&A is b want <<a><c>><ac> is <<<<a><c>><ac>>> is <<<a•c>>>, C&U is a want <<a><c>><<a>bc> is <<a><<<c>><bc>>> is <<a><b•c>>, A&U is <c> want <ac><<a>bc> is <c<<a><<a>b>>> is <c<a•b>>, G&U is <> want <a<c>><<a>bc> is <<<>>a<c>><<<>><a>bc> is <<<>><<a<c>><<a>bc>>> is <<<>><<a•c><<b•c>>> is <<<>><<a•b><<b•c>>>. Het patroon is xAND(XOR van …). Op die manier hebben we de mogelijkheid om de hele tralie voor te stellen die opgebouwd wordt door <<>>, a, b en c. Dit zijn de onderscheidingen en dus ook de afgeleiden naar de vectorproducten. Dat betekent dus dat met een goede selectie van vier toestanden de hele tralie van drie onderscheidingen op te bouwen is!

De waterstofbruggen worden enkel gevormd door CG of <<c>> en AU of <c<a•b>>

Relatie met de genetische code

Hebben de drie termen van een creatief product iets te maken met de drie codons?

Elk van de vier componenten, <s•p>, <s•q>, <r•p> en r•q, is af te beelden op een AND atoom van het twee onderscheidingen universum.

Oorspronkelijke tabel: 64 cellen, is 4³.

	C	C	G	G	U	U	A	A
C	CCC	Pro	CGC	Arg	CUC	Leu	CAC	His
	CCG	Pro	CGG	Arg	CUG	Leu	CAG	Gln
	CCU	Pro	CGU	Arg	CUU	Leu	CAU	His
	CCA	Pro	CGA	Arg	CUA	Leu	CAA	Gln
G	GCC	Ala	GGC	Gly	GUC	Val	GAC	Asp
	GCG	Ala	GGG	Gly	GUG	Val	GAG	Glu
	GCU	Ala	GGU	Gly	GUU	Val	GAU	Asp
	GCA	Ala	GGA	Gly	GUA	Val	GAA	Glu
U	UCC	Ser	UGC	Cys	UUC	Phe	UAC	Tyr
	UCG	Ser	UGG	Trp	UUG	Leu	UAG	Stop
	UCU	Ser	UGU	Cys	UUU	Phe	UAU	Tyr
	UCA	Ser	UGA	Stop	UUA	Leu	UAA	Stop
A	ACC	Thr	AGC	Ser	AUC	Ile	AAC	Asn
	ACG	Thr	AGG	Arg	AUG	Met	AAG	Lys
	ACU	Thr	AGU	Ser	AUU	Ile	AAU	Asn
	ACA	Thr	AGA	Arg	AUA	Ile	AAA	Lys

<s•p>, <s•q>, <r•p> en r•q

<<<s•p>>*<<s•q>>*<<r•p>>*<r•q>>=<<>>, dus <s•p>, <s•q>, <r•p> en r•q sluiten elkaar vier-aan-vier uit, zonder dat ze elkaar twee-aan-twee uitsluiten.

Hieruit volgt

<<<s•p>>*<<s•q>>*<<r•p>>*<r•q>>*s•p=s•p

<<<s•q>>*<<r•p>>*<r•q>>*s•p=s•p op die manier is elk spoor in vier sporen uit te drukken.

<<s•p>>*<<s•q>>*<<r•p>>*<r•q>=<>

Er geldt ook dat <s•p>•<s•q>•<r•p>•r•q=<s•p•s•q•r•p•r•q>=<> en dus geldt dat <<<s•p>>•<<s•q>>•<<r•p>>•<<r•q>>>=<<s•p>>*<<s•q>>*<<r•p>>*<r•q>

<s•p>*<s•q>*<r•p>*<<r•q>>=<s•p>•<s•q>•<r•p>•r•q. Er is dus geen verschil tussen disjunctie (OR) en vectorproduct (XOR). Dit is een eigenschap van welgevormde haakuitdrukkingen die elkaar uitsluiten.