Waarnemen of meten gebeurt “in de tijd”. Het gebeurt altijd in een groter onderscheidingen universum dan het universum dat nodig en voldoende is om de aspecten of entiteiten die gemeten worden te beschrijven.
Bijvoorbeeld: wit (waarde van het aspect kleur) is slechts waarneembaar aan een wit object (entiteit) dat zich onderscheidt ten opzichte van een anderskleurige context en is dus context afhankelijk en dus een onderscheidingen universum dat groter is dan wat nodig is om “wit” te beschrijven. Kleur heeft enkel betekenis voor agentia die kleur kunnen onderscheiden.
Dit groter universum heeft een vluchtige component: wat we nu ervaren sluit een ander ervaren nu uit. Er is minimaal altijd één onderscheiding die niet ingebouwd wordt in het universum dat we als stabiel (of invariant) waarnemen. Die onderscheiding is maar op één moment relevant en niet herhaalbaar. Dat creëert tijd. We hebben gezien dat inbedding symmetrie voor de laatste onderscheiding tijd modelleert en eveneens een telbare entiteit kan modelleren. Dit betekent dat we van een toestand van een entiteit naar een andere toestand evolueren en dat die toestanden elkaar uitsluiten, niet simultaan ervaarbaar zijn.
Om waar te nemen kunnen wel altijd voor iets kiezen, dat betekent dat er een gebeurtenis kan gekozen worden die hopelijk stabiel blijft, simultaan ervaren blijft, tijdens de evolutie van vluchtige toestand naar vluchtige toestand. Het is immers onvermijdelijk dat ik, als voorbeeld van een agens, altijd iets ervaar. We merken nu op dat we voor de momentane (dus vluchtige) toestanden niet kunnen kiezen, ze gebeuren ons en er is een niveau waarop we ze niet kunnen en willen sturen. In de Nederlandse taal hebben we daar een woord voor: ze blijken. Dikwijls willen we immers dat de meetmethode de dynamiek van het gedrag van het aspect of de entiteit die gemeten wordt niet verstoort. Dit betekent dat de aspecten die we zouden toevoegen tijdens het meten zelf de relevante aspecten van de entiteit niet veranderen. Het aspect of de entiteit kan dan ongewijzigd met dezelfde onderscheidingen beschreven worden en is een invariante van de waarneming. Het meten zal dan geen invloed hebben op wat er gebeurt (de dynamiek, dat wat blijkt) in de relevante toestandsruimte. Sommige waarnemingscontexten zullen we bewust toevallig houden om de situatie niet in een of andere richting te beïnvloeden (door een bepaalde keuze). We beseffen wel dat we tijdens de meting aspecten van de entiteit zullen veranderen (anders zou er geen interactie zijn met de meetmethode) maar die veranderende aspecten zijn niet de aspecten die ons echt interesseren, namelijk de aspecten die verantwoordelijk zijn voor de “autonome” (zelforganiserende of "niet te kiezen") dynamiek van de entiteit in een toestandsruimte met meer onderscheidingen dan de onderscheidingen die nodig zijn om de entiteit te beschrijven. De aspecten die veranderen tijdens de meting zijn bijvoorbeeld uniek voor slechts de concreet gekozen entiteit die gemeten werd, en niet gemeenschappelijk voor alle potentieel te kiezen entiteiten die ons interesseren, het zouden dus geen generieke aspecten zijn, die dus door veel minder onderscheidingen gekarakteriseerd worden dan door de onderscheidingen die voor de unieke gemeten entiteit moeten gebruikt worden en die we, zonder dat ze invloed hebben op de meting, kunnen en moeten laten gebeuren.
Hoe weten we operationeel dat we met zo’n aspecten te maken hebben?
Als we veel metingen uitvoeren zullen er ook altijd andere aspecten optreden dan de aspecten die we verwachten. We kunnen dan op zoek gaan naar afwijkingen die we als meetfouten moeten klasseren omdat aspecten meespelen die de bedoelde aspecten beïnvloeden en dus in het gesloten systeem van de meting moeten opgenomen worden omdat ze de identiteit zelf van de meting veranderen. Meetfouten zijn toegevoegde aspecten die ANDERS zijn dan de bedoelde die stabiel verondersteld worden tijdens de meting en die we dus willen vermijden. Merk op dat dit verschillend is van willekeurige, of niet relevante aspecten die we mogen, moeten en kunnen laten gebeuren.
Voorbeelden
In een destructieve test kunnen we aantonen dat een vervoermiddel de inzittenden zal beschermen tijdens een calamiteit. Deze test doen we op een testentiteit die slechts wat betreft de relevante onderscheidingen gelijkt op alle vervoermiddelen die we willen bouwen. En we gaan er dus van uit dat alle gebouwde vervoermiddelen dat aspect zullen vertonen indien zij ooit die gemodelleerde calamiteit zouden meemaken. Kunnen we echter alle denkbare destructieve situaties testen, hebben we de identiteit van het voertuig hiermee niet veranderd? En waar gaan we stoppen om op een recursieve manier andere aspecten hierbij te betrekken?
Om een entiteit waar te nemen kan ik het “verlichten” met een elektromagnetische straling en de patronen in de reflectie hiervan onderzoeken, ik kan bijvoorbeeld dieren observeren met zichtbaar licht of met een voor hen niet waarneembaar licht (straling). Door interactie kan de straling echter het gedrag van de entiteit veranderen en wanneer dat juist de aspecten van de entiteit zijn die ons interesseren dan zouden we door die keuze van het meetinstrument een systematische fout maken in de waarnemingen en zouden we dat als meetfout moeten klasseren.
Ik kan aan een gebruiker vragen om een tafel te verplaatsen, maar ik kan ook aan een gebruiker vragen of deze tafel niet te zwaar is. In het eerste geval kan hij een gedrag vertonen waarbij het gewicht van de tafel helemaal niet relevant is (bijvoorbeeld de tafel wegrollen), in het tweede geval heb ik hem door mijn vraagstelling al beïnvloed naar datgene wat ik als onderzoeker zelf relevant vond en zo beïnvloed ik zijn gedrag en de taal waarmee hij over zijn gedrag zal spreken. Uiteraard kan dit gewenst zijn of niet gewenst en al dan niet als meetfout geklasseerd moeten worden.
Zal een werknemer een vraag op een andere manier beantwoorden als deze gesteld wordt door zijn rechtstreekse chef of door een buitenstaander?
Kunnen we de consument gewoon maar naar zijn voorkeuren vragen? Kan de consument wel zijn voorkeuren uitspreken, of zelfs uitdrukken in een door ons opgestelde schaal (veel, matig, weinig,..., vaak, zelden, nooit,...)? Meten we met die uitspraken wel enkel voorkeuren, en niet een bepaalde voorlopig onbekende combinatie van houdingen?
Het onderzoek naar de structuur van een meetmethode moet ons voor ongewenste effecten behoeden en dat is voor ons een belangrijk criterium als we aan wetenschap willen doen. We noemen “wetenschappelijk” datgene wat “iedereen” kan ervaren, mits zich in dezelfde context te bevinden. Maar voor sommige aspecten moeten daarvoor laboratoria gecreëerd worden om de context ondubbelzinnig vast te leggen. Dit is trouwens de reden waarom laboratoria ontstaan zijn: in een maatschappij waar niet ervaarbare en herhaalbare dogma's overheersen zal een laboratorium een verademing zijn. Maar: de entiteiten die “iedereen” genoemd worden, worden dan impliciet gedefinieerd door een laboratorium. “Iedereen” is de impliciete definitie van de agentia die interageren in de context van een laboratorium zoals in het laboratorium verwacht wordt (waarvoor misschien een specifieke opleiding vereist is). Men kan de ervaarbare aspecten soms alleen maar vinden in acties die soms tot in het absurde beperkt worden in een vooraf vastliggende context, de essentie van laboratoria. “Iedereen” is, zoals elke entiteit, een constructie, zoals de entiteit “aap” dit is, “belg” dit is, “student” dit is enz…. Breng hem in de door jou geconstrueerde context en hij wordt waargenomen als “aap”, “belg” of “student”. Ontwerpers worden daarmee geconfronteerd wanneer ze ook zoals in het laatste voorbeeld de meetmethode moeten ontwerpen om de gewenste context te creëren want de context IS specifiek EN belangrijk OMDAT de stakeholder waarneemt met zijn mogelijkheden en beperkingen in die context en ontwerpers de stakeholder moeten respecteren.
In deze inleiding herkennen we nu een aantal belangrijke aspecten van het waarnemen die verder onderzocht worden. Dit leidt tot de volgende eisen die gesteld moeten worden aan elke waarneming of meting:
Is de meting wel valide, meten we datgene dat we zeggen te meten? Meten we wat we zeggen te meten of meten we iets anders? Meten we wel alle bedoelde onderscheiden, zijn er geen elementen die van belang zijn en die we uitsluiten? Hebben we een duidelijke verwachting (of zelfs theorie) van wat we moeten meten? Zijn er met andere woorden criteria voor de validiteit van de meting? Validering is van acuut belang in de humane wetenschappen. Elke operationalisering interpreteert de werkelijkheid immers op een bepaalde manier. We zullen een onderscheid moeten maken tussen de bedoelde verschillen (degene die er toe doen) en de onbedoelde (degene die er niet toe doen). De onbedoelde verschillen zouden ideaal gezien enkel van het toeval moeten afhangen, maar regelmatig creëren we door onze meetmethode onbedoelde verschillen. We moeten bijvoorbeeld in het achterhoofd houden dat de gevonden variantie de som is van een bedoelde variantie en een onbedoelde variantie. Waarnemingen zijn niet herhaalbaar tenzij op een bepaald niveau. Hoe kunnen we dat niveau karakteriseren? Waarnemingen zijn herhaalbaar als de entiteit die waargenomen wordt door de waarneming zelf niet (op een relevante manier) verandert en tevens wanneer de waarnemingsprocedure, de context, de meetmethode door de waarneming zelf niet (op een relevante manier) veranderd wordt zodanig dat eigenlijk een andere entiteit met een ander gedrag waargenomen wordt. Om het herhaalbaar niveau te karakteriseren moeten we bedoelde en nieuwe waarnemingen duidelijk van elkaar kunnen onderscheiden. Soms ontstaan systematische fouten in een meetmethode
Bijvoorbeeld zal ik een wijzer die ik altijd van op mijn plaats aflees anders aflezen dan van op een andere plaats
Bijvoorbeeld kan een hoge waarde een andere precisie hebben dan een waarde in het middengebied, en dan een lage waarde
Bijvoorbeeld kan ik fouten maken bij het overschrijven of intypen van getallen
Bijvoorbeeld kan mijn taalgebruik in een vragenlijst niet afgestemd zijn op het taalgebruik van de respondenten
Bijvoorbeeld kan mijn taalgebruik suggestief zijn en de antwoorden in een bepaalde zin beïnvloeden
Is de meting volledig? Zijn er met andere woorden geen elementen die van belang zijn en uitgesloten worden, niet onderscheiden worden?
Is die meting betrouwbaar, krijg ik met andere woorden gelijke uitkomsten bij situaties die in werkelijkheid gelijk zijn, en ongelijke bij situaties die in werkelijkheid verschillen? Naarmate je meer op een geordende dimensie meet zal een deel van de afwijkingen in de ene richting en een deel van de afwijkingen in de andere richting optreden. Wanneer die afwijkingen toevallig zijn zullen er evenveel in de ene richting als in de andere richting voorkomen en zullen ze elkaar compenseren. Voor variabelen die minimaal op interval niveau gemeten zijn zal dan de gemiddelde waarde hierdoor niet veranderen en de scores zullen normaal verdeeld zijn. Elke meetmethode zal door zo'n toevallige afwijkingen beperkt worden hoezeer we ook ons best doen om bepaalde beïnvloedingen af te schermen. Een kleine spreiding op de waarden van de variabelen wijst dikwijls op enkel toevallige afwijkingen. Men moet zich dan de vraag stellen of de gevoeligheid en/of het meetbereik wel goed gekozen is. Toevallige afwijkingen kunnen aan het einde van het meetbereik ook enkel maar in een richting spelen, waarbij dus het toeval geen symmetrische uitwerking meer heeft. Er ontstaat hierbij een correlatie tussen de scores en de toevallige afwijkingen (men noemt dit "regressie naar het gemiddelde"). Een scheve verdeling moet dus ook automatisch leiden tot een onderzoek naar de validiteit van de meetmethode en het meetbereik.
Is de meting precies? Sluiten de gemeten intervallen elkaar inderdaad uit? Elke meetmethode is beperkt in zijn nauwkeurigheid. Verschillen die een verschil maken moeten elkaar dus uitsluiten. Krijg ik gelijke uitkomsten bij situaties waartussen ik in werkelijkheid geen onderscheid wil maken, en ongelijke bij situaties die in werkelijkheid verschillen? Bijvoorbeeld: wanneer ik het aantal productiemedewerkers in een ruimte wil tellen dan moet duidelijk zijn wat een productiemedewerker is (tel ik bijvoorbeeld ook het onderhoudspersoneel en/of alle aanwezigen?). Elke meetmethode is beperkt in gevoeligheid of resolutie. De meetmethode moet dus onderscheidend genoeg zijn om een verschil te kunnen registreren dat een verschil maakt. Het heeft bijvoorbeeld geen zin een weegschaal te gebruiken die op 1 gram nauwkeurig is indien de verschillen die ons interesseren zich voordoen met tienden van een gram. Als je enkel het aantal mensen telt dat zich op straat bevind als het regent kan je niet te weten komen of ze nu een paraplu, een regenjas of beide droegen. Elke meetmethode is beperkt in zijn bereik. Sommige extreme waarden op een bepaalde dimensie kunnen buiten het waarnemingsvenster van de meetmethode vallen. Bijvoorbeeld: het heeft geen zin een weegschaal te gebruiken die beperkt is tot 5 Kg indien ik gewichten hoger dan 5Kg verwacht. Op analoge manier als je beperkt bent door een weegschaal van 5 Kg, ben je beperkt door een bepaalde bevraging in het mogelijke bereik van de antwoorden door de vraagstelling zelf. Het is steeds mogelijk met een bepaalde vraagstelling bepaalde extreme antwoorden uit te lokken of juist te vermijden. Is de gebruikte sensor beperkt tot een bepaald frequentievenster dan worden frequenties buiten dit venster gewoon niet opgemerkt, enz...
En eens we dan valide, volledige, betrouwbare en preciese waarnemingen hebben, kunnen we dan eigenschappen van een gebruikt numerieke stelsel als eigenschappen van de empirische werkelijkheid beschouwen (kunnen we scores optellen, en zegt die som iets over de werkelijkheid)? Waarnemingen kunnen we altijd tellen op een bepaald niveau, aangezien ze elkaar uitsluiten. Aangezien telbaarheid dan goed gedefinieerd is doen we bijvoorbeeld een aantal (w) waarnemingen die elkaar uitsluiten. In v gevallen van dat aantal w kunnen we A herkennen, er blijkt dan dat A ervaren is, A wordt simultaan gerealiseerd. In w-v gevallen gebeurt iets anders dan A. Het meest eenvoudige wat we kunnen doen is de waarnemingen klasseren in minstens twee klassen. Een klasse met “ja”, en een klasse met “neen”. De klasse met “ja” kunnen we exact beschrijven aan anderen. De klasse met “neen” kunnen we niet exact beschrijven aan anderen tenzij als “anders dan” de klasse met “ja”. In de klasse met “neen” komen bijvoorbeeld waarnemingen terecht die onverwacht en onverwachtbaar zijn. We turven dus de waarnemingen (we laten voor elke waarneming een uniek spoor achter in twee elkaar uitsluitende categorieën). Achteraf tellen we dan het aantal sporen dat in die klassen terecht komt. Zo bepalen we een frequentieverdeling. Dit noemt men kwalitatief of nominaal meten.
In waarnemingen kan soms ook een orde waargenomen worden die op andere manieren een bepaalde karakteristiek realiseren. Soms kunnen we immers zeggen dat waarnemingen meer of minder een bepaalde karakteristiek vertonen.
In sommige herhaalde waarnemingen kunnen we spreken van uitersten die het maximale waarneembaar verschil (resolutie) bepalen en die aanleiding geven tot een maximale en minimale intensiteit van datgene dat waargenomen wordt in al die waarnemingen. Op dat niveau is dan een eenheid te construeren als dat maximale verschil.
Om anderzijds de herhaalbaarheid van waarnemingen te onderzoeken in hun spontane dynamiek (enkel veranderend “bij toeval”) zullen we de waarschijnlijkheidsrekening gebruiken, methodiek die we dan ook moeten gronden in het haakformalisme. We zullen hierbij aantonen dat het meeste wat “wetenschappelijk” bewezen werd buiten de context van een laboratorium niet herhaalbaar is.
We kunnen een aantal aangebrachte begrippen illustreren met de volgende twee beelden van treffers op een schietschijf
Beide beelden tonen toevallige afwijkingen: er is een spreiding te vinden van de 7 treffers rond een gemiddelde. Beide beelden tonen dat de treffers binnen de buitenste rode cirkel liggen. Het zijn dus valide treffers binnen de totale schietschijf als we veronderstellen dat er maar 7 schoten afgevuurd werden. Links wordt een systematische fout gemaakt zodanig dat geen van de treffers in de centrale rode cirkel ligt, maar indien we de schietschijf zouden verplaatsen in de richting van de treffers zouden we het zo kunnen organiseren dat ze allemaal binnen de binnenste rode cirkel liggen, de nauwkeurigheid is dus groter dan bij het rechter beeld. Rechts is dan wel een meer valide "meting" dan links: een aantal van de treffers komen toch daar terecht waar ze bedoeld waren, indien het de bedoeling was om de centrale rode cirkel te raken. Beide "meetopstellingen" zijn even gevoelig, de inslagen zijn even groot, stel je bijvoorbeeld voor dat de diameter van de inslagen vijfmaal groter zou zijn. Over het "meetbereik" kunnen we niet veel vertellen aangezien we niets weten over de omgevingen waarin de schietschijven opgesteld waren (waren het vaste schietschijven of bewegende bijvoorbeeld).
Om waarnemingen uit te voeren zullen we minimaal vier niveaus van waarnemen onderscheiden: (Stanley Smith Stevens: “On the Theory of Scales of Measurement” Science 1946, online beschikbaar).
Een eerste niveau modelleren we doordat we alles kunnen gebruiken om daarmee iets aan te duiden. Dit leidt tot het nieuw begrip: een onderscheiding. Onderscheidingen liggen aan de basis van het haakformalisme: van daaruit worden andere begrippen gedefinieerd (zoals bijvoorbeeld een entiteit).
Het tweede niveau bereiken we met de relatie van simultaneïteit en de inherente keuzevrijheid die aan de basis ligt voor gelijk welk soort ordening die we zouden kunnen aanbrengen in datgene dat we aanduiden.
In een derde niveau maken we een onderscheid tussen eenheid en intensiteit om dan intensiteiten als ordening te kunnen gebruiken en we modelleren ook expliciet hoe een som (“verschil”) een eenheid kan zijn. We brengen met een laatst toegevoegde onderscheiding associativiteit binnen en dus maken we verhoudingen en schaal zinvol.
In het vierde niveau kunnen we een nul introduceren, zowel voor een eenheid als voor een intensiteit onafhankelijk van elkaar. De nul voor de eenheid modelleert de som van drie eenheden met dezelfde waarde, waarde die niet bekend moet zijn en interpreteren we als een ervaren standpunt dat ook als evenwicht (som van verschillen) kan gemodelleerd worden. De nul voor de intensiteit is de onvermijdelijke hypothese van de waarnemingsresolutie: iets kan zeer klein zijn en onwaarneembaar kleiner zijn (dit is: er is wel iets maar ordening is niet meer mogelijk, nul is niet “niets”).