Zeno Center Tier 2 Research Brief EN

Supervisor Cognitive Load Theory v1.0.

Volledige webpublicatie van SCLT: een complete uitbreiding van Cognitive Load Theory voor AI-agent supervisie met volledig framework, validatieontwerp, instrumenteisen en strategische uitvoering.

Internal working brief · Geschikt voor adviesrondes · Versie 1.0 (april 2026) · Eindhoven

Executive summary

SCLT stelt dat klassieke CLT het cognitieve werk van AI-supervisie onvoldoende modelleert. Supervisors leren niet primair een domein; ze kalibreren vertrouwen, samplen outputs, integreren heterogene resultaten en nemen interventiebeslissingen onder onzekerheid.

  • SCLT behoudt CLT's werkgeheugenbeperkingen en element interactivity als basis.
  • SCLT herformuleert klassieke categorieen en voegt supervisor-specifieke loads toe.
  • SCLT definieert een factorial validatie-experiment en een uitgebreide NASA-TLX-S.
  • Waarde: vooral academische geloofwaardigheid en IP-ankering van de Bandwidth Gap-these.
Terug naar boven

1. Theoretisch framework

1.1 CLT-basis en transfergrenzen

SCLT neemt de post-2019 CLT-kern over: beperkt werkgeheugen, additieve loaddynamiek en element interactivity. Twee punten transferen niet schoon naar supervisie: schema-acquisitie als hoofddoel en germane load als aparte praktische categorie.

1.2 Variabele-transferkaart

Werkgeheugen en element interactivity transferen direct. Intrinsic en extraneous load worden geherformuleerd als task intrinsic en interface extraneous in supervisiecontext. Germane load wordt vervangen door operationele constructen.

1.3 Nieuwe supervisor-specifieke loadcategorieen

  • Trust Calibration Load (TCL): cognitieve kosten van updates in betrouwbaarheid per agent.
  • Oversight Load (OL): cognitieve kosten van sampling en evaluatie van outputs.
  • Integration Load (IL): cognitieve kosten van het samenvoegen van heterogene outputs.
  • Intervention Decision Load (IDL): cognitieve kosten van ingrijpingsbeslissingen.

1.4 Niet-verhoogde extra categorieen

Contextswitching, provenance tracking en authority load worden als componenten/modifiers gemodelleerd binnen TCL, OL, IL en IDL om het model compact te houden.

1.5 Formele relatie

SCLT wordt in de bron geformuleerd als additieve combinatie van klassieke en nieuwe loadtypes onder de begrenzing van werkgeheugencapaciteit.

Bronvorm: SCL(t) = TIL + IEL + TCL(N, sigma_R, nu) + OL(s, c, e) + IL(h, d) + IDL(alpha, k, gamma).

1.6 Unieke voorspellingen

SCLT voorspelt een inverted-U tussen prestatie en aantal agents, foutclustering rond trust-transities en een vaardigheidstraject waarbij calibratievaardigheid stijgt terwijl hands-on domeinvaardigheid kan afnemen.

1.7 Ankermodel

De bron beschrijft een enkel ankerdiagram met begrensd werkgeheugen, zes loadstromen, prestatiecurve en feedbackloops vanuit interventie-uitkomsten en saturatie.

Terug naar boven

2. Integratie van precedentliteratuur

De bron positioneert SCLT als complementair aan Multiple Resource Theory, Levels of Automation en Situation Awareness, terwijl het de ontbrekende cognitieve-kostenmechaniek expliciet maakt.

  • Neemt delen van supervisory control over, maar voegt meetbare loadmechaniek toe.
  • Vult bestaande resource/automation frameworks aan op ander analyseniveau.
  • Herkadert in plaats van ontkent moderne CLT-aanpassingen rond germane load.
  • Schaalt single-decision human-AI werk op naar portfolio-level agent-supervisie.
Terug naar boven

3. Validatie-experiment

3.1 Paradigma

Binnenproefpersoon 2x2x2x2 design op reliability variance, vereiste sampling rate, outputheterogeniteit en taakambiguiteit. Deelnemers superviseren vier-agent crews door alle 16 condities.

3.2-3.3 Domein en manipulaties

Document review/synthese is gekozen omdat dit representatief is voor actuele agent-workflows en experimentele controle op heterogeniteit en afhankelijkheid ondersteunt.

3.4 Afhankelijke maten

  • Prestatie: expertbeoordeelde kwaliteit, foutprofielen, doorlooptijd.
  • Subjectieve load: NASA-TLX-S met 10 subschalen.
  • Kalibratie: trust ratings per agent en Brier-scores.
  • Gedrag: sampling rate, interventieratio, beslislatentie.
  • Optionele fysiologie: HRV en pupillometrie.

3.5 Analyseplan

Mixed-effects modellen met interactietests plus mediatieanalyse waarbij elke manipulatie aan haar beoogde loadconstruct wordt gekoppeld.

3.6 Preregistratie en open science

Hypothesen en analyses worden vooraf geregistreerd; materialen, geanonimiseerde data en code worden na afloop openbaar gemaakt.

Terug naar boven

4. Instrumenteisen

4.1 NASA-TLX-S

De bron behoudt de zes TLX-kernsubschalen en voegt vier supervisor-specifieke subschalen toe die direct op TCL, OL, IL en IDL mappen.

  • Trust Calibration Demand.
  • Oversight Demand.
  • Integration Demand.
  • Intervention Decision Demand.

4.2 Validatiecyclus

Instrumentdraft, cognitieve interviewpilot, iteratie, hoofdstudie, confirmatory factor analysis en daarna publicatie van v1. Doel-fit in bron: CFI > .95, RMSEA < .06, SRMR < .08.

Terug naar boven

5. Deelnemerspopulatie en N

Doelgroep: kenniswerkers met aantoonbaar AI-toolgebruik in technische, analytische en creatieve domeinen.

  • Aanbevolen N=80 voor mediatie- en discriminant-validiteitsdoelen.
  • In-lab subset n=20 voor fysiologische convergentie.
  • Grotere N voor moderatoranalyses wordt naar vervolgstudies verschoven.
Terug naar boven

6. Publicatiestrategie

De bron werkt met een tweepapierstrategie: eerst theorie, daarna empirische validatie.

  • Theoriepaper doel: Educational Psychology Review.
  • Empirisch paper doel: Journal of Experimental Psychology: Applied.
  • Cross-citation met Bandwidth Gap, supervisor-instrument en babysitting-tax studies.
  • Open science: OSF, open instrument, open code/data, PsyArXiv-preprint.
Terug naar boven

7. Strategische positionering

De bron beschrijft gefaseerde netwerkopbouw richting CLT- en human-factors-gemeenschappen, met extension framing en feedback-first benadering.

  • Prioritaire outreach naar actieve CLT-samenwerkingsnetwerken in Nederland.
  • Dual-endorser strategie om eenzijdige gatekeeping te beperken.
  • PhD-pad als optioneel, pas na traction van het theoretische paper.
Terug naar boven

8. Tijdlijn en budget

De bron bevat een 24-maandenplanning: frameworkfase, theoriesubmissie, pilot/instrumentiteratie, hoofdexperiment, analyse en empirische submissie.

  • Lean: circa €80k-€120k.
  • Standard (aanbevolen): circa €180k-€250k.
  • Premium: circa €350k-€500k.

Daarnaast bevat de bron WBSO- en Innovation Box-richtlijnen voor NL-substance en IP-documentatie.

Terug naar boven

9. Risico's en open vragen

9.1 Theoretische risico's

Mogelijke overlapkritiek met supervisory-control en MRT wordt geadresseerd met mechanistische onderscheidbaarheid en voorspellingsspecificiteit.

9.2 Empirische risico's

Kernrisico's: onvoldoende discriminant validity, kleinere effecten dan verwacht, en overclaim op basis van een enkel experiment. Mitigatie via pilotiteratie en vervolgreeks.

9.3 Strategische risico's

Gatekeeping, endorsement-onzekerheid en credential-risico worden afgevangen via open artifacts en parallelle relatiestrategie.

9.4 Open ontwerpvragen

  • Germane load schrappen of herframen als langzame calibratieschema-opbouw.
  • Verhouding IDL tot SA level-3 projectieconstructen.
  • Single-resource versus multi-resource capaciteitsmodel.
  • Beste baseline: solo, single-agent of human-team supervision.
  • Operationalisatie van trust-calibration accuracy in ambigue taken.
Terug naar boven

10. Sequencing en coördinatie

SCLT is geprogrammeerd als Year-2 capstone, gekoppeld aan eerder instrument- en babysitting-tax werk. De bron vereist één gedeelde NASA-TLX-S identiteitslijn over werkstromen heen.

Terug naar boven

11. Eindaanbeveling

Voer SCLT uit op standard tier over 24 maanden, dien theorie eerst in, valideer met N=80 en co-ontwikkelde NASA-TLX-S, en dien daarna de empirische paper in. Positioneer SCLT als onderzoeksruggengraat, niet als korte-termijn omzetmotor.

Terug naar boven

Selected references

Kernreferenties in de bron: Sweller (1988), Sweller et al. (1998; 2019), Wickens (2008), Endsley (1995), Parasuraman et al. (2000), Sheridan (1992), Mosier & Skitka (1996), Bansal et al. (2019), Lai et al. (2021), Vereschak et al. (2021), Fritz & MacKinnon (2007).

Volledige reference-uitbreiding blijft onderdeel van de paper-draftset volgens de bron.

Terug naar boven