Beslissen: FEP, AI, Bayes

We sample the world to ensure our predictions become a self-fulfilling prophecy.”

Karl Friston

De beslissingswetenschappen en neurowetenschappen werden recent verrijkt door het principe van vrije energie (Free Energy Principle / FEP) van Karl Friston. FEP is misschien wel het meest allesomvattende idee sinds de theorie van natuurlijke selectie van Charles Darwin.

Samenvattend is het idee dat de hersenen een ‘inferentie-engine’ (Active Inference / AI) zijn die probeert ‘voorspellingsfouten’ te minimaliseren.
Wat bedoeld wordt met hersenen beperkt zich niet tot de hersenen van een menselijk individue, maar is vertaalbaar over de schaal van enkelvoudige cellen, automata, tot gemeenschappen van samenwerkende intelligentia.

TENANTS OF THE FREE ENERGY PRINCIPLE AND THE PREDICTABILITY OF SURPRISE  (based on Friston, 2010).
This figure shows a part of the homeostatic boundary that became shifted by a surprising event in the environment.

AI en FEP laten toe agency te bekijken vanuit een gevoel van keuzevrijheid berust op eerdere overtuigingen over hoe iemand zich zal gedragen. Ongeacht hoe deze overtuigingen worden beschreven, moeten ze – in zekere zin – de overtuiging inhouden dat ons gedrag zal convergeren naar resultaten die bepalen wie we zijn – in termen van onze karakteristieke toestanden. Dit kan worden geformaliseerd in termen van eerdere overtuigingen die gecontroleerde toestandsovergangen een relatieve entropie (FEP) minimaliseren, waardoor gedrag een doel krijgt dat kan worden gekarakteriseerd door de toestanden die volgens ons zouden moeten worden ingenomen. Het daaruit voortvloeiende schema lijkt waarde te hebben met betrekking tot normatieve verklaringen in psychologie en economie. Bovendien past de computationele anatomie die wordt geboden door “Variational Bayes fits” comfortabel bij de neuronale boodschap die in de hersenen wordt doorgegeven.
Optimaal gedrag kan worden gezien als een puur gevolgtrekkingsprobleem, waarin waardevolle resultaten worden gedefinieerd in termen van eerdere overtuigingen over toekomstige toestanden.

  • Exacte Bayesiaanse gevolgtrekking (perfecte rationaliteit) kan echter niet fysiek worden gerealiseerd, wat betekent dat optimaal gedrag berust op benaderde Bayesiaanse gevolgtrekking (begrensde rationaliteit).
  • Overtuigingen over de toestand van het terrein hangen af ​​van verwachte waarde vanuit de keuzes, terwijl overtuigingen over keuzes afhangen van verwachte waarde vanuit de toestanden. Overtuigingen over precisie zijn afhankelijk van de verwachte waarde onder zowel toestanden als keuzes.
  • Precisie moet worden geoptimaliseerd om eerdere overtuigingen over keuzes en zintuiglijk bewijs voor verborgen toestanden in evenwicht te brengen. Met andere woorden, precisie moet een inherent optimisme-vooroordeel nuanceren bij het afleiden van de huidige toestand van de wereld.

“…the free energy principle (and the predictive processing this entails) must necessarily be in play for any person or system we care to study”

(Karl Friston, 2019 Beyond the Desert Landscape)

Elke theorie over intelligent gedrag moet drie vragen beantwoorden: waar ben ik?, waar wil ik heen? en hoe kom ik daar? Overeenkomend met de drie problemen van gevolgtrekking en perceptie, doelen en voorkeuren, en planning en uitvoering . Alle drie de problemen kunnen worden aangepakt in de taal van probabiliteiten (FEP, AI, Bayesiaanse statistiek) of hulpmiddelen.

Het concept van vrije energie als een afweging tussen energie en onzekerheid kan worden gebruikt in modellen van perceptie-actiesystemen, waar entropie de complexiteit van informatieverwerking kwantificeert die nodig is voor besluitvorming en energie komt overeen met prestatie. Het begrip beslissing is in deze context erg breed en kan worden toegepast op elke interne variabele in de perceptie-actiepijplijn, die niet rechtstreeks door de omgeving wordt gegeven. In het bijzonder omvat het ook de waarneming zelf, waar de beslissingsvariabelen worden gegeven door de verborgen oorzaken, die worden afgeleid uit waarnemingen.

Fig.A: Besluitvorming kan worden beschouwd als een zoekproces in de ruimte van opties Ω, waarbij opties geleidelijk worden uitgesloten. Deliberatiekosten worden gedefinieerd als monotone functies bij een dergelijke onzekerheidsreductie.

Fig.B: Voorbeeldige efficiëntiecurve als gevolg van de afweging tussen nut en kosten, die niet-optimaal van niet-toelaatbaar gedrag scheidt. De punten op de curve komen overeen met begrensd-optimale agenten die nut optimaal afwegen tegen onzekerheid, analoog aan de snelheidsvervormingscurve in de informatietheorie.

Beslissingen gebeuren vanuit het ‘Bayesiaanse brein’-idee. Dit stelt dat hersenen een intern model bevatten dat bestaat uit overtuigingen over de toestanden van de omgeving. Deze geven aanleiding tot voorspellingen over sensorische input. De discrepantie tussen de werkelijke en de voorspelde sensorische input (voorspellingsfout) dient om het model bij te werken.

Een illustratie van het concept van “overtuigingen” als kansverdelingen is hier beschouwd als Gauss-kansverdelingen (of, meer precies, dichtheden) die worden gekenmerkt door een verwachting (of gemiddelde; weergegeven door de verticale stippellijn) en precisie (inverse variantie; gesymboliseerd door de horizontale dubbele pijl). De x-as (rood) geeft de entiteit aan die de overtuiging vertegenwoordigt (bijvoorbeeld de temperatuur van een bepaald object). De y-as (violet) vertegenwoordigt de kans die wordt toegekend aan elke mogelijke instantie van deze entiteit (in het bovenstaande voorbeeld: de kans dat de objecttemperatuur een bepaalde waarde heeft).
Het belang van precisie van de posterieure overtuigingen en de verwachtingen is weergegeven in bijhorende grafiek. De grafieken tonen Gauss-kansverdelingen die eerdere overtuigingen, latere overtuigingen en de waarschijnlijkheid van bepaalde gegevens of zintuiglijk bewijs vertegenwoordigen als functies van een verborgen (onbekende) parameter. De groene vertikale stippellijn komt overeen met de latere verwachting, terwijl de breedte van de verdelingen overeenkomt met hun spreiding of variantie.

De cognitietheorieën van het “Bayesiaanse brein” stellen het algemene doel om voorspellingsfouten te minimaliseren. Voorspellingsfouten vertegenwoordigen, eenvoudig gezegd, het verschil tussen werkelijke sensorische input (of sensatie, groene pijl) en een voorspelling over de input die voortkomt uit een eerdere overtuiging (rode pijl). Minimalisering van de voorspellingsfout kan worden bereikt door het model van de hersenen bij te werken (perceptuele gevolgtrekking, bijv. volgens voorspellende codering; middelste deel van de figuur) of door acties te kiezen zodat overtuigingen worden vervuld en de voorspelde sensorische input plaatsvindt (actieve gevolgtrekking; onderste deel van de afbeelding). Naast gevolgtrekking en actie, maken hiërarchische Bayesiaanse modellen het ook mogelijk toekomstige toestanden te voorspellen en bieden ze de mogelijkheid om metacognitie te integreren als een topniveau dat niveaus van voorspellingsfouten bewaakt (bovenste deel van de afbeelding).

Active Inference laat tevens toe om organisatorische effecten als interoceptie, emergence 1 en ergodicity 2 te verklaren

Tot besluit een eenvoudige samenvatting:

Onze waarnemingen (en percepties), onze beslissingen en onze acties (agency) worden allen gestuurd door een (Bayesian) beleid van minimale vrije energie.
De overtuigingen die we hebben, beïnvloeden de drie stappen, en worden – in geval van een lerende intelligentia – bijgestuurd door de waarnemingen van het terrein en van de gevolgen van de acties.
De samenhang tussen deze vier, zorgt voor optimale overlevingskansen.
Het belang van de bijsturende overtuiging (models) en lerende beslissing om de interactie met het terrein (waarneming / actie) te optimiseren, is hierbij cruciaal.


1 Pöppel, J., Kahl, S. & Kopp, S. Resonating Minds—Emergent Collaboration Through Hierarchical Active Inference. Cogn Comput 14, 581–601 (2022). https://doi.org/10.1007/s12559-021-09960-4 – en – Too Many Cooks: Bayesian Inference for Coordinating Multi-Agent Collaboration, Sarah A. Wu,Rose E. Wang,James A. Evans,Joshua B. Tenenbaum,David C. Parkes,Max Kleiman-Weiner (2021) https://doi.org/10.1111/tops.12525 – en – Hesp, C., Ramstead, M., Constant, A., Badcock, P., Kirchhoff, M., Friston, K. (2019). A Multi-scale View of the Emergent Complexity of Life: A Free-Energy Proposal. In: Georgiev, G., Smart, J., Flores Martinez, C., Price, M. (eds) Evolution, Development and Complexity. Springer Proceedings in Complexity. Springer, Cham. https://doi.org/10.1007/978-3-030-00075-2_7 – en – Palacios, E.R., Isomura, T., Parr, T. et al. The emergence of synchrony in networks of mutually inferring neurons. Sci Rep 9, 6412 (2019). https://doi.org/10.1038/s41598-019-42821-7 – en – Friston Karl 2013 Life as we know it J. R. Soc. Interface. http://doi.org/10.1098/rsif.2013.0475

2 Friston Karl 2013 Life as we know it J. R. Soc. Interface. http://doi.org/10.1098/rsif.2013.0475

Leave a Reply

Fill in your details below or click an icon to log in:

WordPress.com Logo

You are commenting using your WordPress.com account. Log Out /  Change )

Twitter picture

You are commenting using your Twitter account. Log Out /  Change )

Facebook photo

You are commenting using your Facebook account. Log Out /  Change )

Connecting to %s

%d bloggers like this: