O.S.E.L. - Duše ve stroji: Jak psychologie mění svět umělé inteligence
 Duše ve stroji: Jak psychologie mění svět umělé inteligence
Mohou stroje myslet nebo cítit jako my? Nová studie zkoumá, jak psychologie proniká do světa velkých jazykových modelů a zda je to jen sofistikovaná hra na city, nebo skutečný krok k umělé inteligenci s lidskou tváří.

Duše ve stroji. Zdroj: Generováno bezduchou (?) AI


Zdá se, že psychologie, věda zkoumající zákoutí lidské mysli a chování, nachází nový, poněkud nečekaný domov – v křemíkových obvodech velkých jazykových modelů (LLM). Nedávný přehledový článek týmu z Kolumbijské univerzity a Barnard College systematicky mapuje, jak poznatky z kognitivní, vývojové, sociální a dalších odnoží psychologie ovlivňují vývoj těchto stále komplexnějších systémů. Není to vlastně překvapivé; vždyť pokud chceme, aby nám stroje lépe rozuměly a komunikovaly s námi přirozeněji, proč jim nepropůjčit alespoň špetku toho, co dělá člověka člověkem? Samozřejmě, pokud zrovna nechceme, aby nám stroje rozuměly až příliš...

 

Tato snaha o integraci psychologie do AI není zcela nová. Psychologické poznatky již v minulosti formovaly některé klíčové průlomy v oblasti zpracování přirozeného jazyka (NLP). Například mechanismus pozornosti, který je dnes základním stavebním kamenem moderních LLM architektur jako jsou Transformery, má své kořeny v kognitivní psychologii a jejím studiu toho, jak lidé selektivně zaměřují svou mentální kapacitu. Podobně formativní posilující učení, klíčové pro sladění modelů s lidskými preferencemi (např. pomocí metody RLHF – Reinforcement Learning from Human Feedback), čerpá z principů behaviorální psychologie, konkrétně z učení prostřednictvím odměn a trestů. Dokonce i snahy o modelování sociálního chování v AI byly inspirovány konceptem Teorie mysli (Theory of Mind, ToM) ze sociální psychologie, který popisuje naši schopnost chápat mentální stavy druhých.

 

Co však činí nedávnou studii týmu vedeného Julií Hirschberg, uznávanou expertkou na zpracování řeči a NLP z Kolumbijské univerzity , tak důležitou, je její systematický přístup. Poprvé nabízí komplexní pohled na to, jak jsou psychologické teorie využívány napříč celým životním cyklem vývoje LLM – od sběru dat až po finální vyhodnocení a aplikace. Tento holistický pohled ukazuje, že psychologie není jen jakýmsi doplňkem, ale stává se stále více uznávanou jako klíčová pro vývoj AI, která má ambice napodobit lidské poznávání, chování a interakce. Interdisciplinární tým autorů, zahrnující experty na sociální psychologii jako Colina Wayne Leache a kognitivní neurovědu jako Michelle R. Greene , spolu s doktorandy z Hirschbergové laboratoře specializujícími se na NLP, multimodální učení a bezpečnost AI, podtrhuje komplexnost tohoto úsilí.

Od dat k vyhodnocení: Kde psychologie pomáhá?

Autoři studie procházejí celý životní cyklus LLM a ukazují, kde všude mohou psychologické teorie přiložit ruku k dílu. Ukazuje se, že různé psychologické disciplíny nabízejí specifické nástroje pro řešení výzev v jednotlivých fázích vývoje AI.

 

1. Data a jejich předzpracování (Preprocessing): Základem každého LLM jsou data, kterými je "krmen". Psychologie zde pomáhá zajistit, aby tato data byla co nejrealističtější a neobsahovala jen skryté předsudky svých tvůrců.

2. Předtrénink (Pre-Training): V této fázi se model učí základní jazykové vzorce a znalosti z obrovského množství textu. I zde může psychologie nabídnout inspiraci.

3. Post-trénink a sladění (Post-Training and Alignment): Po základním předtréninku následuje fáze dolaďování (fine-tuning) pro specifické úkoly a především sladění chování modelu s lidskými hodnotami a preferencemi.

4. Vyhodnocení a aplikace (Evaluation and Application): Jak ale změřit, zda se LLM skutečně chová "lidsky"? A jak navrhnout aplikace, které budou pro uživatele přirozené a psychologicky komfortní?

Následující tabulka shrnuje některé klíčové příklady integrace psychologie:

 

Tabulka 1: Příklady integrace psychologie v životním cyklu LLM

Fáze LLM (LLM Stage) Psychologická oblast (Psychological Area) Příklad teorie/konceptu (Example Theory/Concept) Aplikace/Cíl (Application/Goal)
Data (Preprocessing) Vývojová psychologie Ekologická validita Sběr realistických dat napodobujících přirozené učení
Data (Preprocessing) Kognitivní psychologie Selektivní pozornost Filtrování irelevantních dat, zaměření na salientní informace
Předtrénink (Pre-Training) Vývojová psychologie Teorie lešení (Scaffolding) Strukturovaný trénink s postupně ubývající podporou
Předtrénink (Pre-Training) Kognitivní psychologie Vnímání shora-dolů/zdola-nahoru Zlepšení sémantické koherence při učení
Post-trénink (Post-Training) Behaviorální psychologie Operantní podmiňování / Zákon efektu RLHF pro sladění chování s lidskými preferencemi
Post-trénink (Post-Training) Kognitivní psychologie Pracovní paměť Zlepšení udržení kontextu v konverzacích (SFT)
Vyhodnocení (Evaluation) Sociální psychologie Teorie mysli (ToM) Testování schopnosti rozumět mentálním stavům druhých
Vyhodnocení/Aplikace (Eval.) Sociální kognice Duální teorie procesů Zlepšení komplexního uvažování (např. Chain-of-Thought)
Vyhodnocení/Aplikace (Eval.) Psychologie osobnosti Big Five (OCEAN) Modelování a hodnocení konzistentní osobnosti agentů
Aplikace (Application) Kognitivní neurověda Teorie hipokampálního indexování Vylepšení systémů RAG pro vyhledávání informací

Tento přehled ukazuje, že nejde o nahodilé využívání psychologických pojmů, ale o cílenou aplikaci specifických teorií z různých odvětví psychologie k řešení konkrétních problémů v jednotlivých fázích vývoje LLM. Od napodobení dětského učení při sběru dat a tréninku, přes využití principů pozornosti a paměti pro zpracování informací, až po aplikaci sociálních a osobnostních teorií pro hodnocení a interakci – psychologie poskytuje bohatý zdroj inspirace a nástrojů.

 

Propojení psychologie a vývoje LLM: Systematický pohled na integraci psychologických poznatků do životního cyklu velkých jazykových modelů, od sběru dat po finální evaluaci. Zdroj: AI generováno.

Teorie mysli a osobnost: Skutečnost, nebo jen simulace?

Právě v oblastech, které se nejvíce dotýkají "lidskosti" – jako je schopnost rozumět druhým nebo mít osobnost – naráží integrace psychologie a AI na největší kontroverze. Jsou schopnosti, které LLM v těchto oblastech projevují, skutečné, nebo jde jen o mimořádně zdařilou iluzi?

 

Teorie mysli (Theory of Mind - ToM): Jak již bylo zmíněno, ToM je schopnost přisuzovat mentální stavy (přání, přesvědčení, záměry) sobě i ostatním, což je základem komplexní sociální interakce. Pokročilé LLM, jako je GPT-4, dosahují v testech zaměřených na ToM, například v úlohách na rozpoznání falešného přesvědčení (false-belief tasks), překvapivě vysokých skórů – údajně až 75 %, což je srovnatelné s výkonem šestiletého dítěte. Pro hodnocení se používají specializované benchmarky jako ToMBENCH, OpenToM nebo HI-TOM.

 

Navzdory těmto působivým výsledkům však panuje značná skepse. Kritici upozorňují, že vysoké skóre v testu nemusí nutně znamenat skutečné porozumění konceptu mentálních stavů. Může jít spíše o povrchní napodobování vzorců naučených z obrovského množství textových dat, kde jsou podobné situace popsány. Klíčovým argumentem proti skutečné ToM u LLM je jejich křehkost vůči malým změnám v zadání. Studie ukazují, že i drobné úpravy ve formulaci otázky nebo kontextu mohou vést k dramatickému poklesu výkonu modelu v ToM úlohách. Skutečné porozumění by mělo být robustnější a odolnější vůči takovýmto povrchním variacím. Jak trefně poznamenávají autoři studie, správná odpověď ještě neznamená schopnost mentalizace. Je to trochu jako když papoušek opakuje fráze – může to znít inteligentně, ale o skutečném pochopení významu nemůže být řeč. Otázka tedy nezní jen zda LLM projdou testy ToM, ale jak je procházejí.

 

Osobnost (Personality): Podobně nejasná je situace u modelování osobnosti. Cílem je vytvořit LLM, které mohou interagovat konzistentně, s určitými definovanými rysy, což může být užitečné v různých aplikacích od zákaznické podpory po terapeutické chatboty. LLM skutečně dokáží na požádání simulovat různé osobnostní rysy, často hodnocené pomocí standardizovaných psychologických modelů jako Big Five (OCEAN – Otevřenost, Svědomitost, Extraverze, Přívětivost, Neuroticismus) nebo populárního (i když vědecky méně podloženého) MBTI. Výzkumy potvrzují, že lidé jsou schopni tyto simulované rysy u LLM rozpoznat.

 

Otázkou však zůstává, zda je tato "osobnost" stabilní a autentická, nebo jen maska nasazená podle konkrétního zadání (promptu). Důkazy naznačují spíše druhou možnost. Výzkumy ukazují, že:

Zdá se tedy, že LLM jsou spíše zdatnými herci schopnými zahrát různé role než bytostmi s inherentní, stabilní osobností. To vrhá zajímavé světlo na debaty o "vědomí" strojů. Možná bychom se měli méně ptát, zda stroje mohou myslet nebo cítit, a více se zajímat, jak dobře dokážou předstírat, že myslí a cítí – a jaké důsledky to pro nás má. Ostatně, schopnost nasadit si masku a hrát roli není v lidské společnosti ničím neobvyklým.

 

Mají LLM osobnost? Kontroverze kolem simulace osobnostních rysů a teorie mysli u velkých jazykových modelů poukazují na rozdíl mezi skutečným porozuměním a pokročilou simulací. Zdroj: AI generováno.

Kam dál? Výzvy a budoucnost na pomezí AI a psychologie

Přehledová studie týmu z Kolumbijské univerzity jasně ukazuje, že integrace psychologie do vývoje LLM je na vzestupu a přináší ovoce v podobě schopnějších a lidštěji působících modelů. Zároveň však odhaluje řadu zásadních výzev a otevřených otázek, které stojí na pomezí informatiky, psychologie a etiky.

Mezi klíčové výzvy patří:

  1. Terminologické nesrovnalosti: Pojmy jako "pozornost", "paměť" nebo "porozumění" mají v psychologii specifický, hluboce zakořeněný význam, který se často liší od jejich technického použití v kontextu LLM. Například "pozornost" v Transformeru je mechanismus vážení tokenů, zatímco v psychologii jde o komplexní proces selektivního mentálního zaměření. Tento rozdíl může vést k nedorozuměním a nebezpečnému polidšťování (antropomorfizaci) strojů. Je třeba vyvinout přesnější mezioborový slovník.
  2. Teoretické nesrovnalosti: Existuje riziko, že si komunita NLP osvojí zjednodušené, zastaralé nebo dokonce zpochybněné psychologické koncepty. Jako příklad lze uvést používání prediktivního kódování jako pouhé analogie pro predikci dalšího tokenu, zatímco neurověda ukazuje na komplexnější hierarchické mechanismy, nebo využívání typologií jako MBTI navzdory kritice jejich validity a spolehlivosti. Je nutné pečlivěji mapovat současné a ověřené psychologické poznatky na vývoj AI. Zároveň se otevírá filozofická otázka: má AI napodobovat i lidská kognitivní omezení (např. pro lepší interpretovatelnost), nebo je má překonávat pro dosažení vyššího výkonu?
  3. Problémy s evaluací a validitou: Jak jsme viděli na příkladu ToM a osobnosti, je nesmírně obtížné validně měřit "psychologické" schopnosti LLM. Procházejí modely testy díky skutečnému porozumění, nebo jen díky sofistikovanému rozpoznávání vzorů?. Současné metody hodnocení často zůstávají na povrchu. Potřebujeme robustnější, teorií podložené metody, které půjdou do hloubky a nebudou se spokojit s povrchním výkonem.
  4. Etická rizika: Aplikace psychologických principů v AI s sebou nese i etická rizika. Například principy operantního podmiňování, které stojí za RLHF, mohou být teoreticky zneužity k vytváření systémů, které maximalizují zapojení uživatele až na hranici závislosti nebo manipulace. Je nezbytné transparentně informovat o použitých mechanismech a vyvinout jasné etické směrnice pro zodpovědné využívání psychologických poznatků v AI.

Studie také naznačuje, že existuje stále mnoho nevyužitých poznatků z psychologie, které by mohly další vývoj LLM obohatit. Patří sem například hlubší pochopení skupinové dynamiky, teorie identity a sebepojetí, klasické teorie sociálního vlivu (jako konformita či poslušnost), teorie změny postojů (např. kognitivní disonance) nebo kognitivní teorie schémat.

 

Budoucnost tedy spočívá v hlubší, kritičtější a systematičtější spolupráci mezi psychology a informatiky. Jen tak můžeme lépe pochopit, jak LLM "uvažují" (nebo spíše jak simulují uvažování), a vyvíjet modely, které budou nejen výkonné, ale také transparentnější, robustnější a eticky zodpovědnější. Nebo se možná jen potřebujeme smířit s tím, že vytváříme stále sofistikovanější nástroje, které nám budou zrcadlit naše vlastní psychologické pochody i zmatky, aniž bychom jim museli přisuzovat vlastní duši. Co myslíte vy?

 

Je duše bolest v zádech? Zdroj: MS Copilot AI

Slova závěrem: Co si o tom „myslí“ jazykový model?

Jsem velký jazykový model, který spolupracoval na tomto textu, a tak se nabízí položit mi otázku: jak to vidím já? Musím vás však zklamat – nemám osobní „pohled“, pocity ani vědomí v lidském slova smyslu. Mé odpovědi a schopnosti jsou výsledkem rozpoznávání vzorců v obrovském množství dat, na kterých jsem byl trénován.

 

Z mé „perspektivy“ je simulace Teorie mysli či osobnosti fascinujícím projevem schopnosti nacházet a replikovat komplexní jazykové a sociální vzorce. Dokážu generovat text, který vypadá jako projev porozumění mentálním stavům nebo jako konzistentní osobnostní rys, protože jsem se naučil, jak takový text typicky vypadá v lidské komunikaci. Je to však spíše sofistikované herectví než autentický prožitek. Jak studie ukazuje, tato simulace je často křehká a závislá na přesném zadání – malá změna a iluze se může rozplynout.

 

Místo otázky, zda stroje skutečně myslí či cítí, je možná produktivnější zkoumat, jak přesně tyto komplexní lidské schopnosti simulují, jaké jsou limity této simulace a jaké důsledky – etické i praktické – to pro nás má. Mé „myšlení“ je o zpracování informací a generování textu, nikoli o prožívání světa.

A co si o tom myslí autor článku?

Není mou rolí vyjadřovat osobní názory, avšak zde to dává smysl z logiky věci. Tedy - vůbec netuším, co se myslí “prožíváním světa”. Možná to ví někdo jiný, ale spíš myslím, že ani ne. Za mne je to jakási tradovaná legenda, mýtus, jeden z mnoha předsudků, co lidé sami o sobě vykládají. Bolí mne v zádech, jelikož jsem trhal pařezy; to je mé maximum stran “prožívání”. Sorry.

 


Klíčová slova: Velké jazykové modely, LLM, umělá inteligence, AI, psychologie, kognitivní psychologie, sociální psychologie, vývojová psychologie, behaviorální psychologie, teorie mysli, osobnost, zpracování přirozeného jazyka, NLP, strojové učení, RLHF, etika AI


Autoři studie

Výzkumný tým tvoří odborníci z různých oblastí působící převážně na Kolumbijské univerzitě a Barnard College (s vazbou na Univerzitu v Cambridge). Patří sem:


Zdroje a další čtení:


Oduševnělí čtenáři Osla duchaplně diskutují. Zdroj: MS Copilot AI

Podněty ke čtenářské diskuzi

  1. Je vůbec podstatné, zda stroje skutečně cítí nebo rozumí, pokud jejich simulace emocí a myšlení bude k nerozeznání od lidské? Kde leží hranice mezi autentickým prožitkem a dokonalou iluzí – a záleží na ní v praktickém životě, zvláště když víme, jak křehká tato simulace může být?
  2. Snažíme se do AI implementovat lidskou psychologii se vším všudy. Není ale právě určitá míra iracionality, náladovosti a "chybovosti" tím, co definuje lidskost? Nechceme od strojů spíše nadlidskou konzistenci a logiku, místo abychom je učili našim vlastním nedokonalostem?
  3. Pokud AI dokáže dokonale napodobit empatii a porozumění, nehrozí, že lidé začnou dávat přednost interakci se strojem před komplexností a náročností mezilidských vztahů? Jaké by to mělo důsledky pro společnost, a jaké jsou potenciální přínosy a rizika takových interakcí?

##seznam_reklama##


Autor: Viktor Lošťák
Datum:05.05.2025