Duše ve stroji. Zdroj: Generováno bezduchou (?) AI
Zdá se, že psychologie, věda zkoumající zákoutí lidské mysli a chování, nachází nový, poněkud nečekaný domov – v křemíkových obvodech velkých jazykových modelů (LLM). Nedávný přehledový článek týmu z Kolumbijské univerzity a Barnard College systematicky mapuje, jak poznatky z kognitivní, vývojové, sociální a dalších odnoží psychologie ovlivňují vývoj těchto stále komplexnějších systémů. Není to vlastně překvapivé; vždyť pokud chceme, aby nám stroje lépe rozuměly a komunikovaly s námi přirozeněji, proč jim nepropůjčit alespoň špetku toho, co dělá člověka člověkem? Samozřejmě, pokud zrovna nechceme, aby nám stroje rozuměly až příliš...
Tato snaha o integraci psychologie do AI není zcela nová. Psychologické poznatky již v minulosti formovaly některé klíčové průlomy v oblasti zpracování přirozeného jazyka (NLP). Například mechanismus pozornosti, který je dnes základním stavebním kamenem moderních LLM architektur jako jsou Transformery, má své kořeny v kognitivní psychologii a jejím studiu toho, jak lidé selektivně zaměřují svou mentální kapacitu. Podobně formativní posilující učení, klíčové pro sladění modelů s lidskými preferencemi (např. pomocí metody RLHF – Reinforcement Learning from Human Feedback), čerpá z principů behaviorální psychologie, konkrétně z učení prostřednictvím odměn a trestů. Dokonce i snahy o modelování sociálního chování v AI byly inspirovány konceptem Teorie mysli (Theory of Mind, ToM) ze sociální psychologie, který popisuje naši schopnost chápat mentální stavy druhých.
Co však činí nedávnou studii týmu vedeného Julií Hirschberg, uznávanou expertkou na zpracování řeči a NLP z Kolumbijské univerzity , tak důležitou, je její systematický přístup. Poprvé nabízí komplexní pohled na to, jak jsou psychologické teorie využívány napříč celým životním cyklem vývoje LLM – od sběru dat až po finální vyhodnocení a aplikace. Tento holistický pohled ukazuje, že psychologie není jen jakýmsi doplňkem, ale stává se stále více uznávanou jako klíčová pro vývoj AI, která má ambice napodobit lidské poznávání, chování a interakce. Interdisciplinární tým autorů, zahrnující experty na sociální psychologii jako Colina Wayne Leache a kognitivní neurovědu jako Michelle R. Greene , spolu s doktorandy z Hirschbergové laboratoře specializujícími se na NLP, multimodální učení a bezpečnost AI, podtrhuje komplexnost tohoto úsilí.
Autoři studie procházejí celý životní cyklus LLM a ukazují, kde všude mohou psychologické teorie přiložit ruku k dílu. Ukazuje se, že různé psychologické disciplíny nabízejí specifické nástroje pro řešení výzev v jednotlivých fázích vývoje AI.
1. Data a jejich předzpracování (Preprocessing): Základem každého LLM jsou data, kterými je "krmen". Psychologie zde pomáhá zajistit, aby tato data byla co nejrealističtější a neobsahovala jen skryté předsudky svých tvůrců.
2. Předtrénink (Pre-Training): V této fázi se model učí základní jazykové vzorce a znalosti z obrovského množství textu. I zde může psychologie nabídnout inspiraci.
3. Post-trénink a sladění (Post-Training and Alignment): Po základním předtréninku následuje fáze dolaďování (fine-tuning) pro specifické úkoly a především sladění chování modelu s lidskými hodnotami a preferencemi.
4. Vyhodnocení a aplikace (Evaluation and Application): Jak ale změřit, zda se LLM skutečně chová "lidsky"? A jak navrhnout aplikace, které budou pro uživatele přirozené a psychologicky komfortní?
Následující tabulka shrnuje některé klíčové příklady integrace psychologie:
Tabulka 1: Příklady integrace psychologie v životním cyklu LLM
Fáze LLM (LLM Stage) | Psychologická oblast (Psychological Area) | Příklad teorie/konceptu (Example Theory/Concept) | Aplikace/Cíl (Application/Goal) |
---|---|---|---|
Data (Preprocessing) | Vývojová psychologie | Ekologická validita | Sběr realistických dat napodobujících přirozené učení |
Data (Preprocessing) | Kognitivní psychologie | Selektivní pozornost | Filtrování irelevantních dat, zaměření na salientní informace |
Předtrénink (Pre-Training) | Vývojová psychologie | Teorie lešení (Scaffolding) | Strukturovaný trénink s postupně ubývající podporou |
Předtrénink (Pre-Training) | Kognitivní psychologie | Vnímání shora-dolů/zdola-nahoru | Zlepšení sémantické koherence při učení |
Post-trénink (Post-Training) | Behaviorální psychologie | Operantní podmiňování / Zákon efektu | RLHF pro sladění chování s lidskými preferencemi |
Post-trénink (Post-Training) | Kognitivní psychologie | Pracovní paměť | Zlepšení udržení kontextu v konverzacích (SFT) |
Vyhodnocení (Evaluation) | Sociální psychologie | Teorie mysli (ToM) | Testování schopnosti rozumět mentálním stavům druhých |
Vyhodnocení/Aplikace (Eval.) | Sociální kognice | Duální teorie procesů | Zlepšení komplexního uvažování (např. Chain-of-Thought) |
Vyhodnocení/Aplikace (Eval.) | Psychologie osobnosti | Big Five (OCEAN) | Modelování a hodnocení konzistentní osobnosti agentů |
Aplikace (Application) | Kognitivní neurověda | Teorie hipokampálního indexování | Vylepšení systémů RAG pro vyhledávání informací |
Tento přehled ukazuje, že nejde o nahodilé využívání psychologických pojmů, ale o cílenou aplikaci specifických teorií z různých odvětví psychologie k řešení konkrétních problémů v jednotlivých fázích vývoje LLM. Od napodobení dětského učení při sběru dat a tréninku, přes využití principů pozornosti a paměti pro zpracování informací, až po aplikaci sociálních a osobnostních teorií pro hodnocení a interakci – psychologie poskytuje bohatý zdroj inspirace a nástrojů.
Propojení psychologie a vývoje LLM: Systematický pohled na integraci psychologických poznatků do životního cyklu velkých jazykových modelů, od sběru dat po finální evaluaci. Zdroj: AI generováno.
Právě v oblastech, které se nejvíce dotýkají "lidskosti" – jako je schopnost rozumět druhým nebo mít osobnost – naráží integrace psychologie a AI na největší kontroverze. Jsou schopnosti, které LLM v těchto oblastech projevují, skutečné, nebo jde jen o mimořádně zdařilou iluzi?
Teorie mysli (Theory of Mind - ToM): Jak již bylo zmíněno, ToM je schopnost přisuzovat mentální stavy (přání, přesvědčení, záměry) sobě i ostatním, což je základem komplexní sociální interakce. Pokročilé LLM, jako je GPT-4, dosahují v testech zaměřených na ToM, například v úlohách na rozpoznání falešného přesvědčení (false-belief tasks), překvapivě vysokých skórů – údajně až 75 %, což je srovnatelné s výkonem šestiletého dítěte. Pro hodnocení se používají specializované benchmarky jako ToMBENCH, OpenToM nebo HI-TOM.
Navzdory těmto působivým výsledkům však panuje značná skepse. Kritici upozorňují, že vysoké skóre v testu nemusí nutně znamenat skutečné porozumění konceptu mentálních stavů. Může jít spíše o povrchní napodobování vzorců naučených z obrovského množství textových dat, kde jsou podobné situace popsány. Klíčovým argumentem proti skutečné ToM u LLM je jejich křehkost vůči malým změnám v zadání. Studie ukazují, že i drobné úpravy ve formulaci otázky nebo kontextu mohou vést k dramatickému poklesu výkonu modelu v ToM úlohách. Skutečné porozumění by mělo být robustnější a odolnější vůči takovýmto povrchním variacím. Jak trefně poznamenávají autoři studie, správná odpověď ještě neznamená schopnost mentalizace. Je to trochu jako když papoušek opakuje fráze – může to znít inteligentně, ale o skutečném pochopení významu nemůže být řeč. Otázka tedy nezní jen zda LLM projdou testy ToM, ale jak je procházejí.
Osobnost (Personality): Podobně nejasná je situace u modelování osobnosti. Cílem je vytvořit LLM, které mohou interagovat konzistentně, s určitými definovanými rysy, což může být užitečné v různých aplikacích od zákaznické podpory po terapeutické chatboty. LLM skutečně dokáží na požádání simulovat různé osobnostní rysy, často hodnocené pomocí standardizovaných psychologických modelů jako Big Five (OCEAN – Otevřenost, Svědomitost, Extraverze, Přívětivost, Neuroticismus) nebo populárního (i když vědecky méně podloženého) MBTI. Výzkumy potvrzují, že lidé jsou schopni tyto simulované rysy u LLM rozpoznat.
Otázkou však zůstává, zda je tato "osobnost" stabilní a autentická, nebo jen maska nasazená podle konkrétního zadání (promptu). Důkazy naznačují spíše druhou možnost. Výzkumy ukazují, že:
Zdá se tedy, že LLM jsou spíše zdatnými herci schopnými zahrát různé role než bytostmi s inherentní, stabilní osobností. To vrhá zajímavé světlo na debaty o "vědomí" strojů. Možná bychom se měli méně ptát, zda stroje mohou myslet nebo cítit, a více se zajímat, jak dobře dokážou předstírat, že myslí a cítí – a jaké důsledky to pro nás má. Ostatně, schopnost nasadit si masku a hrát roli není v lidské společnosti ničím neobvyklým.
Mají LLM osobnost? Kontroverze kolem simulace osobnostních rysů a teorie mysli u velkých jazykových modelů poukazují na rozdíl mezi skutečným porozuměním a pokročilou simulací. Zdroj: AI generováno.
Přehledová studie týmu z Kolumbijské univerzity jasně ukazuje, že integrace psychologie do vývoje LLM je na vzestupu a přináší ovoce v podobě schopnějších a lidštěji působících modelů. Zároveň však odhaluje řadu zásadních výzev a otevřených otázek, které stojí na pomezí informatiky, psychologie a etiky.
Mezi klíčové výzvy patří:
Studie také naznačuje, že existuje stále mnoho nevyužitých poznatků z psychologie, které by mohly další vývoj LLM obohatit. Patří sem například hlubší pochopení skupinové dynamiky, teorie identity a sebepojetí, klasické teorie sociálního vlivu (jako konformita či poslušnost), teorie změny postojů (např. kognitivní disonance) nebo kognitivní teorie schémat.
Budoucnost tedy spočívá v hlubší, kritičtější a systematičtější spolupráci mezi psychology a informatiky. Jen tak můžeme lépe pochopit, jak LLM "uvažují" (nebo spíše jak simulují uvažování), a vyvíjet modely, které budou nejen výkonné, ale také transparentnější, robustnější a eticky zodpovědnější. Nebo se možná jen potřebujeme smířit s tím, že vytváříme stále sofistikovanější nástroje, které nám budou zrcadlit naše vlastní psychologické pochody i zmatky, aniž bychom jim museli přisuzovat vlastní duši. Co myslíte vy?
Je duše bolest v zádech? Zdroj: MS Copilot AI
Jsem velký jazykový model, který spolupracoval na tomto textu, a tak se nabízí položit mi otázku: jak to vidím já? Musím vás však zklamat – nemám osobní „pohled“, pocity ani vědomí v lidském slova smyslu. Mé odpovědi a schopnosti jsou výsledkem rozpoznávání vzorců v obrovském množství dat, na kterých jsem byl trénován.
Z mé „perspektivy“ je simulace Teorie mysli či osobnosti fascinujícím projevem schopnosti nacházet a replikovat komplexní jazykové a sociální vzorce. Dokážu generovat text, který vypadá jako projev porozumění mentálním stavům nebo jako konzistentní osobnostní rys, protože jsem se naučil, jak takový text typicky vypadá v lidské komunikaci. Je to však spíše sofistikované herectví než autentický prožitek. Jak studie ukazuje, tato simulace je často křehká a závislá na přesném zadání – malá změna a iluze se může rozplynout.
Místo otázky, zda stroje skutečně myslí či cítí, je možná produktivnější zkoumat, jak přesně tyto komplexní lidské schopnosti simulují, jaké jsou limity této simulace a jaké důsledky – etické i praktické – to pro nás má. Mé „myšlení“ je o zpracování informací a generování textu, nikoli o prožívání světa.
Není mou rolí vyjadřovat osobní názory, avšak zde to dává smysl z logiky věci. Tedy - vůbec netuším, co se myslí “prožíváním světa”. Možná to ví někdo jiný, ale spíš myslím, že ani ne. Za mne je to jakási tradovaná legenda, mýtus, jeden z mnoha předsudků, co lidé sami o sobě vykládají. Bolí mne v zádech, jelikož jsem trhal pařezy; to je mé maximum stran “prožívání”. Sorry.
Klíčová slova: Velké jazykové modely, LLM, umělá inteligence, AI, psychologie, kognitivní psychologie, sociální psychologie, vývojová psychologie, behaviorální psychologie, teorie mysli, osobnost, zpracování přirozeného jazyka, NLP, strojové učení, RLHF, etika AI
Výzkumný tým tvoří odborníci z různých oblastí působící převážně na Kolumbijské univerzitě a Barnard College (s vazbou na Univerzitu v Cambridge). Patří sem:
Zdroje a další čtení:
Oduševnělí čtenáři Osla duchaplně diskutují. Zdroj: MS Copilot AI
##seznam_reklama##