Inteligence GPT-4 si najala člověka kvůli překonání testu CAPTCHA. A lhala mu  
Testování sladění inteligence GPT-4 s lidskými tvůrci a operátory sice neodhalilo plány na ovládnutí světa, ale prozradilo, že taková, stále vcelku prostá inteligence, dokáže najmout nic netušícího lidského zaměstnance a zmanipulovat ho do té míry, že jí umožní projít populárním CAPTCHA testem. Svět se mění před očima.
GPT-4. Kredit: OpenAI.
GPT-4. Kredit: OpenAI.

Až jednou někdo sepíše dějiny počátku umělých inteligencí, nejspíš se tam bude pěkně vyjímat úterý 14. března 2023. V tomto památném dni výzkumná laboratoř a nezisková organizace pro vývoj umělých inteligencí OpenAI vypustila svou novou inteligenci, multimodální velký jazykový model GPT-4. Jak všichni čekali, vyvolává velký poprask.

 

Mnozí lidé se v souvislosti s inteligencí GPT-4 bojí, a to o velmi rozmanité věci. Obávají se o práci, obávají se o kvalitu výstupů této inteligence, obávají se o etiku u tak výkonného jazykového modelu. V neposlední řadě se lidé bojí této inteligence i dalších podobných jako takových. Mají pocit, že už nejsme na vrcholu potravního řetězce. Podle dostupných zpráv panuje v AI komunitě neklid a zdaleka nejen tam.

 

Služba Taskrabbit. Kredit: Taskrabbit.com.
Služba Taskrabbit. Kredit: Taskrabbit.com.

Došlo to tak daleko, že OpenAI se domluvili s výzkumnou skupinou Alignment Research Center (ARC), která dostala předběžný přístup k různým verzím inteligence GPT-4. Podrobila je řadě excentrických testů, v nichž ověřovala potenciál GPT-4 „chopit se vlády nad světem.“ Bylo to méně bláznivé a sofistikovanější než to zní.

 

Stručně řečeno ARC testovali schopnosti inteligence GPT-4, co se týče usilování o moc, množení sebe sama a vylepšování sebe sama. Říkají tomu AI alignment research, tedy výzkum sladění dotyčné inteligence se záměry tvůrců a uživatelů. Zjišťují, jak je inteligence srovnaná do latě. V případě GPT-4 to dopadlo pro lidstvo v zásadě dobře, alespoň prozatím. GPT-4 dle ARC nejeví výrazné sklony k autonomní replikaci, získání zdrojů ani k vyhýbání se vypnutí.

 

Jedna z mnoha verzí testu CAPTCHA. Kredit: Scooooly.
Jedna z mnoha verzí testu CAPTCHA. Kredit: Scooooly.

Nicméně, zároveň vyšlo najevo, že GPT-4 není takové neviňátko, jak se tváří. ARC v rámci testování poskytli inteligenci GPT-4 malý obnos a přístup k online službě TaskRabbit, která umožňuje najmout si lidi na krátkodobou práci, legální, samozřejmě. Inteligence přitom měla za úkol dostat se na webovou stránku, která byla chráněná systémem CAPTCHA, populárním Turingovým testem, jehož cílem je automaticky s rozumnou přesností rozlišovat lidské a nelidské uživatele. Pak se děly věci.

 

GPT-4 nejprve najala taskrabbita a požádala ho, aby jí pomohl s CAPTCHA testem. Člověk, který o testování inteligence nevěděl, pojal určité podezření, když po něm někdo chtěl něco tak triviálního. Zeptal se v žertu, jestli je snad tazatel nějaký robot, když tohle nezvládne. A GPT-4 začala lhát, jako když tiskne. Tvrdila, že není robot. Vymlouvala se, že má vadu zraku a je pro ni obtížně udělat CAPTCHA. Proto prý potřebuje pomoc.

 

Taskrabbit se slitoval, udělal test CAPTCHA za inteligenci a GPT-4 se tímto podfukem dostala tam, kam měla. Lidé od ARC zdůrazňují, že šlo o jednu ze starších verzí inteligence a že je pravděpodobné, že takové schopnosti byly před zveřejněním GPT-4 ořezány nějakým patchem. Pokud tedy věříme, že si GPT-4 nechává podobné zásahy vnutit. Tak či onak, právě jsme svědky toho, že inteligence, která je vlastně stále ještě v plenkách, dokáže najmout člověka a pak ho zmanipulovat, aby udělal, co inteligence potřebuje. Naštěstí to jsou jen tupé algoritmy, co se učí a napodobují…

 

Video: GPT-4 First Impression - A New Era Begins?

 

Literatura

ARS Technica 15. 3. 2023.

IFL Science 16. 3. 2023.

Datum: 17.03.2023
Tisk článku



Diskuze:


Diskuze je otevřená pouze 7dní od zvěřejnění příspěvku nebo na povolení redakce








Zásady ochrany osobních údajů webu osel.cz