Porazí počítač nejsilnějšího hráče go světa?

Desková hra go už dlouhá léta platí za poslední klasickou logickou hru, v níž počítače nedokáží přelstít lidský mozek. Toto tvrzení však možná už za několik málo dní nebude platit. Ve středu 9. března totiž začne přelomová událost v oboru umělé inteligence: zápas počítačového programu AlphaGo od společnosti Google DeepMind proti nejsilnějšímu hráči světa poslední dekády Lee Sedolovi z Koreje.

Deep Blue (IBM)

Fanoušci logických her si možná vzpomenou na rok 1997, kdy tehdy nejsilnější světový šachista Garri Kasparov prohrál se superpočítačem firmy IBM Deep Blue. Po tomto historickém zápase se pozornost obrátila ke hře go. I přes obrovské nasazení programátorů trvalo dlouhých osmnáct let, než se podařilo vytvořit program, který by se mohl měřit s profesionálními hráči. Až loni v říjnu program AlphaGo překvapivě porazil trojnásobného mistra Evropy a zároveň profesionála Fan Huie z Francie, a to se skóre 5:0. Do té doby i nejsilnější programy hrály pouze na úrovni silných amatérů. Po pěti měsících se program AlphaGo chystá na mnohem silnějšího soupeře. Třiatřicetiletý Lee Sedol je nejúspěšnějším hráčem go posledních více než deseti let. Za svou kariéru vyhrál osmnáct mezinárodních turnajů nejvyšší kategorie, čímž se v historických tabulkách řadí na druhé místo.

AlphaGo - počítačový program vyvinutý firmou Google DeepMind

Hrát se bude opět na pět partií. Vítěz, který bude jasný nejpozději 15. března, si odnese milion dolarů. Tipy odborníků se různí. Mistr Evropy Fan Hui sice zdaleka není tak silný jako Lee Sedol, na druhé straně je otázka, jak moc se AlphaGo dokázal během posledních pěti měsíců zlepšit.

Co je to go?
Go je nejstarší desková hra na světě. Vznikla před 4-5 tisíci let v Číně. Odtud se rozšířila po celé východní Asii, kde je dodnes velmi populární. V posledních desetiletích však získává čím dál více příznivců i v dalších částech světa. Pravidla go jsou velmi jednoduchá a zvládnou je i malé děti: Dva hráči střídavě pokládají na desku své kameny a snaží se ohraničit si co největší území a zároveň obklíčit co nejvíce kamenů soupeře. Hru go hrála nebo hraje celá řada známých osobností. Go uměl například Albert Einstein. Zakladatel firmy Microsoft Bill Gates měl dokonce v mládí cíl stát se nejsilnějším hráčem go na světě. Ze známých Čechů se pak hře go věnuje miliardář a bojovník proti korupci Karel Janeček

AlphaGo (černé kameny) versus Fan Hui, čtvrtá hra. 8. října loňského roku Fan Hui rezignoval.

Proč je programování go tak složité?
Prvním problémem je počet variant. „Oproti u nás známějšímu šachu má hráč go v každém okamžiku mnohem více možností, jaký udělat další tah. A systematicky probrat všechny možnosti je pro počítač neskonale obtížnější,“ říká Petr Baudiš, odborník na umělou inteligenci a programování go z Fakulty elektrotechnické ČVUT. Zatímco u šachů je počet variant zhruba 10²⁰⁰, u go, které se hraje na desce 19×19 průsečíků, je to 10⁸⁰⁰. Pokud to velmi zjednodušíme, tak na hru go bychom potřebovali 10⁶⁰⁰× rychlejší superpočítač Deep Blue než na šachy (nikoliv čtyřikrát rychlejší, jak by se mohlo na první pohled zdát). To je i přes technický pokrok nepředstavitelné.

Druhým problémem je, že v go je velice obtížné najít algoritmus na správné ohodnocení síly tahu. Jasné lokální vítězství může při celkovém pohledu být ztrátou. Je lepší si naznačit malé jisté území, nebo velké nejisté? Jaké slabiny nebo naopak silné stránky bude položený kámen mít třeba za 50 nebo 100 tahů? Velkou roli při těchto hodnoceních hrají zkušenost a intuice hráče. Navíc lidský mozek má schopnost rychle a poměrně přesně odfiltrovat vyloženě špatné tahy. První plně funkční počítačový program hrající go vznikl již v roce 1968. Od té doby bylo představeno několik set dalších programů. Byly vypsány finanční odměny, např. pro autory programu, který jako první porazí profesionála. Přesto výsledky až do minulého roku zůstávaly daleko za očekáváním.

Lee Sedol Go je poslední logickou hrou, u níž se i přes desítky let trvající snahu nedařilo vymyslet způsob, jak mají počítače člověka porazit. Až nyní to vypadá, že by mohl i tento milník umělé inteligence být překonán. Zvítězí počítač nad nejlepším hráčem světa ve hře go? (Kredit: senseis.xmp.net)

Řešení: hluboké neuronové sítě a Monte Carlo
Je jasné, že běžnými programátorskými postupy je go neřešitelný oříšek. Velký krok kupředu znamenala až aplikace tzv. hlubokých neuronových sítí a metody Monte Carlo. Neuronové sítě svým způsobem imitují lidský mozek. V umělé inteligenci se používají k řešení úloh, které jsou běžnými postupy neřešitelné, případně velmi obtížně, např. rozpoznávání lidí na fotografii. Přitom člověk v řadě případů tyto úlohy řeší bez velkých obtíží. Hluboké neuronové sítě navíc mají tu výhodu, že dokáží učit samy sebe.

„Tým kolem programu AlphaGo používá neuronové sítě podobné třeba těm, kterými Facebook rozpoznává tváře nebo které stojí za chytřejším hledáním obrázků na internetu. Tento nápad neměl Google jako první, ovšem doteď se neuronové sítě učily pouze z cizích mistrovských partií. I člověk se ovšem ze svých vlastních chyb naučí více než při sledování hry jiných a tým z výzkumné společnosti DeepMind vlastněné Googlem vymyslel nový způsob, jakým se neuronová síť dokáže učit z partií, které sama odehrála – to, spolu s použitím obrovského výpočetního výkonu Googlu na naučení herního algoritmu, může za poslední průlom v herní síle,“ popisuje Petr Baudiš.

Velký krok kupředu znamenalo i nasazení matematické metody stromového prohledávání nazvané Monte Carlo zhruba před deseti lety. Tato metoda je známa už od 40. let 20. století a byla původně používána např. při vývoji jaderných zbraní. Ve hře go její nasazení vypadá tak, že pro každý neuronovou sítí předvybraný tah partii náhodně mnohokrát dohraje. A poté vyhodnotí statisticky nejúspěšnější tah. Přestože tato metoda v souvislosti s go vypadá velmi primitivně a fádně, znamenala velký pokrok kupředu

Josef Moudřík

Právě spojení těchto dvou metod je klíčem k síle programu AlphaGo. Hluboké neuronové sítě mají schopnost rozlišit dobré a špatné tahy nebo vyhrávající a prohrávající pozice. V tomto ohledu pracují podobně jako vizuální intuice silných hráčů. Metoda Monte Carlo sice nemá žádné podobné specifické znalosti hry, které člověk používá k odfiltrování špatných tahů, je ale zase velmi dobrá k prohledávání velkého množství kombinací. „Spojením obou technik je AlphaGo schopné dobře prohledávat relevantní varianty a dostatečně brzy rozpoznat, která varianta vede k výhře a která k prohře,“ říká Josef Moudřík z Matematicko-fyzikální fakulty Univerzity Karlovy, další z českých odborníků na programování hry go.

Je důležité dodat, že programování go není úplně samoúčelné. Právě jeho složitost, kde není možné pouhé „hrubé“ prohledávání, ale je potřeba si vypomáhat vizuální intuicí a abstraktním myšlením, z něj dělá ideální pole pro výzkum umělé inteligence. „Vyvinuté algoritmy – ať již jde o prohledávání, hluboké neuronové sítě nebo sebezdokonalovací programy – mají široké pole aplikací: od robotiky a samohybných vozidel, přes porozumění obsahu z obrazu, videa a textu, automatického překladu textů až třeba k aplikacím v medicíně,“ dodává Josef Moudřík.

Podrobnější informace na stránce DeepMind a České asociace go

Literatura:

David Silver et al.: „Mastering the game of Go with deep neural networks and tree search“, Nature 529, 484–489 (28 January 2016) doi:10.1038/nature16961

Video: Pravidla hry během 15 minut

Základní lekce

Autor: Tomáš Grosser

Datum: 07.03.2016

Tisk článku

Diskuze:

Takže to máme

Zab Hazar,2016-03-15 17:32:19

za sebou, herní a počítačová historie si může směle zapsat nový milník. Ale, mým laickým okem, poslední partie byla pro AlphaGo snad "nejpočítačovější ". A co to tam bílý provedl hned na začátku...?

Odpovědět

Lidský faktor

Milan Krnic,2016-03-13 14:27:30

Lee po zápasech řekl zhruba, že byl zdeptaný z předchozích proher a tlaku, který na něj AlphaGo vyvíjel. A že si uvědomuje chybné volby, které v posledních dvou hrách udělal.
Ale i některé "chyby" AlphaGo, kdy tuto domněnku potvrdil i zástupce vývojářů s tím, že to začnou vyhodnocovat.
Je tedy otázkou, jak by do dopadlo bez emocí.
A dále kam nás toto technologicky posune dál (Skynetu bych se v tomto případě nebál, pořád to je jen výkonná kalkulačka).
Mistr Sedol je borec.

Odpovědět

Re: Lidský faktor

Milan Krnic,2016-03-13 15:15:09

* Po třech zápasech z pěti.

Odpovědět

Takže to máme 3:0

Zab Hazar,2016-03-12 15:51:25

A člověk by skoro řekl - jak prosté. Ale imho to co se rozhořelo před koncem v té dolní levé části (a pokud jsem to vůbec aspoň trochu dokázal pochopit) bylo dooost husté. Úžasná hra; řekl bych mnohem estetičtější než ta první :-D

Odpovědět

na 3 vitězné

Zdeněk Syk,2016-03-10 18:45:27

tak už je to 2:0 :c)

Odpovědět

2:0

Richard Malaschitz,2016-03-10 10:11:02

AlphaGo vyhral aj druhú partiu.

Počítačové sledujem od čias ZX Spectra a vždy som si myslel, že počítače nemajú šancu. Ešte aj teraz porazím v Go svoj mobil - a to som slabý hráč (7k). V šachu je situácia iná - šachový program na mobile porazí aj majstra sveta.

Ani keď AlphaGo porazil Fan Huie, tak som neveril, že by mal proti Lee Sedolovi šancu - rozdiel medzi nimi je proste stále obrovský. Ak je AlphaGo schopné hrať Go, tak podla mňa skôr alebo neskôr nebude existovať problém, ktorý by počítače nedokázali zvládnuť lepšie ako ľudia.

Odpovědět

Tak sotva jsem

Zab Hazar,2016-03-09 19:02:40

dnes otevřel internet, hnedle pecka jaxviň: AlphaGo vyhrál první hru!
Myslím si, že autor článku je zcela jistě jedním z nejpovolanějších, kdo by mohl tento článek (nejen dnes) ale i další dny průběžně aktualizovat a komentovat "v lidštině", abychom i my, polo-laici či laici, mohli vychutnat tuto - sice velmi specifickou - přesto dost možná přelomovou událost. Pokud by to šlo, prosil bych o to...

Odpovědět

Diskuze je otevřená pouze 7dní od zvěřejnění příspěvku nebo na povolení redakce

Myšlenka a video dne

„Zlořečný je ten, kdo pro skývu chleba opustí pravdu.“ (Jan Hus)

Reklama

Sponzoři a partneři