Počítač s největším čipem porazil superpočítač Joule v rychlosti výpočtů

Megačip WSE obsahuje 1,2 bilionů tranzistorů a téměř 400 tisíc výpočetních jader. Díky své unikátní architektuře představuje superpočítač na čipu a klidně to dokáže. Systém CS-1 s tímto čipem nedávno hravě porazil superpočítač Joule v simulaci elektrárenských spalovacích procesů.

Megačip WSE vs největší GPU

Asi tak před rokem kalifornský startup Cerebras Systems ohromil svět svým unikátním čipem nebo spíše celým waferem WSE, s 1,2 biliony tranzistorů a téměř 400 tisíci programovatelných výpočetních jader. Už tehdy se mluvilo o tom, že megačip WSE je vlastně celý superpočítač na čipu s ohromujícím výkonem. Cerebras záhy vytvořil počítačový systém CS-1, který používá právě čip WSE. A jak se zdá, rekordně velký čip si superlativy rozhodně zaslouží.

Cerebras Systems, logo.

Cerebras nedávno zveřejnil, že jejich počítačový systém CS-1 změřil síly v simulaci elektrárenských spalovacích procesů se superpočítačem Joule 2.0. Tento superpočítač pracuje v laboratořích National Energy Technology Laboratory (NETL). Jde o momentálně 81. nejvýkonnější superpočítač světa, který má k dispozici 271 TB paměti, může uložit 11,6 PB dat a jeho síť přenáší data rychlostí 83,2 TB za sekundu.

Přesto se Joule 2.0 s počítačovým systémem CS-1 nemůže měřit. Ten zmíněné simulace zvládá 200 krát rychleji. Jak skromně uvedli šéf týmu Cerebras Michael James a Dirk Van Essendelft z amerického ministerstva energetiky, pro CS-1 s megačipem WSE nejsou soudobé superpočítače důstojným soupeřem. A to bez ohledu na počet procesorů a grafických procesorů, které mají k dispozici.

Počítačový systém CS-1. Kredit: Cerebras Systems.

Superpočítač Joule 2.0 využívá čipy Intel Xeon po 20 výpočetních jádrech, přičemž těchto jader má celkem 16 tisíc. Megačip WSE má výpočetních jader zhruba 25 krát víc, plus 18 GB paměti RAM. Prvky čipu spojuje komunikační systém Swarm, který přenáší data rychlostí 100 PB za sekundu. Joule zvládl simulaci elektrárenských spalovacích procesů za 6 milisekund a CS-1 ho deklasoval za 28 mikrosekund.

Šéf Cerebras Systems Andrew Feldman nepochybuje, že pro tento typ výpočtů je jejich CS-1 nejrychlejším počítačem, co byl zatím postaven. Je rychlejší než jakákoliv dosavadní kombinace čipů a procesorů. Je dokonce tak rychlý, že spočítá simulaci elektrárenských spalovacích procesů rychleji, než takový proces v reálném čase proběhne. Podle svých tvůrců je tedy vlastně rychlejší než fyzika. Klíčem k úspěchu systému CS-1 je podle všeho především práce megačipu WSE s pamětí. I když má superpočítač Joule jednoznačně větší paměť, tak ji nedokáže využívat tak efektivně jako CS-1.

Video: How Cerebras Built the World’s First Wafer-Scale Processor

Literatura

Tech Xplore 26.11. 2020.

Autor: Stanislav Mihulka

Datum: 29.11.2020

Tisk článku

Související články:

Superpočítač Trinity simuloval DNA s rekordní miliardou atomů Autor: Stanislav Mihulka (26.04.2019)
Unikátní escherovský čip simuluje interakce částic v hyperbolické geometrii Autor: Stanislav Mihulka (15.07.2019)
Nejrychlejší počítač pro umělou inteligencí má v sobě největší čip na světě Autor: Stanislav Mihulka (25.11.2019)

Diskuze:

Technické a fyzikální výpočty vs. zbytek světa

Martin Prokš,2020-12-01 09:50:14

Dobrý den,

Je to již před deset let co do technických a fyzikálních výpočtů nedělám (no já to aktivně pořádně nedělal nikdy, jen jsem s tím koketoval a pak jsem přešel na pozici správce výpočetního clusteru). Ale co si pamatuji z prouďařiny (CFD) tak problémy jsou:

1) Fyzikální výpočty jsou jen zlomek světa - o takové počítače "skoro" není zájem. Těch organizací které by si je pořídili je tak málo, že specializované počítače se nezaplatí. Respektive pár se jich dělá, ale cena/výkon je strašlivá protože náklady se rozpočítávají do pár kousků. Zatímco databází, IT a podobně úloh je ve světě mraky a chce to každý, takže se náklady rozpustí ve velkých sériích a cena je přijatelná. Takže fyzici jsou ve většině případů odkázáni na neoptimální HW. Čest výjimkám jako je tohle a ostatní superpočítače.

2) Situace se začla trošku měnit s nástupem masivního computingu na grafických kartách právě před cca 10 lety.

3) Mnoho fyzikálních úkolů lze na úrovni samotného výpočtu masivně paralelizovat (druhá věc pak je licenční politika vláken a procesů u technických komerčních SW). CFD, MKP, teplo, chemie, ... Tak jak to tu už někteří popisovali. Kritická je rychlost výměny dat mezi procesory - optimalizace výpočetních přesahů, synchronizačních taktů a tak. Pro CFD a klasické procesory na desce s klasickou RAM jsme před 10 lety byly na optimálním poměru 16 procesorů a 512MB RAM na procesor, maximum 1024MB RAM na procesor. Prostě bojujete propustností RAM-CPU a výměnou dat mezi vlákny, nebo nedej bože mezi jednotlivými počítači. Takže pokud jsou všechny procesory na jednom čipu a mají mezi sebou výměnu dat prakticky bez zdržení, pak 45kB na CPU nemusí být zcestné, hodně záleží na typu úlohy.

4) Ten opravdový problém s reálnými úlohami ale často je (alespoň v CFD a MKP) v pre-processingu a post-processingu. Příprava sítě a okrajových podmínek, to těžko paralelizujete. Stejně tak potom celkové vyhodnocení výsledků není moc vhodné na paralelizaci. Nevím jestli se za těch 10 let situace někam hnula, ale tohle byl ten největší žrout času a často reálně omezoval velikost zvládnutelné úlohy.

Ale dnes už do toho přes 10 let nedělám, třeba se situace někam pohla. Docela by mě to pro zajímavost zajímalo.