Částice kosmického záření vyvolávají poruchy elektroniky  
Zamrzl vám chytrý telefon? Možná za to může kosmické počasí. Žijeme v neklidném vesmíru a musíme s tím počítat.

 

Kosmické počasí působí na elektroniku. Kredit: NSF / J. Yang.
Kosmické počasí působí na elektroniku. Kredit: NSF / J. Yang.

Poruchy elektroniky jsou k vzteku. Jak jistě každý ví, dovedou přijít v nejméně vhodnou chvíli. Na uživatele zabliká modrá obrazovka anebo všechno najednou přízračně ztuhne. Tím nejméně bolestivým následkem bývá ztráta času, ztracená práce bolí ještě daleko víc. V takovém okamžiku se z člověka dere ven zuřivost a jejím terčem se obvykle stává výrobce dotyčného zařízení anebo software, případně sám uživatel, pokud si je vědom vlastní chyby. Někdy je ta nenávist oprávněná. V řadě případů ale kupodivu nikoliv.

 

Bharat Bhuva. Kredit: Vanderbilt University.
Bharat Bhuva.
Kredit: Vanderbilt University.

Na životní pochody naší hýčkané elektroniky totiž překvapivě často působí mimozemské síly. Doslova. Nejsou to žádné alternativní bláboly, ale čirá astrofyzika. Elektroniku intenzivně ovlivňují elektricky nabité částice vytvořené kosmickým zářením, které k nám přilétá z hlubokého vesmíru. Podle Bharata Bhuvy z Vanderbiltovy univerzity je to dost velký problém, i když ho veřejnost z valné většiny přehlíží. Bhuva o tom přednesl příspěvek pod slibným názvem „Zataženo, občas sluneční erupce: Vyčíslení rizik kosmického počasí“ na výročním setkání American Association for the Advancement of Science v americkém Bostonu.


Když vysokoenergetická částice kosmického záření, která se žene vesmírem ohromnou rychlostí, zasáhne vnější vrstvu atmosféry Země, tak tím vyvolá spršku sekundárně vzniklých částic, včetně energetických neutronů, mionů, pionů a alfa částic. Tělo každého z nás zasahují každou sekundou miliony takových sekundárních částic kosmického záření. Navzdory tak velkému počtu jsou ale podle dosavadních znalostí tyto částice vesměs neškodné. Zároveň ale jistá frakce těchto částic nese dostatek energie na to, aby částice mohly narušit činnost elektronických obvodů. Svým působením mohou například změnit jednotlivé bity dat, které jsou uloženy v paměti.

 

Průlet částice jednotkou paměti SRAM. Kredit: Sanfordlab.
Průlet částice jednotkou paměti SRAM. Kredit: Sanfordlab.

Takovým událostem, které může vyvolat jeden iont, elektron nebo třeba foton, se říká jednorázové náhodné poruchy (SEU, anglicky single-event upset) a jsou velmi nepředvídatelné. Nikdo neví, kdy a kde v elektronických obvodech k tomu dojde, takže je velice obtížné takovým poruchám čelit. Je také těžké už jenom přijít na to, že šlo o SEU. Podle Bhuvy je jedinou možností postupně vyloučit všechny ostatní možné zdroje chyb, což bývá dost komplikované. Vlivu kosmického počasí na elektroniku si všimneme jenom tehdy, pokud jsou jeho důsledky dramatické. Přitom jde podle všeho jenom o špičku ledovce.


V roce 2003 kosmický vliv rozvrátil volby v belgickém městě Schaerbeek. Částice atmosférické spršky zasáhla elektronické volební zařízení a přidala jednomu kandidátovi 4 096 hlasů. Případ vyšel najevo jenom proto, že v daném volebním obvodu nebylo možné získat tolik hlasů. Někdy jde i o život. V roce 2008 částice ze spršky vyřadila autopilota dopravního letadla společnosti Quantas na trase ze Singapuru do Perthu. Stroj se během chvilky propadl o více než 200 metrů, což vedlo ke zranění třetiny pasažérů a nouzovému přistání na nejbližším letišti.

 

Četnost SEU u různých prvků mikroelektroniky. Kredit: B. Bhuva / Vanderbilt
Četnost SEU u různých prvků mikroelektroniky. Kredit: B. Bhuva / Vanderbilt

Jak časté takové události mohou být? V roce 2004 to zhodnotili odborníci u elektroniky, která byla z dnešního pohledu o generaci starší. Tehdejší mobilní telefon s 0,5 GB pamětí by se s takovou chybou setkal jednou za 28 let. Routery internetového poskytovatele se 25 GB paměti by kvůli kosmickému záření chybovaly jednou za 17 hodin. A pokud by někdo na palubě letadla ve výšce 10 700 metrů pracoval s notebookem s 0,5 GB pamětí, tak už by se setkával s kosmickou chybou jednou za pět hodin.


Se zmenšováním velikosti tranzistorů v elektronických obvodech problém s kosmickým zářením narůstá. V menších tranzistorech totiž logické bity reprezentuje nižší elektrické napětí. A pro částice ze spršek vyvolaných kosmickým zářením je snazší takový bit překlopit. 3D architektura čipů je proti takovým událostem odolnější nežli 2D architektura, není ale všemocná. Můžeme s kosmickými chybami něco udělat?


K naší smůle bohužel nic moc. Se stávajícími technologiemi nejsme schopni chránit elektroniku před částicemi tak, aby to bylo praktické a levné. Například, pro odstínění energetických neutronů by bylo nutné použít více než 3 metry betonu. Takový chytrý telefon by asi nosil málokdo. Dobrou zprávou je, že vliv kosmického počasí na elektroniku lze omezit úpravami designu čipů. U kriticky významných obvodů například můžeme prostě a jednoduše všechny komponenty ztrojnásobit. Pravděpodobnost, že čip zasáhnou částice kosmického původu třikrát na stejném místě, je zcela mizivá. Zranitelnost takového systému pak značně klesá. Dobrou zprávou také je, že vojáci, piloti, dispečeři, kapitáni, lékaři, astronauti i inženýři o této záležitosti vědí. A počítají s nimi. Na nás ostatních je, abychom se s tím zatím smířili.

Literatura
Vanderbilt University 17. 2. 2017, Wikipedia (Single event upset).

Datum: 01.03.2017
Tisk článku

Související články:

Odpaluje blesky kosmické záření?     Autor: Stanislav Mihulka (09.05.2013)
Jak kosmické záření ovlivňuje obyvatelnost planet?     Autor: Stanislav Mihulka (13.11.2013)
Mimozemský život by se mohl živit energií kosmického záření     Autor: Stanislav Mihulka (14.10.2016)



Diskuze:

Trocha praktickych zkusenosti

Karel Marsalek,2017-03-02 16:17:52

Vazeni kolegove, vyvijim merice inoizujiciho zareni, ktere se pouzivaji v kosmu (na ISS nebo na satelitech). V prizemi nekolikapatrove budovy zaznamenava kremikova fotodioda (1cm2 plocha, 300µm tloustka) prumerne 5 nabitych ionizujicich castic za minutu (neutrony detekovat prakticky nedokaze). Tyto ionty kosmickeho zareni projdou snadno nekolika desitkami cm betonu i nekolika mm kovove (Al) skrine detektoru. Cim energetictejsi castice tim vetsi maji "pronikavost" (angl. range) a tim mene energie deponuji v materialu/polovodici. Naopak, cim pomalejsi castice (mene energeticka), tim snadneji a vice deponuje energii az dojde k jejimu uplnemu zastaveni (stopping particle).

Radiacni zatez elektroniky na obezne draze je napriklad ve vysce ISS (400 km) docela bezproblemova, nedochazi ke znatelne degradaci polovodicu a jejich vlastnosti vlivem celkove absorbovane davky (posuny pracovnich bodu tranzistoru, zmeny napeti napetovych referenci, zmeny parametru operacnich zesilovacu), ale dochazi k single-event-upsets, ktere mohou trvale poskodit polovodice vlivem lokalni tepelne destrukce. Pokud se zarizeni vcas vypne (elektronicka pojistka), vnitrni "zkrat" zmizi a pristroj pracuje open normalne.

Na vyssich orbitach (napr. geostacionarni, 36 tis. km) a v otevrenem vesmiru je navic potiz s vysokou akumulovanou davkou zareni v prubehu mise. Soucastky se testuji na davku 3000 Gy (pro cloveka je 5 Gy jednorazove letalni).

Jak pri navrhu HW tak i pri tvorbe softwaru pro tato zarizeni je potreba mit tyto efekty na pameti a pocitat s tim, ze napr. zadne hodnote promenne v SW nelze apriori verit (bit flips) a je potreba pouzivat redundantni kod/vypocty, pouziti redundantnich HW bloku a radiation-hard elektroniky.

Odpovědět

Systémy bezpečné při poruše

Petr Bürger,2017-03-02 10:04:28

Dobře navržené zařízení s takovou situací počítá - jak na úrovni HW, tak i SW.
Dnes je k dispozici dostatek zkušeností, jak chybu ošetřit a minimalizovat její dopady.
Krom zmiňovaných záloh ("ztrojení HW uvedené výše, pravdu má většina"), se provádí i kontroly plausibility údajů - tedy zda zpracováváme "rozumné" číslo. Také lze relativně snadno data filtrovat: fyzikální procesy, které sledujeme a řídíme, jsou zpravidla mnohem pomalejší, než rychlost jejich čtení a zpracování. Takže lze poměrně jednoduše vyloučit data, kde gradient jejich změny neodpovídá známým fyzikálním zákonům.
A další možnost - uvedená v nadpisu - je ve správném návrhu systému. Zjednodušeně řečeno, pokazí-li se řadič semaforu na křižovatce, spadne to všechno do žluté - nikdy mi nedá všude zelenou. Udělá se to třeba tak, že kontakty relé bez napětí vedou na tu žlutou žárovku.

Odpovědět


Re: Systémy bezpečné při poruše

David Oplatek,2017-03-02 12:48:38

Bavím se o podmínkách v kosmu. Vyšší složitost kódu předpokládá větší pravděpodobnost selhání - vyváží to ta rizika nebo sondy používají i nějakou hardwarovou kontrolu? Uvedl byste nějaký příklad pro představu? Bývají poruchy nárazové (na několika místech naráz, v krátké chvíli) nebo spíše výjimečné? (ve druhém případě by softwarová kontrola dávala smysl; jinak si asi dokážu představit třeba volbu vhodné bitové velikosti jednotlivých proměnných, kde by například přetečení v některých případech nemuselo způsobit takovou katastrofu) Mockrát děkuji za odpověď, toto téma mě zaujalo.

Odpovědět


Re: Re: Systémy bezpečné při poruše

Alexandr Kostka,2017-03-02 18:06:46

Netuším jak software, ale tam se spíš zálohuje celý kus hardwaru. Viz (problematické) navigační satelity Galileo, kde jsou atomové hodiny hned ve 4 kusech. http://www.kosmonautix.cz/2017/01/galileo-ma-opravdu-velky-problem-s-hodinami/

Odpovědět


Re: Re: Re: Systémy bezpečné při poruše

David Oplatek,2017-03-02 20:02:03

Zrovna u Galilea se mi zdá, že se jedná buď o problém návrhu celých hodin (spíš), nebo výrobní vadu, i kdyby byla ve struktuře materiálu.

Odpovědět

Pravděpodobnost

Alexandr Kostka,2017-03-02 07:46:12

Ano, částice schopné zkratovat paměťovou buňku (a tím změnit obsah) určitě existují. Není jich málo, ale šance, že se "to seklo" kvůli tomu je poměrně nevelká. A) jak zde již bylo řečeno, s možností, že "paměť nedrží" se už při návrhu počítá, takže má zahrnuté kontrolní součty. B) i když už k něčemu takovému dojde, je velmi malá šance "zásahu" místa s kritickým obsahem. Uvědomte si, kolik místa zabírá program (a i tam bývá obvykle xy částí, která ani nepoužijete, tudíž se jejich nefunkčnost neprojeví) a kolik data. Fotky, videa, zvuky.. Když se přepíše jeden bit ve fotce, tak máte prostě na jednom jediném pixelu trávu zelenější. (nebo modřejší, nebo..) V naprosté většině případů si takového artefaktu ani nevšimnete, natož aby "to spadlo". C) platí to hlavně pro elektroniku pod širým nebem. Domácí stolní pc je dost slušně chráněno, jednak domem, dvak vlastní "bednou", klasický pevný disk má ještě další vrstvu kovu.. Ano, existují i částice, které toto "prostřelí", ale ty pak obvykle s pevnou hmotou moc nekamarádí a proletí dál, aniž by cokoliv měnily. Tudíž teorie pěkná (a pravdivá), ovšem stejně je většinou na vině výrobce, ať již hardware (nepatrná chybička v materiálu) či software (omyl programátora)!

Odpovědět

kosmické záření

Stanislav Florian,2017-03-01 23:51:13

Konečně je čím vysvětlit biliony Kč utracené centrální bankou na snížení kurzu koruny.

Odpovědět

Dobrá zpráva je...

Petr Kr,2017-03-01 16:55:44

"Dobrou zprávou také je, že vojáci, piloti, dispečeři, kapitáni, lékaři, astronauti i inženýři o této záležitosti vědí." Špatnou zprávou je, že inženýři, lékaři, ředitelé, vojáci, programátoři i učitelé o tom nevědí. Je to jako se vším. Jeden lékař ví o tom, jak operovat žlučník a dělá to a 100 jich to nedokáže. Jeden inženýr ví jak se vyrábí benzín a 100 dalších to netuší, nebo to zapomnělo. Takže mne to také překvapilo, jak je to četný děj a nevím, zda budu teď klidněji spát, když vím, že to dispečeři znají, ale známý dispečer to nevěděl. Mám také pocit, že to inženýři mimo JE také neřeší, jinak by ty ovládací PC s windows možná v chemických provozech nepoužívali.

Odpovědět

S chybami se počítá

Gordon Freeman,2017-03-01 11:37:04

V elektronice máme kontrolní obvody, počítají se kontrolní součty, ověřuje se integrita dat. U důležitějších systémů je tato ochrana ještě zesílena (např. ECC u RAM). Ve hře jsou jak náhodné chyby (záření, pravděpodobnost neudržení informace, tunelování elektronu), tak ty softwarové bugy. Poradit si s tím je úplně jiná matematická liga, která je nejspíše mimo chápání většiny zdejších čtenářů.

Odpovědět


Re: S chybami se počítá

Lukáš Fireš,2017-03-01 12:56:11

https://cs.wikipedia.org/wiki/Hamming%C5%AFv_k%C3%B3d

Odpovědět

Rastislav Rechtorik,2017-03-01 11:25:14

pekne, ale za chybou o 4096 hlasov by som skor hladal nieco ako pretecenie premennej. Nasobok 1024 vyzera dost podozrivo.

Odpovědět


Re:

Adam Trhoň,2017-03-01 11:33:50

4096 je 2**12, odpovídá to překlopení 12. bitu počitadla z nuly na jedničku.

Odpovědět


Re:

Petr Kr,2017-03-01 13:21:11

Belgie je malá zem a počet obyvatel lze definovat proměnnou integer na 12 bitů. To u nás by museli programátoři přidat jen pro Slezsko, a co teprve pro Moravu (Brno a okolí).

Odpovědět


Diskuze je otevřená pouze 7dní od zvěřejnění příspěvku nebo na povolení redakce








Zásady ochrany osobních údajů webu osel.cz