O.S.E.L. - Open Virome vytěžil 130 tisíc nových RNA virů z 20 petabytů sekvencí
 Open Virome vytěžil 130 tisíc nových RNA virů z 20 petabytů sekvencí
Nesmírně výkonný systém na zpracování sekvencí Serratus v rámci projektu Open Virome prohledal 5,7 milionů přečtených sekvencí získaných na nejrůznějších místech planety. Trvalo mu to 11 dní a za tu dobu objevil téměř desetkrát tolik RNA virů, než jsme doposud znali. Nově objevené RNA viry představují velmi užitečnou zbraň proti virům samotným i proti budoucím pandemiím.

Lokality, odkud byla odebrán vzorek. Kredit: Serratus Project.
Lokality, odkud byl odebrán vzorek. Kredit: Serratus Project.

Ohromující. Tenhle výzkum má prakticky všechno, čím žije dnešní věda. Skvělé nápady. Rekord. Biodiverzitu. Planetu. Superpočítač. Cloud. Globální databázi. Sekvence. RNA viry. A samozřejmě koronaviry, kterých má nejspíš i věda už plné zuby. Zároveň jde o velmi užitečný nástroj pro vědce i lékaře, který se bude hodit při příštím průšvihu s virem. Jak se říká, v pandemii přeje štěstí připraveným.

 

Artem Babaian z kanadské University of British Columbia a jeho mezinárodní tým se vrhli na globální databázi sekvencí Sequence Read Archive (SRA). Jsou tam uloženy desítky milionů gigabytů přečtených DNA a RNA sekvencí, odebraných v rozmanitých ekosystémech, po celé planetě. Když čtete sekvence, prakticky vždy se tam objeví nějaké viry. Odborníci předpokládají, že tam mohou být stovky tisíc virů. Až doposud bylo prakticky nemožné tak rozsáhlá data systematicky analyzovat.

 

Artem Babaian. Kredit: University of British Columbia.
Artem Babaian. Kredit: University of British Columbia.

Babaian s kolegy vyvinuli v rámci projektu „Open Virome“ ultraoptimalizovaný bioinformatický systém Serratus se superpočítačovým výkonem, který je založený cloudových výpočtech. Dokáže analyzovat monstrózně veliká data v planetárním měřítku. Jeho specialitou je bleskurychlé zpracovávání sekvencí.

 

Vědci vypustili Serratus na 5,7 milionů přečtených sekvencí v databázi SRA, což odpovídá přibližně 20 petabytům (milionům gigabytů) dat. Vzorky byly nasbírané během posledních 13 let a pocházejí ze všech myslitelných prostředí, od vyvrtaných ledovcových jader po zvířecí trus.Jak říká Babaian, tradiční superpočítač by takovou analýzu dělal asi tak rok a spolkl by za to stovky tisíc dolarů. Serratus to zvládl za 11 dní a 24 tisíc dolarů.

 

Logo. Kredit: University of British Columbia.
Logo. Kredit: University of British Columbia.

Celkový počet druhů virů na Zemi se velmi hrubě odhaduje na asi 100 milionů. Ve skutečnosti ale známe jen zcela mizivý zlomek planetárního viromu. Až do výzkumu Babaianova týmu a projektu Open Virome bylo na celém světě dohromady známo asi 15 tisíc RNA virů. Serratus vytáhl ze zmíněných 20 petabytů dat asi 130 000 doposud neznámých RNA virů. Počet RNA virů známých pro vědu se tedy během 11 dní výpočtů Serratu téměř zdesetinásobil. Mimo jiné je mezi nimi 9 doposud neznámých koronavirů.

 

Výsledkem výzkum je soubor nově objevených RNA virů, který se jmenuje „Open Virome.“ Jak jméno napovídá, data jsou volně dostupná pro každého. Tyto nové sekvence RNA virů značně vylepší soudobé virologické modely a nepochybně obohatí RNA virologii, v mnoha ohledech. Pandemie covid-19 jednou skončí. Zároveň si můžeme být docela jistí, že nebude poslední. S nástroji jako je Oper Virome budeme na příští pandemii lépe připraveni.

 

Video: Serratus: Ultra-deep search for novel Coronaviruses

 

Literatura

University of British Columbia 26. 1. 2022.

Preparing a Pandemic Response: The Open Virome

Nature online 26. 1. 2022.


Autor: Stanislav Mihulka
Datum:30.01.2022