Odhalování našeho genetického programu Understand article

Přeložila Jana Hájková. Co dělá většina naší DNA? Stovky vědců strávily mnoho let zkoumáním tzv. odpadních sekvencí („junk“), které by mohly posloužit jako klíč k závažným chorobám.

Obrázok so súhlasom fr73 /
iStockphoto

Projekt lidského genomu – sekvenování lidského genomu – představuje hlavní úspěch uplynulého desetiletí. Projekt odhalil, jak vypadají ony tři miliardy bází lidského genetického programu. Tím to celé ale nekončí. Abychom pochopili, jak genom funguje, je naproto zásadní rozluštit, jak buňky sekvence DNA interpretují. Pak by se snad dalo toto poznání využít v biochemickém výzkumu a ve zdravotnictví.

Obrázek 1: Výstup z
automatizovaného
sekvenátoru využívaného při
Projektu lidského genomu k
určení úplné sekvence lidské
DNA. Každý vrchol křivky
ukazuje přítomnost určité
báze. Projekt lidského
genomu identifikoval 3
miliardy písmen tvořící náš
genom. ENCODE nyní ukazuje
detaily fungování našeho
genomu. Kliknutím na
obrázok ho zväčšite.

Obrázok so súhlasom Genome
Research Limited

Jedním z velkých překvapení, které výzkum lidského genomu přinesl, bylo zjištění, že geny chápané jako instrukce k tvorbě proteinů jsou neseny pouhými 2% našeho genomu. Pokud jsme vzali v úvahu dodatečné kusy genomu, jako jsou například nekódující RNA, oblasti podílející se na kontrole genové aktivity a introny (úseky genové sekvence, které se odstraňují ještě před tím, než se mRNA uplatní při translaci), zdálo se, že zbytek genomu postrádá biologickou funkci. Proto se o těchto částech genomu často hovořilo jako o „odpadní“ DNA (česky též smetištní nebo zbytečná, anglicky „junk“ DNA).

Pronikání za sekvenci

Ve chvíli, kdy byl lidský genom osekvenován, nastal čas zjistit, zda jsou tyto sekvence skutečně zbytečné. V roce 2003 bylo vytvořeno konsorcium ENCODE, které mělo za úkol charakterizovat nekódující, nicméně funkční elementy lidského genomu. Sdružení mělo podporu amerického Národního institutu pro výzkum lidského genomu, vedl ho britský Evropský bioinformatický institut (EBI; viz rámeček). Pilotní fáze ENCODE probíhala v letech 2003 až 2007 a umožnila výzkumníkům z celého světa vyzkoušet, porovnat a optimalizovat experimentální a výpočetní metody sloužící k identifikaci aktivních částí 1% genomu – v zásadě tedy pečlivě projít část genomového „odpadu“.

Obrázek 2: Rozbalování genomu: přiblížení struktury chromozomu až do úrovně dvouřetězcové DNA. Diagram ukazuje některé metody využívané výzkumníky ENCODE k indentifikování částí genomu s biologickou funkcí: sekvenování transkriptů (RNA-seq a RT-PCR; sloužící k určení, které oblasti jsou transkribovány), chromatinová imunoprecipitace (ChIP-seq; umožňující identifikovat cílovou sekvenci DNA, na niž se vážou proteiny, které kontrolují transkripci), štěpení pomocí DNáz (Dnase-seq; pro identifikaci rozvolněného chromatinu), počítačové předpovědi (umožňující najít silně konzervované sekvence) a metoda gene reporter assay (užívaná například pro testování aktivity promotoru; v diagramu není znázorněna).
Obrázok so súhlasom Ian Dunham
Obrázek 3: V průběhu
projektu ENCODE se
analyzovalo 147 různých
typů buněk, aby byly
zachyceny rozdíly v regulaci
genomu v různých tkáních.
Tento diagram ukazuje 47
z oněch 147, které byly
zahrnuty do studie. Tak
velký počet buněčných typů
se využíval proto, že i když
buňky disponují stejným
genomem, liší se způsobem,
jakým genetickou informaci
využívají. Kliknutím na
obrázek ho zvětšíte.

Obrázok so súhlasom Darryl
Leja

První výsledky zveřejněné v červnu 2007 (The ENCODE Project Consortium, 2007), gkteré ukázaly fungování genomu, byly vskutku dráždivé. Například údaje získané kombinací metody microarray (viz Koutsos et al., 2009) a pokusů se sekvenováním ukázaly, že se přepisuje většina genomu, a to včetně těch oblastí, o nichž se soudilo, že se netranskribují (obrázek 2). Ačkoli byly role většiny transkriptů stále neznámé, ukázalo se, že některé významně ovlivňují genovou expresi. Ve výsledku se tedy ukázalo, že je souhra mezi geny, oblastmi regulujícími genovou aktivitu a dalšími úseky DNA mnohem složitější, než si kdokoliv myslel. Data naznačovala, že genom obsahuje nejrůznější formy aktivních elementů, a tedy méně nepoužívaných sekvencí, než se dříve myslelo.

Po úspěšném otestování metod začali vědci v projektu ENCODE prozkoumávat celý lidský genom. Tento úkol jim usnadnily nové technologie na sekvenování DNA a také dostupnost přesnějších biochemických analýz.

Systematicky zmapovali charakteristické prvky genomu právě tak, jako zeměpisná mapa zaznamenává geografické prvky krajiny, tedy lesy, řeky a hory. Výzkumníci ENCODE v genomu hledali mj. takové oblasti, které byly uvozené značkami „pst“ (specifické methylové skupiny), které svědčí o umlčování genů, nebo značkami „zde se navaž“ pro příslušné transkripční faktory. Dále hledali oblasti zesilující transkripci a také modifikace DNA kontrolující, jak je DNA sbalená (obrázek 3).

Záplava dat

Pokud by byly výsledky
projektu ENCODE vytištěny
na papír, naplnily by 12
autobusů.

Obrázok so súhlasom
marcus_jb1973 / Flickr

V září roku 2012 zveřejnil projekt ENCODE po pěti letech pokusů a analýz, které prováděly výzkumné ústavy ve Velké Británii, Spojených státech, Španělsku, Singapuru a Japonsku, výsledky dosud nejpodrobnější analýzy celého genomu. Studie v přepočtu zabrala zhruba 300 let práce na počítači, během kterých bylo zanalyzováno 15 terabytů dat (15 x 1012 bytů). Veškerá data byla zpřístupněna veřejnosti. Pokud by se tyto údaje natiskly hustotou 1000 párů bází na cm2, vznikl by štos 16 m vysoký a přes 30 m dlouhý. Objemem by to odpovídalo 12 patrovým autobusům.

Program ENCODE dokládá, čeho se dá dosáhnout díky rozsáhlým projektům, do kterých přispívají stovky výzkumníků, z nichž každý doplní jeden kousek do skládačky, až se vytvoří úplný obrázek genomu. To by se žádné samostatně pracující organizaci nepovedlo.

Oživení sekvence

Jednou z nejvíce vzrušujících věcí, které pokusy ENCODE ukázaly, je zjištění, že náš genom překypuje aktivitou, že jej netvoří převážně nefunkční sekvence. Zhruba 80% genomu něco aktivně dělá. Ale co přesně dělá, to musíme teprve odhalit. S jistotou se však dá říct, že 9% (a možná i víc) se zapojuje do regulace genové exprese a kontroluje, kdy a kde se budou tvořit proteiny. Aktivní část genomu (80%) obsahuje přes 70 000 promotorů – míst, kde se napojují transkripční faktory – a téměř 40 000 oblastí enhancerů – zesilujících oblastí, které kontrolují expresi vzdálených genů.

Obrovský kontrolní panel ve 3D

Podobně jako mixážní pult
zvukaře je i exprese genů
pod komplexní ochranou.
Lidský genom obsahuje přes
4 miliony genových spínačů.

Obrázok so súhlasom Stuart
Dallas Photography / Flickr

Celkově projekt ENCODE identifikoval přes 4 miliony genových spínačů rozptýlených v celém genomu. Genom si můžete představit jako obrovský kontrolní panel, třeba jako mixážní pult zvukaře, s mnoha spínači, které zapínají a vypínají geny. Tento poznatek prohlubuje naše porozumění genové expresi a otevírá nové možnosti pro léčbu nejrůznějších chorob. Například ukazuje, že malá změna v genovém spínači zvaném CARD9 je spojena s 20% zvýšením rizika rozvoje Crohnovy choroby, zánětlivého onemocnění střev. Co kdyby se dal genový spínač vrátit zpátky do normálu, a tím se efektivně odstranila příčina této choroby?

Výsledky ENCODE také pomohly objasnit, jak je genom uspořádán a k jakým fyzikálním interakcím v něm dochází. Badatelé zjistili, že jsou genové spínače ve fyzickém kontaktu s jimi kontrolovanými geny, přestože mohou být lineárně vzdáleny stovky kilobází. Máme sklon představovat si genom jako dlouhou, přímou sekvenci. Ve skutečnosti je ale všechno těsně nacpané v buněčném jádru, přičemž různé části genomu jsou v úzkém kontaktu s ostatními.

Stavíme na datech

Data ENCODE umožní lépe
pochopit genetické pozadí
nemocí.

Obrázok so súhlasom
AlexRaths / iStockphoto

ENCODE poskytl podrobnou mapu genomu a otevřel vědě zcela nové oblasti. Jak říká Ian Dunham z EBI, hlavní autor článku ENCODE: „Mnohdy docela dobře víte, které geny se uplatňují v určité chorobě, ale nevíte, které spínače jsou v ní zapojeny. Někdy vás tyto spínače překvapí – jejich umístění nás svádí k tomu, abychom je spojily spíš s jinou chorobou. ENCODE poskytuje množství cenných vodítek, s jejichž pomocí bychom mohli odhalit klíčové mechanismy ovlivňující rozvoj chorob. Ty by se daly využít k vytvoření zcela nových léčiv nebo k úpravě stávajících léčebných postupů.“

Kromě toho, že víme, které geny jsou zapojeny do určité choroby, znají vědci i některé spínače podílející se na regulaci zapínání a vypínání genů. Toto zjištění bude obzvlášť cenné při interpretaci výsledků populačních studií, které se snaží určit spojitost mezi nějakým genem a chorobou. Zkombinováním funkční analýzy genomu ENCODE s údaji z genomových asociačních studií mohou badatelé zmapovat souvislosti mezi genetickými odchylkami spojovanými s nějakým onemocněním a oblastmi s regulační funkcí, včetně genových spínačů identifikovaných v rámci ENCODE. Údaje z ENCODE umožní lépe pochopit genetické pozadí chorob a budou oporou ve vědecké práci v mnoha nadcházejících letech.

Více o EBI

Evropská molekulárněbiologická laboratoř (European Molecular Biology Laboratory, EMBL)w1 patří mezi špičkové výzkumné ústavy, věnuje se základnímu výzkumu ve vědách o živém. EMBL je mezinárodní, inovativní a interdisciplinární pracoviště. Jeho zaměstnanci, kteří se hlásí k 60 různým národnostem, získali vědecké vzdělání v biologii, fyzice, chemii a počítačových vědách a společně pracují na výzkumech pokrývajících celou šíři molekulární biologie.

EBIw2, se sídlem poblíž Cambridge ve Velké Británii, je součástí EMBL. Světové vědecké veřejnosti poskytuje zdarma data z pokusů z oblasti věd o živém a provádí základní výzkum ve výpočetní biologii. EBI školí výzkumníky z akademické obce i průmyslu, aby co nejvíc vytěžila z onoho neuvěřitelného množství dat, která se v pokusech ve vědách o živém každodenně nashromáždí.

EMBL je členem EIROforumw3, vydavatele Science in School.

 

Download

Download this article as a PDF

References

Web References

  • w1 – Více o EMBL.
  • w2 – Více o EBI.
  • w3 – EIROforum představuje spolupráci osmi největších evropských mezivládních výzkumných organizací, které sdílejí svoje prostředky, vybavení a odborné znalosti, aby pomohly evropské vědě naplnit její potenciál. V rámci svých vzdělávacích a přesahových aktivit vydává EIROforum Science in School.

Resources

Institution

EMBL

Author(s)

Dr. Louisa Wood pracuje v EBI, zodpovídá za kontakt ústavu se školami a se širokou veřejností. Vědecky působila v oboru molekulární biologie rostlin. Titul Ph.D. získala ve Spojeném království v Norwichi na John Innes Centre a také v Institutu Maxe Plancka pro pěstování rostlin v německém Kolíně nad Rýnem. Poté zahájila kariéru v oblasti vědecké komunikace a vnějších vztahů. V EBI pracuje od roku 2007.


Review

Článek přibližuje jeden z posledních pokroků humánní genetiky, výzkum v rámci projektu ENCODE.

Když se studenti seznamují s genetickým kódem, obvykle je ohromí skutečnost, že pouhá 2% lidské DNA kódují proteiny, přičemž zbytek představuje odpadní DNA. Projekt ENCODE zkoumal funkci některých úseků nekódující DNA a zjistil, že rozhodně nejde o pouhý odpad.

Budete-li se studenty probírat Projekt lidského genomu, můžete také zmínit ENCODE. Je dobré, když studentům poskytnete základní informace o genové regulaci, genetických chorobách a jejich léčbě a technikách užívaných v genetickém výzkumu. Článek může ve studentech vyvolat zájem o bioinformatiku a podnítit je, aby si vyhledali a pročetli literaturu o projektu ENCODE.


Namrata Garware, India




License

CC-BY-NC-ND