ENCODE: ihmisen genomin DNA-elementtien tietosanakirja

ENCODE: kattava ihmisen genomin DNA‑elementtien tietosanakirja — uusimmat löydöt säätelyelementeistä, tehostimista ja genomin toiminnallisesta kartoituksesta.

Tekijä: Leandro Alegsa

ENCODE on laaja projekti, jonka tavoitteena on laatia kattava DNA-elementtien tietosanakirja ihmisen genomille. ENCODE (ENcyclopedia Of DNA Elements) käynnistettiin vuonna 2003 tunnistamaan ja luokittelemaan kaikki ihmisen genomin toiminnalliset alueet. Hanke rahoitettiin pääosin Yhdysvaltain kansallisesta genomitutkimuslaitoksesta ja siihen osallistui yli 400 tutkijaa 32 laboratoriosta ympäri maailmaa: Yhdysvalloissa, Yhdistyneessä kuningaskunnassa, Espanjassa, Singaporessa ja Japanissa. Tulokset julkaistiin yhteensä 30 avoimessa julkaisussa kolmessa vertaisarvioidussa lehdessä: Nature, Genome Biology ja Genome Research. Tämä on yksi perusteellisimmista ja eniten dataa tuottaneista ihmisen genomia koskevista analyyseista.

Yksinkertaistettu yhteenveto ENCODE-projektin keskeisistä havainnoista:

  1. Vain noin 1 % genomista koodaa proteiineja. Tämä vastaa arvioitua noin 21 000 proteiinia koodaavaa geeniä, ja proteiineja koodaavat alueet muodostavat pienen osan kokonaigenomista.
  2. Promoottorialueita tunnistettiin noin 70 000. Nämä alueet sijaitsevat usein geenien yläjuoksulla, ja niihin sitoutuvat proteiinit ohjaavat geenin ilmentymistä.
  3. Tehostinalueita (enhancers) on arviolta noin 400 000. Tehostimet voivat säädellä kaukana sijaitsevien geenien toimintaa ja toimia solutyypistä riippuvaisella tavalla.
  4. Geenien "kytkimiksi" määriteltyjä säätelyelementtejä on runsaasti — arvio noin 4 000 000. Näillä DNA-sekvensseillä voidaan ohjata geenien kytkeytymistä päälle tai pois päältä; monet sijaitsevat kaukana sääteltynä olevasta geenistä.
  5. Arviolta noin 80 % genomista osoittaa jonkinlaista biokemiallista aktiivisuutta. Tämä tarkoittaa, että suuri osa DNA:sta osallistuu esimerkiksi proteiinien tai RNA-molekyylien sitomiseen, transkription säätelyyn tai kromatiinin rakenteen muokkaamiseen. ENCODE-raportissa käytetty termi (biokemiallinen) viittaa havaittuun molekyylitasoiseen toimintaan; sen tulkinta laajempana biologisena "toimintana" on herättänyt keskustelua.
  6. Evoluutio vaikuttaa sekä proteiineja koodaavien sekvenssien että säätelyalueiden kautta. Muutokset DNA:n säätelyalueissa voivat selittää lajien välisiä fenotyyppisiä eroja yhtä lailla kuin proteiinikoodaavien geenien muutokset.

"Yksi evoluutiobiologian suurista haasteista on ymmärtää, miten lajien väliset erot DNA-sekvenssissä määräävät erot niiden fenotyypeissä. Evolutiivinen muutos voi tapahtua sekä proteiineja koodaavien sekvenssien muutosten että geenien säätelyä muuttavien sekvenssimuutosten kautta".

Käytetyt menetelmät ja aineistot

ENCODE-hanke hyödynsi monipuolisia nykyaikaisia genomikan menetelmiä ja tuotti valtavia määriä avoimia aineistoja. Keskeisiä lähestymistapoja olivat muun muassa:

  • Transkriptoidun RNA:n eristäminen ja sekvensointi (esimerkiksi RNA-seq ja CAGE) tutkittiin laajasti: He eristivät ja sekvensoivat genomista transkriptoituneen RNA:n.
  • Proteiinin ja DNA:n välisiä sitoutumiskohtia kartoitettiin laajasti (mm. ChIP-seq-tyyppisillä kokeilla): He tunnistivat sitoutumiskohdat noin 120 transkriptiotuotteelle.
  • Kromatiinin ja histonimuutosten kartoitus auttoi paikantamaan aktiivisia ja hiljaisia alueita genomissa: He tutkivat histoneihin tehtyjen kemiallisten muutosten malleja. Tarkoituksena oli löytää alueita, joilla geenien ilmentyminen lisääntyy tai estyy.
  • Monia eri tekniikoita käytettiin yhdessä, kuten DNase I -hypersensitiivisyysmetodit, FAIRE ja muita kromatiinin avoimuutta kuvaavia mittauksia.
  • Laaja kokeellinen kattaus: He tekivät 1648 koetta 147 solutyypillä, jolloin saatiin solutyyppikohtaisia tietoja säätelyverkostoista ja elementtien toiminnasta.

Merkitys, tulkinta ja kritiikki

ENCODE avasi laajan kuvan siitä, miten paljon genomissa tapahtuu molekyylitasolla ja kuinka suuri osa DNA:sta voi sitoutua proteiineihin tai transkriboitua. Tämä muutti käsitystä pelkästään "geeneistä" ja korosti säätelyalueiden merkitystä perinnöllisyyden ja evoluution kannalta. Toisaalta tulkinnasta seurasi keskustelua:

  • Suurin yksittäinen kiistakysymys liittyy väitteeseen, että "noin 80 % genomista on biokemiallisesti aktiivista". Biokemiallinen aktiivisuus (esim. proteiinien sitoutuminen tai transkription merkit) ei aina tarkoita, että kyseinen sekvenssi olisi organismille olennainen tai että sillä olisi havaittavissa oleva biologinen funktio.
  • Evolutiivinen säilyneisyys ja positiivinen valinta osoittavat, että vain osa genomin alueista on ollut pitkällä aikavälillä valinnan alaisena. Monet biokemialliset merkit voivat olla sivutuotteita tai tilapäistä soluprosessointia.
  • Se, miten määritellään "toiminnallinen" DNA, vaikuttaa merkittävästi arvioihin. ENCODE tarjosi runsaasti dataa, mutta tulkintavaatimukset ovat monimutkaisia ja vaativat yhteistä biokemiallista, evolutiivista ja fysiologista näyttöä.

ENCODE:n aineistot ja julkaisut ovat olleet arvokas resurssi genomitutkimukselle: ne ovat auttaneet löytämään uusia säätelyalueita, yhdistämään perinnöllisiä variantteja sairauksien tiloihin ja rakentamaan yksityiskohtaisempia säätelyverkostoja. Samalla ne ovat nostaneet esiin tarpeen selkeämmille määritelmille ja jatkotutkimuksille, jotka erottavat tilapäisen biokemiallisen aktiivisuuden evolutiivisesti merkittävästä toiminnasta.

Tähän työhön liittyvät uutiset olivat laajasti esillä tieteellisessä ja yleisessä mediassa, ja hanke synnytti sekä innostusta että kriittistä keskustelua genomin toiminnallisuuden tulkinnasta. ENCODE:n data on julkista ja sitä voi hyödyntää jatkotutkimuksissa, meta-analyyseissa ja esimerkiksi genomilääketieteen sovelluksissa.

Kysymyksiä ja vastauksia

Q: Mikä on ENCODE?


V: ENCODE on lyhenne sanoista Encyclopedia of DNA Elements. Se käynnistettiin vuonna 2003 kaikkien ihmisen genomin toiminnallisten elementtien (työbittien) tunnistamiseksi.

K: Kuka teki ENCODE-työn?


V: Työstä vastasi yli 400 tutkijaa 32 laboratoriossa Yhdysvalloissa, Yhdistyneessä kuningaskunnassa, Espanjassa, Singaporessa ja Japanissa.

K: Mitä he saivat selville ihmisen genomista?


V: He havaitsivat, että vain 1 prosentti genomista koodaa proteiineja, eli noin 21 000 geeniä. Lisäksi he löysivät 70 000 sekvenssiä, jotka koodaavat geenien yläpuolella olevia promoottorialueita, joihin proteiinit sitoutuvat ja jotka ohjaavat geenien ilmentymistä, 400 000 tehostinaluetta, jotka säätelevät kaukana sijaitsevia geenejä, ja neljä miljoonaa geenikytkintä, jotka ovat DNA-sekvenssejä, jotka ohjaavat geenien käynnistymistä tai sammumista. Lisäksi todettiin, että 80 prosentilla genomista on tietty biokemiallinen tehtävä.

K: Miten he tekivät tutkimuksensa?


V: Käytettyihin menetelmiin kuului muun muassa genomista transkriptoituvan RNA:n eristäminen ja sekvensointi, transkriptiotuotteiden sitoutumiskohtien tunnistaminen, histoneihin tehtyjen kemiallisten muutosten mallien tutkiminen sellaisten alueiden löytämiseksi, joilla geenien ilmentymistä tehostetaan tai estetään, sekä 1648 kokeen tekeminen 147 solutyypillä.

K: Mitä tämä tutkimus kertoo evoluutiosta?


V: Tutkimus osoittaa, että evoluutio johtuu sekä proteiineja koodaavien geenien että säätelyä koodaavan DNA:n muutoksista. Se viittaa myös siihen, että evoluutiomuutos voi tapahtua sekä geenien säätelyä muuttavien sekvenssimuutosten että proteiineja koodaavien sekvenssien muutosten kautta.

K: Missä heidän tutkimuksensa julkaistiin?


V: Tutkimustulokset julkaistiin 30 avoimessa julkaisussa kolmessa lehdessä - Nature, Genome Biology ja Genome Research.


Etsiä
AlegsaOnline.com - 2020 / 2025 - License CC3