Sekvenssianalyysi ja DNA-sekvensointi – määritelmä, menetelmät ja sovellukset

Tutustu sekvenssianalyysin ja DNA-sekvensoinnin määritelmiin, menetelmiin ja sovelluksiin — genomitutkimus, biodiversiteetti, diagnostiikka ja luotettavat tulkinnat tutkimuksellesi.

Tekijä: Leandro Alegsa

Molekyylibiologian sekvenssianalyysissä tunnistetaan nukleotidien järjestys nukleiinihapossa tai aminohappojen järjestys peptidissä tai proteiinissa. Kun näyte on saatu, DNA-sekvenssit voidaan tuottaa automaattisesti koneellisesti ja tulos voidaan näyttää tietokoneella. Tulosten tulkinta on edelleen ihmisen tehtävä.

Määritelmä ja periaate

Sekvenssianalyysi tarkoittaa biologisten makromolekyylien emäs- tai aminohappojärjestyksen määritystä. DNA- ja RNA-sekvensoinnissa tunnistetaan neljän nukleotidin (A, T/U, C, G) järjestys, kun taas proteiinien kohdalla selvitetään niiden aminohappujärjestys. Sekvenssitieto toimii perustana mm. organismien luokittelulle, perinnöllisten sairauksien tutkimukselle ja mikrobien tunnistukselle.

Keskeiset menetelmät

  • Sanger-sekvensointi – perinteinen, luotettava menetelmä, joka antaa pitkiä ja tarkkoja luentoja (read) yksittäisistä sekvensseistä; hyvä pienten kappaleiden varmistukseen ja kliinisiin testauksiin.
  • Toisen sukupolven sekvensointi (NGS, esim. Illumina) – massiivinen rinnakkaissekvensointi, erittäin suuri läpimeno (throughput), lyhyemmät readit mutta alhaisempi kustannus per nukleotidi; yleinen genomeissa, RNA-seqissä ja metagenomiikassa.
  • Kolmannen sukupolven sekvensointi (esim. PacBio, Oxford Nanopore) – pitkät readit, jotka helpottavat genomin kokoonpanoa ja toistojen käsittelyä; Nanopore mahdollistaa myös suoran RNA- tai metylaation havaitsemisen.

Tavalliset työvaiheet laboratoriossa

  • Näytteenotto ja nukleiinihapon eristys – solujen rikkominen ja DNA/RNA:n puhdistus kontaminaation välttämiseksi.
  • Kirjaston valmistus (library prep) – DNA:n pätkiminen, adapterien lisääminen ja tarvittaessa PCR-amplifikaatio.
  • Sekvensointi – laitteiston ajama automaattinen luenta, data tallentuu digitaalisesti.
  • Laatukontrolli – raakadatasta poistetaan huonolaatuiset luennat ja adapterit ennen analyysiä.

Tietojen käsittely ja analyysi

Sekvenssdatan analysointi koostuu useasta vaiheesta: basecalling (perustasojen tunnistus), laadun tarkistus ja -karsinta, kohdistus viitegenomiin (alignment) tai de novo -assemblointi, variaatioiden (SNP, indel) tunnistus ja toiminnallinen annotointi. Käytössä on lukuisia ohjelmistoja ja putkia, esimerkiksi BWA tai Bowtie kohdistukseen, SPAdes kokoonpanoon ja GATK varianttien kutsuun. Lopullinen biologinen tulkinta vaatii usein yhdistelyä kirjallisuus- ja tietokantatiedoista sekä asiantuntijan arviota.

Sovellukset

  • Taksonomia ja evoluutiobiologia – lajien välisten suhteiden ja sukupuun rakentaminen.
  • Kliiniset diagnoosit – perinnöllisten sairauksien, syövän genomimuutosten ja tartuntatautien tunnistus.
  • Tartuntatautien seuranta ja epidemiologia – patogeenien genotyypitys, resistenssimarkkerit ja outbreak-seuranta (esim. virusten sekvensointi).
  • Metagenomiikka – ympäristön tai mikrobiomin lajiston ja toiminnan kartoitus ilman viljelyä.
  • RNA-sekvensointi (RNA-seq) – geeni-ilmentymisen mittaaminen, vaihtoehtoisten transkriptiomuotojen tunnistus ja solutyyppien erot (mm. single-cell RNA-seq).
  • Maatalous ja jalostus – kasvien ja eläinten ominaisuuksien perinnöllinen kartoitus, kasvintuhoojien tunnistus.
  • Oikeuslääketiede – DNA-profilointi tunnistukseen ja rikostutkintaan.

Haasteet ja eettiset näkökohdat

  • Laatu ja virheet – eri teknologioilla on erilaiset virhetyypit (esim. satunnaiset virheet vs. systemaattiset), ja validointi on tärkeää kliinisissä sovelluksissa.
  • Datamäärät ja laskentatarpeet – NGS tuottaa valtavia tietomääriä, jotka vaativat tallennusta, laskentakapasiteettia ja asianmukaista tietojenkäsittelyä.
  • Tietosuoja ja etiikka – genomitiedot ovat henkilökohtaisesti tunnistettavissa; yksityisyys, suostumus ja tietojen jakamisen säännöt ovat keskeisiä.
  • Kontaminaatio ja näytteen käsittely – pienikin kontaminaatio voi vääristää tuloksia, joten laboratoriokäytännöt ja negatiiviset kontrollit ovat tärkeitä.

Yhteenveto

Sekvenssianalyysi on keskeinen työkalu nykyaikaisessa biotieteessä. Menetelmien kehitys on laajentanut käyttömahdollisuuksia suuresti: nykyään voidaan tutkia yksittäisiä soluja, laajoja populaatioita, komplekseja mikrobiomeja ja seurata taudinaiheuttajien leviämistä reaaliaikaisesti. Vaikka sekvensointilaitteet tuottavat datan automaattisesti, luotettava tulkinta vaatii edelleen biologista ja bioinformatiikkaosaamista sekä huolellista laatukontrollia.

DNA:n emäsparisekvenssi

DNA-sekvenssi on DNA-molekyylin nukleotidien järjestys. Se kirjoitetaan peräkkäisinä kirjaimin, jotka kuvaavat DNA-molekyylin tai -säikeen perusrakennetta. Jos sekvenssi on toimiva, se sisältää tietoa proteiinimolekyylin aminohappojen järjestyksestä. Mahdolliset kirjaimet ovat A, C, G ja T, jotka edustavat DNA-juosteen neljää nukleotidiemästä - adeniini, sytosiini, guaniini ja tymiini. Jaksot tulostetaan vierekkäin ilman välejä, kuten jaksossa AAAGTCTGAC.

RNA:n ja proteiinien tutkimus on monimutkaisempaa. DNA:n yleinen rakenne on yksinkertainen ja ennustettava (kaksoiskierre). RNA:n ja proteiinien tutkimuksessa on tutkittava niiden kolmiulotteista rakennetta, joka on vaihteleva ja vaikuttaa niiden toimintaan. Jossain määrin tässä voidaan käyttää apuna tietokonetta, mutta se on tarkistettava kussakin tapauksessa.

Tietoja sekvensseistä säilytetään tietokannoissa. Geeni- ja proteiinisekvenssien nopean tuottamisen kehittyessä 1990-luvulla uusien sekvenssien lisääminen tietokantoihin lisääntyy koko ajan.

 

Pisteet

Täydellinen genomianalyysi on tehty yli 800 lajista ja kannasta. Työ tehdään koneella, DNA-sekvensserillä, joka analysoi nukleotideihin kiinnitettyjen fluorokromien valosignaaleja. Tämäntyyppinen työ on vähitellen tulossa halvemmaksi.

"Tällä hetkellä [2009] yli 90 selkärankaisen lajin koko genomin sekvenssit on saatu valmiiksi, niitä valmistellaan parhaillaan tai ne ovat pitkälle edenneessä suunnitteluvaiheessa.

Karkeat kokonaissummat

Joulukuuhun 2012 mennessä koko genomin analyysi on saatu valmiiksi noin 800-900 elävästä lajista ja lajikannasta. Luvut ovat likimääräisiä ja muuttuvia.

  • Eläimet: 111 lajia
  • Kasvit: Kasvit: 53 lajia
  • Sienet: 81 lajia
  • Protistit: 50 lajia
  • Saaristoeläimet: 139 lajia ja kantaa
  • Bakteerit: ~4/500 lajia ja kantaa
 

Ihmisen DNA-sekvenssi

Ihmisen perimä on tallennettu 23 kromosomipariin solun tumaan ja pieneen mitokondrioiden DNA:han. Kromosomeissamme olevista DNA-sekvensseistä tiedetään nykyään paljon. Se, mitä DNA oikeastaan tekee, tiedetään nyt osittain. Tämän tiedon soveltaminen käytäntöön on vasta alkanut.

Ihmisgenomiprojekti (HGP) tuotti referenssisekvenssin, jota käytetään maailmanlaajuisesti biologiassa ja lääketieteessä. Nature julkaisi julkisesti rahoitetun hankkeen raportin, ja Science julkaisi Celeran artikkelin. Näissä julkaisuissa kuvattiin, miten sekvenssiluonnos tuotettiin, ja esitettiin sekvenssin analyysi. Vuosina 2003 ja 2005 julkistettiin parannetut luonnokset, jotka täyttivät ≈92 prosenttia sekvenssistä.

Uusimmassa ENCODE-hankkeessa tutkitaan, miten geenejä ohjataan.

Oikeuslääketieteellinen työ

Koko genomin sekvenssejä ei tarvita rikosteknisessä työssä, kuten rikollisen tunnistamisessa rikospaikalle jääneiden DNA-jälkien perusteella tai isyystapauksissa. Tällä hetkellä koko genomin sekvensointi on vielä hyvin kallista, mutta onneksi on saatavilla yksinkertaisempia ja halvempia menetelmiä.

Perusajatuksena on tarkastella tiettyjä lokuksia (paikkoja) perimässä, jotka vaihtelevat suuresti ihmisten välillä. Yhteensopivuuteen tarvitaan noin 10-15 tällaista lokusta, ja lainsäädännölliset yksityiskohdat vaihtelevat maittain. Jos näyte ja epäilty henkilö täsmäävät, on erittäin todennäköistä, että kyseinen henkilö on ollut näytteen lähde. Tämä todiste olisi sitten rikoksen syytteen perustana. Samanlainen analyysi osoittaisi, että mies on hyvin todennäköisesti lapsen isä. Tämä on todella nykyaikainen tapa tehdä se, mitä tehtiin veriryhmien avulla ennen kuin DNA:n yksityiskohtia voitiin analysoida. Menetelmät on kehitetty pääasiassa Alec Jeffreysin työn ansiosta.

Jokaisen henkilön DNA sisältää kaksi tietyn geenin tai "markkerin" alleelia: toisen isältä ja toisen äidiltä. "Markkerit" ovat geenejä, jotka on valittu siten, että niillä on useita erilaisia alleeleja, joita esiintyy usein populaatiossa. Seuraava taulukko on peräisin kaupallisesta DNA-isyystestikokeesta. Siitä käy ilmi, miten vanhempien ja lapsen välinen sukulaisuus osoitetaan viidellä merkkiaineella:

DNA-markkeri

Äiti

Lapsi

Väitetty isä

D21S11

28, 30

28, 31

29, 31

D7S820

9, 10

10, 11

11, 12

TH01

14, 15

14, 16

15, 16

D13S317

7, 8

7, 9

8, 9

D19S433

14, 16.2

14, 15

15, 17

Tulokset osoittavat, että lapsen ja väitetyn isän DNA täsmää näiden viiden merkin osalta. Täydelliset testitulokset osoittivat tämän vastaavuuden 16 markkerin osalta lapsen ja testatun miehen välillä. Jos tapaus testataan oikeudessa, oikeuslääketieteen tutkija antaa todisteita siitä, kuinka todennäköistä on, että kyseinen tulos saadaan sattumalta.

DNA-testaus Yhdysvalloissa

Kaikissa Yhdysvaltojen 50 osavaltiossa on osavaltioiden lakeja DNA-profiloinnista. Yksityiskohtaisia tietoja kunkin osavaltion tietokantalaeista on saatavilla osavaltioiden lainsäätäjien kansallisen konferenssin (National Conference of State Legislatures) verkkosivustolla.

 Yhdysvaltain tulli- ja rajavartiolaitoksen kemisti lukee DNA-profiilia selvittääkseen, mistä tavara on peräisin.  Zoom
Yhdysvaltain tulli- ja rajavartiolaitoksen kemisti lukee DNA-profiilia selvittääkseen, mistä tavara on peräisin.  

Muinainen DNA

Joistakin lähteistä on saatu muinaista DNA:ta. Sekvenssianalyysiin soveltuvan DNA:n säilymisen ennätys on 700 000 vuotta. Ikuiseen huurteeseen haudatusta hevosen luurangosta on löytynyt luita, joista on säilynyt jonkin verran DNA:ta. Sekvenssi oli vain 70-prosenttisesti täydellinen, mutta se riitti tutkijoille toteamaan: "Se ei näyttäisi hevoselta sellaisena kuin me sen tunnemme... mutta olettaisimme sen olevan yksivarpainen hevonen". Vertailun vuoksi tutkijoilla oli käytössään nykyaikaisten hevosten, aaseiden ja Przewalskin hevosen DNA-sekvenssit.

 

Aiheeseen liittyvät sivut

 


Etsiä
AlegsaOnline.com - 2020 / 2025 - License CC3