Sekvenssianalyysi ja DNA-sekvensointi – määritelmä, menetelmät ja sovellukset

Tutustu sekvenssianalyysin ja DNA-sekvensoinnin määritelmiin, menetelmiin ja sovelluksiin — genomitutkimus, biodiversiteetti, diagnostiikka ja luotettavat tulkinnat tutkimuksellesi.

Tekijä: Leandro Alegsa Luotu: 17. syyskuuta 2022 Päivitetty: 7. tammikuuta 2026

Molekyylibiologian sekvenssianalyysissä tunnistetaan nukleotidien järjestys nukleiinihapossa tai aminohappojen järjestys peptidissä tai proteiinissa. Kun näyte on saatu, DNA-sekvenssit voidaan tuottaa automaattisesti koneellisesti ja tulos voidaan näyttää tietokoneella. Tulosten tulkinta on edelleen ihmisen tehtävä.

Kuvagalleria

3 Kuvat

simple.wikipedia.org · Public domain

Määritelmä ja periaate

Sekvenssianalyysi tarkoittaa biologisten makromolekyylien emäs- tai aminohappojärjestyksen määritystä. DNA- ja RNA-sekvensoinnissa tunnistetaan neljän nukleotidin (A, T/U, C, G) järjestys, kun taas proteiinien kohdalla selvitetään niiden aminohappujärjestys. Sekvenssitieto toimii perustana mm. organismien luokittelulle, perinnöllisten sairauksien tutkimukselle ja mikrobien tunnistukselle.

Keskeiset menetelmät

Sanger-sekvensointi – perinteinen, luotettava menetelmä, joka antaa pitkiä ja tarkkoja luentoja (read) yksittäisistä sekvensseistä; hyvä pienten kappaleiden varmistukseen ja kliinisiin testauksiin.
Toisen sukupolven sekvensointi (NGS, esim. Illumina) – massiivinen rinnakkaissekvensointi, erittäin suuri läpimeno (throughput), lyhyemmät readit mutta alhaisempi kustannus per nukleotidi; yleinen genomeissa, RNA-seqissä ja metagenomiikassa.
Kolmannen sukupolven sekvensointi (esim. PacBio, Oxford Nanopore) – pitkät readit, jotka helpottavat genomin kokoonpanoa ja toistojen käsittelyä; Nanopore mahdollistaa myös suoran RNA- tai metylaation havaitsemisen.

Tavalliset työvaiheet laboratoriossa

Näytteenotto ja nukleiinihapon eristys – solujen rikkominen ja DNA/RNA:n puhdistus kontaminaation välttämiseksi.
Kirjaston valmistus (library prep) – DNA:n pätkiminen, adapterien lisääminen ja tarvittaessa PCR-amplifikaatio.
Sekvensointi – laitteiston ajama automaattinen luenta, data tallentuu digitaalisesti.
Laatukontrolli – raakadatasta poistetaan huonolaatuiset luennat ja adapterit ennen analyysiä.

Tietojen käsittely ja analyysi

Sekvenssdatan analysointi koostuu useasta vaiheesta: basecalling (perustasojen tunnistus), laadun tarkistus ja -karsinta, kohdistus viitegenomiin (alignment) tai de novo -assemblointi, variaatioiden (SNP, indel) tunnistus ja toiminnallinen annotointi. Käytössä on lukuisia ohjelmistoja ja putkia, esimerkiksi BWA tai Bowtie kohdistukseen, SPAdes kokoonpanoon ja GATK varianttien kutsuun. Lopullinen biologinen tulkinta vaatii usein yhdistelyä kirjallisuus- ja tietokantatiedoista sekä asiantuntijan arviota.

Sovellukset

Taksonomia ja evoluutiobiologia – lajien välisten suhteiden ja sukupuun rakentaminen.
Kliiniset diagnoosit – perinnöllisten sairauksien, syövän genomimuutosten ja tartuntatautien tunnistus.
Tartuntatautien seuranta ja epidemiologia – patogeenien genotyypitys, resistenssimarkkerit ja outbreak-seuranta (esim. virusten sekvensointi).
Metagenomiikka – ympäristön tai mikrobiomin lajiston ja toiminnan kartoitus ilman viljelyä.
RNA-sekvensointi (RNA-seq) – geeni-ilmentymisen mittaaminen, vaihtoehtoisten transkriptiomuotojen tunnistus ja solutyyppien erot (mm. single-cell RNA-seq).
Maatalous ja jalostus – kasvien ja eläinten ominaisuuksien perinnöllinen kartoitus, kasvintuhoojien tunnistus.
Oikeuslääketiede – DNA-profilointi tunnistukseen ja rikostutkintaan.

Haasteet ja eettiset näkökohdat

Laatu ja virheet – eri teknologioilla on erilaiset virhetyypit (esim. satunnaiset virheet vs. systemaattiset), ja validointi on tärkeää kliinisissä sovelluksissa.
Datamäärät ja laskentatarpeet – NGS tuottaa valtavia tietomääriä, jotka vaativat tallennusta, laskentakapasiteettia ja asianmukaista tietojenkäsittelyä.
Tietosuoja ja etiikka – genomitiedot ovat henkilökohtaisesti tunnistettavissa; yksityisyys, suostumus ja tietojen jakamisen säännöt ovat keskeisiä.
Kontaminaatio ja näytteen käsittely – pienikin kontaminaatio voi vääristää tuloksia, joten laboratoriokäytännöt ja negatiiviset kontrollit ovat tärkeitä.

Yhteenveto

Sekvenssianalyysi on keskeinen työkalu nykyaikaisessa biotieteessä. Menetelmien kehitys on laajentanut käyttömahdollisuuksia suuresti: nykyään voidaan tutkia yksittäisiä soluja, laajoja populaatioita, komplekseja mikrobiomeja ja seurata taudinaiheuttajien leviämistä reaaliaikaisesti. Vaikka sekvensointilaitteet tuottavat datan automaattisesti, luotettava tulkinta vaatii edelleen biologista ja bioinformatiikkaosaamista sekä huolellista laatukontrollia.

DNA:n emäsparisekvenssi

DNA-sekvenssi on DNA-molekyylin nukleotidien järjestys. Se kirjoitetaan peräkkäisinä kirjaimin, jotka kuvaavat DNA-molekyylin tai -säikeen perusrakennetta. Jos sekvenssi on toimiva, se sisältää tietoa proteiinimolekyylin aminohappojen järjestyksestä. Mahdolliset kirjaimet ovat A, C, G ja T, jotka edustavat DNA-juosteen neljää nukleotidiemästä - adeniini, sytosiini, guaniini ja tymiini. Jaksot tulostetaan vierekkäin ilman välejä, kuten jaksossa AAAGTCTGAC.

RNA:n ja proteiinien tutkimus on monimutkaisempaa. DNA:n yleinen rakenne on yksinkertainen ja ennustettava (kaksoiskierre). RNA:n ja proteiinien tutkimuksessa on tutkittava niiden kolmiulotteista rakennetta, joka on vaihteleva ja vaikuttaa niiden toimintaan. Jossain määrin tässä voidaan käyttää apuna tietokonetta, mutta se on tarkistettava kussakin tapauksessa.

Tietoja sekvensseistä säilytetään tietokannoissa. Geeni- ja proteiinisekvenssien nopean tuottamisen kehittyessä 1990-luvulla uusien sekvenssien lisääminen tietokantoihin lisääntyy koko ajan.

Pisteet

Täydellinen genomianalyysi on tehty yli 800 lajista ja kannasta. Työ tehdään koneella, DNA-sekvensserillä, joka analysoi nukleotideihin kiinnitettyjen fluorokromien valosignaaleja. Tämäntyyppinen työ on vähitellen tulossa halvemmaksi.

"Tällä hetkellä [2009] yli 90 selkärankaisen lajin koko genomin sekvenssit on saatu valmiiksi, niitä valmistellaan parhaillaan tai ne ovat pitkälle edenneessä suunnitteluvaiheessa.

Karkeat kokonaissummat

Joulukuuhun 2012 mennessä koko genomin analyysi on saatu valmiiksi noin 800-900 elävästä lajista ja lajikannasta. Luvut ovat likimääräisiä ja muuttuvia.

Eläimet: 111 lajia
Kasvit: Kasvit: 53 lajia
Sienet: 81 lajia
Protistit: 50 lajia
Saaristoeläimet: 139 lajia ja kantaa
Bakteerit: ~4/500 lajia ja kantaa

Ihmisen DNA-sekvenssi

Ihmisen perimä on tallennettu 23 kromosomipariin solun tumaan ja pieneen mitokondrioiden DNA:han. Kromosomeissamme olevista DNA-sekvensseistä tiedetään nykyään paljon. Se, mitä DNA oikeastaan tekee, tiedetään nyt osittain. Tämän tiedon soveltaminen käytäntöön on vasta alkanut.

Ihmisgenomiprojekti (HGP) tuotti referenssisekvenssin, jota käytetään maailmanlaajuisesti biologiassa ja lääketieteessä. Nature julkaisi julkisesti rahoitetun hankkeen raportin, ja Science julkaisi Celeran artikkelin. Näissä julkaisuissa kuvattiin, miten sekvenssiluonnos tuotettiin, ja esitettiin sekvenssin analyysi. Vuosina 2003 ja 2005 julkistettiin parannetut luonnokset, jotka täyttivät ≈92 prosenttia sekvenssistä.

Uusimmassa ENCODE-hankkeessa tutkitaan, miten geenejä ohjataan.

Oikeuslääketieteellinen työ

Koko genomin sekvenssejä ei tarvita rikosteknisessä työssä, kuten rikollisen tunnistamisessa rikospaikalle jääneiden DNA-jälkien perusteella tai isyystapauksissa. Tällä hetkellä koko genomin sekvensointi on vielä hyvin kallista, mutta onneksi on saatavilla yksinkertaisempia ja halvempia menetelmiä.

Perusajatuksena on tarkastella tiettyjä lokuksia (paikkoja) perimässä, jotka vaihtelevat suuresti ihmisten välillä. Yhteensopivuuteen tarvitaan noin 10-15 tällaista lokusta, ja lainsäädännölliset yksityiskohdat vaihtelevat maittain. Jos näyte ja epäilty henkilö täsmäävät, on erittäin todennäköistä, että kyseinen henkilö on ollut näytteen lähde. Tämä todiste olisi sitten rikoksen syytteen perustana. Samanlainen analyysi osoittaisi, että mies on hyvin todennäköisesti lapsen isä. Tämä on todella nykyaikainen tapa tehdä se, mitä tehtiin veriryhmien avulla ennen kuin DNA:n yksityiskohtia voitiin analysoida. Menetelmät on kehitetty pääasiassa Alec Jeffreysin työn ansiosta.

Jokaisen henkilön DNA sisältää kaksi tietyn geenin tai "markkerin" alleelia: toisen isältä ja toisen äidiltä. "Markkerit" ovat geenejä, jotka on valittu siten, että niillä on useita erilaisia alleeleja, joita esiintyy usein populaatiossa. Seuraava taulukko on peräisin kaupallisesta DNA-isyystestikokeesta. Siitä käy ilmi, miten vanhempien ja lapsen välinen sukulaisuus osoitetaan viidellä merkkiaineella:

DNA-markkeri	Äiti	Lapsi	Väitetty isä
D21S11	28, 30	28, 31	29, 31
D7S820	9, 10	10, 11	11, 12
TH01	14, 15	14, 16	15, 16
D13S317	7, 8	7, 9	8, 9
D19S433	14, 16.2	14, 15	15, 17

Tulokset osoittavat, että lapsen ja väitetyn isän DNA täsmää näiden viiden merkin osalta. Täydelliset testitulokset osoittivat tämän vastaavuuden 16 markkerin osalta lapsen ja testatun miehen välillä. Jos tapaus testataan oikeudessa, oikeuslääketieteen tutkija antaa todisteita siitä, kuinka todennäköistä on, että kyseinen tulos saadaan sattumalta.

DNA-testaus Yhdysvalloissa

Kaikissa Yhdysvaltojen 50 osavaltiossa on osavaltioiden lakeja DNA-profiloinnista. Yksityiskohtaisia tietoja kunkin osavaltion tietokantalaeista on saatavilla osavaltioiden lainsäätäjien kansallisen konferenssin (National Conference of State Legislatures) verkkosivustolla.

Yhdysvaltain tulli- ja rajavartiolaitoksen kemisti lukee DNA-profiilia selvittääkseen, mistä tavara on peräisin.

Muinainen DNA

Joistakin lähteistä on saatu muinaista DNA:ta. Sekvenssianalyysiin soveltuvan DNA:n säilymisen ennätys on 700 000 vuotta. Ikuiseen huurteeseen haudatusta hevosen luurangosta on löytynyt luita, joista on säilynyt jonkin verran DNA:ta. Sekvenssi oli vain 70-prosenttisesti täydellinen, mutta se riitti tutkijoille toteamaan: "Se ei näyttäisi hevoselta sellaisena kuin me sen tunnemme... mutta olettaisimme sen olevan yksivarpainen hevonen". Vertailun vuoksi tutkijoilla oli käytössään nykyaikaisten hevosten, aaseiden ja Przewalskin hevosen DNA-sekvenssit.

Aiheeseen liittyvät sivut

George Church
Walter Gilbert
John Sulston
Fred Sanger
ENCODE: ihmisen genomin täydellinen analyysi
Ihmisen genomi
Täydellinen genomiikka
Bioinformatiikka

Aiheeseen liittyvät artikkelit

Tekijä

AlegsaOnline.com Sekvenssianalyysi ja DNA-sekvensointi – määritelmä, menetelmät ja sovellukset Leandro Alegsa

URL: https://fi.alegsaonline.com/art/88955

Näin viittaat tähän artikkeliin

APA

Alegsa, L. (7. tammikuuta 2026). Sekvenssianalyysi ja DNA-sekvensointi – määritelmä, menetelmät ja sovellukset. AlegsaOnline.com. https://fi.alegsaonline.com/art/88955

MLA

Alegsa, Leandro. “Sekvenssianalyysi ja DNA-sekvensointi – määritelmä, menetelmät ja sovellukset.” AlegsaOnline.com, 7. tammikuuta 2026, https://fi.alegsaonline.com/art/88955

Chicago

Alegsa, Leandro. “Sekvenssianalyysi ja DNA-sekvensointi – määritelmä, menetelmät ja sovellukset.” AlegsaOnline.com. Päivitetty 7. tammikuuta 2026. https://fi.alegsaonline.com/art/88955

BibTeX

@misc{alegsaonline_88955,
  author = {Alegsa, Leandro},
  title = {Sekvenssianalyysi ja DNA-sekvensointi – määritelmä, menetelmät ja sovellukset},
  year = {2026},
  howpublished = {AlegsaOnline.com},
  url = {https://fi.alegsaonline.com/art/88955},
  note = {Päivitetty: 7. tammikuuta 2026; Language: fi}
}

TXT

Leandro Alegsa. “Sekvenssianalyysi ja DNA-sekvensointi – määritelmä, menetelmät ja sovellukset.” AlegsaOnline.com. Päivitetty: 7. tammikuuta 2026. https://fi.alegsaonline.com/art/88955

Lähteet

intlgenome.org : intlgenome.org/viewDatabase.cfm
ncbi.nlm.nih.gov : "Comparative biology of aging"
doi.org : 10.1093/gerona/gln060
pubmed.ncbi.nlm.nih.gov : 19223603
ncbi.nlm.nih.gov : "Entrez Genome Database Search"
nature.com : "Initial sequencing and analysis of the human genome"
doi.org : 10.1038/35057062
pubmed.ncbi.nlm.nih.gov : 11237011
sciencemag.org : "The sequence of the human genome"
ui.adsabs.harvard.edu : 2001Sci...291.1304V
doi.org : 10.1126/science.1058040
pubmed.ncbi.nlm.nih.gov : 11181995
nature.com : nature.com/articles/489046a?error=cookies_not_supported&code=d4894f7c-6c0e-44a7-aa48-3d32…
bbc.co.uk : bbc.co.uk/news/health-19202141