URL (verkko-osoite) – määritelmä, osat ja esimerkit
Selkeä opas URL:iin (verkko-osoite): mikä se on, protokolla, isäntänimi, polku, parametrit ja käytännön esimerkit—opas URL:n määritelmään, osiin ja käyttöön.
Uniform Resource Locator (URL) on yleisesti käytetty termi verkko-osoitteesta. URL kertoo, miten ja mistä tietokone tai selain voi hakea tietyn resurssin, yleensä verkkosivun, toiselta tietokoneelta (verkkopalvelimelta) Internetissä. Ne voidaan syöttää suoraan selaimen osoiteriville tai avata klikkaamalla niitä esittävää linkkiä toisella sivulla. URL-osoitteet muodostuvat kirjaimista, numeroista ja erikoismerkeistä, ja niillä on standardoitu rakenne, jotta eri tietokoneet ymmärtävät ne samalla tavalla.
URL:n perusosat
Tyypillinen URL sisältää useita osia. Alla yleisimmät osat selitettynä selkeällä kielellä:
- Protokolla (tai skeema). Esimerkiksi http tai https. Hyvin usein tämä on HTTP-protokolla (Hypertext Transfer Protocol), ja https tarkoittaa suojattua versiota (TLS/SSL).
- Erottelumerkit. Usein näkyy muoto
://protokollan ja palvelimen nimen erottamiseksi. - Isäntänimi eli palvelimen nimi tai osoite. Tämä voi olla esimerkiksi verkkotunnus kuten example.com tai suora IP-osoite. On hyvin tavallista, että nimi alkaa www. (World Wide Web), mutta koko nimi on kyseisen tietokoneen järjestelmänvalvojan päätettävissä.
- Portti (valinnainen). Jos käytetään muuta kuin oletusporttia, se voidaan ilmoittaa muodossa
:8080. - Polku. Tarkoittaa resurssin sijaintia palvelimella, esimerkiksi hakemisto ja tiedoston nimi (/kansio/sivu.html).
- Kyselyosa (query, valinnainen). Kysymysmerkin (
?) jälkeen tulevat parametrit, joita usein käytetään dynaamisissa sivuissa:?avain=arvo&haku=esimerkki. - Fragmentti (valinnainen). Merkattu ruutu- tai numero-merkillä (
#), ohjaa selaimen sivun tiettyyn kohtaan:#otsikko. - Käyttäjätiedot (harvinaisempi). Muodossa
käyttäjä:salasana@, käytetty joskus suojattuihin resurssien hakuihin (huomaa tietoturvariskit).
Esimerkki ja osien selitys
Tämän sivun URL-osoite on https://simple.wikipedia.org/w/index.php?title=Uniform_Resource_Locator
- https on protokolla
- simple.wikipedia.org on verkkosivusto
- /w/index.php on skripti. Tämä skripti saa parametrit, title=Uniform_Resource_Locator
Yllä olevassa esimerkissä https kertoo, että yhteys on suojattu, isäntänimi määrää palvelimen, polku viittaa tiettyyn ohjelmaan tai tiedostoon palvelimella, ja kyselyosan title=... avulla skripti voi näyttää oikean sivun.
Lisätietoja ja käytännön seikkoja
- URL:issa jotkin merkit ovat varattuja (esim.
:/?#[]@!$&'()*+,;=) ja ne pitää tarvittaessa koodata prosenttimuodossa (esimerkiksi välilyönti =%20). - Erilaisia skeemoja on paljon: http, https, ftp, mailto, file, data jne. Kaikki eivät ole verkkosivuja, mutta ne osoittavat resursseja eri tavoin.
- Internetissä on myös IPv6-osoitteita, jotka laitetaan hakasulkeisiin isännän kohdalle, esim.
http://[2001:db8::1]/. - Oletusportit: yleensä http käyttää porttia 80 ja https porttia 443. Näitä ei tarvitse erikseen kirjoittaa, ellei käytetä muuta porttia.
- Relatiiviset URL-osoitteet ovat lyhyempiä muotoja, jotka toimivat vain tietyssä kontekstissa (esim. verkkosivun sisäisissä linkeissä). Esimerkiksi
/wiki/URLtoimii vain, kun linkki avataan Wikipedian palvelimelta. Absoluuttinen URL sisältää kaiken tarvittavan tiedon ja toimii itsenäisesti. - Joissakin tilanteissa URL voi sisältää käyttäjä- ja salasanaosan, mutta tämä on nykyään harvinaista ja turvallisuusriski; selaimet usein estävät tällaisen käytön.
- URL-osoitteiden normalisointi ja uudelleenohjaukset voivat aiheuttaa, että sama sisältö on saatavilla monella eri URL:lla — hakukoneoptimoinnissa ja linkkien jakamisessa on hyvä käyttää kannanottavaa (canonical) osoitetta.
URL vs URI
URL on eräänlainen URI (Uniform Resource Identifier). URI on yleistermi, joka kattaa URL:t (joilla kerrotaan, miten resurssi haetaan) ja URN:t (Uniform Resource Name), jotka ovat nimeämismekanismeja ilman suoraa sijaintitietoa. Käytännössä URL ja URI sekoitetaan usein keskenään; tärkeintä on ymmärtää, että URL antaa tavan päästä resurssiin.
Yhteenveto
URL kertoo, miten ja mistä tietty internet-resurssi haetaan. Ymmärtämällä URL:n osat — protokolla, isäntä, polku, kysely ja fragmentti — osaat lukea sekä kirjoittaa toimivia osoitteita ja ymmärtää, miten tiedot välitetään verkossa. Kun jaat osoitetta, käytä mieluiten absoluuttista muotoa, jotta vastaanottaja varmasti pääsee samaan resurssiin.

URL-osoite varmistaa, että se menee oikealle verkkosivustolle. Virhe on helppo tehdä, koska sivustoja on paljon. Tässä kuvassa näkyvät Googlen lähellä olevat resurssit.

Laajennukset
Nämä ovat verkkotunnuksen lopussa, jonka edessä on piste. Aluksi oli kuusi päälaajennusta:
- .com - Kaupallinen käyttö
- .net - verkon / Internet-palveluntarjoajan käyttö
- .org - Organisaatiokäyttö
- .edu - Opetuskäyttö (koulut ja yliopistot)
- .mil - sotilaskäyttöön
- .gov - Julkinen käyttö
Nykyään on olemassa monia muita URL-laajennuksia. Nämä ovat yleensä joko ylätason verkkotunnuksia tai eturyhmiä. Kullakin maalla on oma aluetason verkkotunnuksensa, esimerkiksi .ca Kanadalle, .us Yhdysvalloille tai .co.uk Yhdistyneelle kuningaskunnalle. Monilla mailla on vain valtionhallinnolle tarkoitettu pääte, esimerkiksi Yhdysvalloissa .gov tai .fed.us, Kanadassa .gc.ca ja Yhdistyneessä kuningaskunnassa .gov.uk. Intressiryhmien verkkotunnuksia ovat esimerkiksi .tv (televisio), .pro (ammattilaiset) ja .xxx (pornografia). Näitä ei käytetä yhtä usein kuin alkuperäisiä päätteitä.
Kysymyksiä ja vastauksia
K: Mikä on URL-osoite (Uniform Resource Locator)?
A: URL-osoite on toinen nimi verkko-osoitteelle. Se koostuu kirjaimista, numeroista ja muista symboleista vakiomuodossa, jota ihmiset käyttävät saadakseen tietokoneet hakemaan ja näyttämään tiettyjä resursseja internetistä.
K: Mitkä ovat URL-osoitteen osat?
V: URL-osoitteet koostuvat useista osista, kuten protokollasta (usein Hypertext Transfer Protocol), erotusmerkeistä, toisen tietokoneen nimestä tai osoitteesta, asiakirjan tai skriptin polusta, käyttäjätunnuksesta ja salasanasta, joita tarvitaan tietylle sivulle pääsemiseksi, sekä tekstistä punt-merkin (#) jälkeen.
Kysymys: Mitä tarkoittaa "www"?
V: WWW tarkoittaa World Wide Web.
K: Mitä eroa on absoluuttisella URL-osoitteella ja suhteellisella URL-osoitteella?
V: Absoluuttinen URL-osoite sisältää kaikki tarvittavat tiedot resurssin löytämiseksi Internetistä, kun taas suhteellisia URL-osoitteita voidaan käyttää vain silloin, kun asiayhteys voi täyttää puuttuvat tiedot.
K: Onko URI:n ja URL-osoitteen välillä eroa?
V: URI on lyhenne sanoista Uniform Resource Identifier, joka on periaatteessa sama kuin URL-osoite, joten niiden välillä ei ole suurta eroa.
K: Miten ihmiset käyttävät URL-osoitteita?
V: Ihmiset käyttävät URL-osoitteita kirjoittamalla ne verkkoselaimiin tai napsauttamalla linkkejä verkkosivuilta, joita he jo katsovat.
Etsiä