Hollandin skeemateoreema – määritelmä ja merkitys geneettisissä algoritmeissa

Tutustu Hollandin skeemateoreemaan: määritelmä, seuraukset ja merkitys geneettisille algoritmeille — miten skeemat vaikuttavat evoluutioon ja optimointiin.

Tekijä: Leandro Alegsa

Hollandin skeemateoreema, jota kutsutaan myös geneettisten algoritmien perustavaksi teoreemaksi, kuvaa kuinka tietyntyyppiset rakenteet (skeemat) merkkijonojen populaatiossa lisääntyvät geneettisissä algoritmeissa, kun valinta toimii suhteelliseen kelpoisuuteen perustuen. Teoreeman ydinväite on seuraava: lyhyet, matalan asteen skeemat, joilla on populaation keskiarvoa parempi kunto (kelpoisuus), lisääntyvät eksponentiaalisesti peräkkäisissä sukupolvissa, ellei niitä häiritä liikaa risteytys tai mutaatio. Teorian esitti John Holland 1970-luvulla, ja sitä on pidetty keskeisenä lähtökohtana geneettisten algoritmien toiminnan ymmärtämisessä. Myöhemmin sen tulkintoja ja merkitystä on kritisoitu ja täsmennetty useissa julkaisuissa; on muun muassa osoitettu, että skeemateoreema on Price-yhtälön erikoistapaus, kun skeemaindikaattorifunktio valitaan sopivasti.

Mitä skeema tarkoittaa?

Skeema on malli tai malliavaruuden ehdollinen kuvio, joka tunnistaa merkkijonojen osajoukon, joilla on tietyt merkit tietyissä paik’oissa ja muualla "ei merkitystä" -merkkejä (yleensä merkitty tähdellä * tai jokerimerkillä). Esimerkiksi bittimerkkijonon pituudella 6 skeema 1*0**1 vaatii, että ensimmäinen merkki on 1, kolmas on 0 ja kuudes on 1; muut paikat voivat olla mitä tahansa. Skeemat ovat sylinterijoukkojen erikoistapaus ja niillä on topologinen tulkinta, mistä johtuu maininta osajoukosta ja topologisesta avaruudesta alkuperäisessä kuvauksessa.

Formaalimpi muoto (intuition muotoilu)

Skeemateoreeman eräs tavallinen diskreetti muotoilu antaa alarajan odotetulle määrälle skeeman H esiintymiä seuraavassa sukupolvessa:

m(H,t+1) >= m(H,t) * (f(H) / f̄) * (1 - p_c * (d(H) / (l-1)) - o(H) * p_m)

Missä:

  • m(H,t) = skeeman H esiintymien lukumäärä ajan t populaatiossa,
  • f(H) = skeeman H keskimääräinen kelpoisuus (keskiarvo H:ta vastaavien yksilöiden kelpoisuudesta),
  • f̄ = koko populaation keskimääräinen kelpoisuus,
  • p_c = risteytyksen todennäköisyys (crossover-probability),
  • d(H) = skeeman määrittävä pituus (defining length) — etäisyys ensimmäisen ja viimeisen määritetyn bitin välillä,
  • l = merkkijonon kokonaispituus,
  • o(H) = skeeman aste (order) — määriteltyjen (fixed) bittien lukumäärä,
  • p_m = mutaation todennäköisyys per bit.

Tämä epäyhtälö on alaraja: se olettaa, että uuden yksilön tuottaminen risteytyksellä tai mutaatiolla ei lisää skeeman esiintymiä (eli se ei ota huomioon skeeman syntymistä näiden operaattoreiden kautta) ja toimii odotusarvoissa (oletus äärettömästä populaatiosta tai odotusarvojen käytöstä). Sen vuoksi teoreema antaa konservatiivisen ennusteen siitä, miten "hyvät pienet palikat" säilyvät ja voimistuvat.

Merkitys ja tulkinnat

  • Building-block -hypoteesi: Skeemateoreema on usein yhdistetty niin sanottuun building-block-hypoteesiin: geneettiset algoritmit etsivät ja yhdistävät pieniä, hyvin toimivia rakennepaloja (lyhyitä, matalan asteen skeemoja) muodostaakseen entistä parempia ratkaisuja.
  • Implisiittinen parallelismi: Hollandin mukaan yhdellä yksilöllä voidaan pitkin laskennallisesti ajatella olevan yhteydessä valtava joukko eri skeemoja, jolloin GA arvioi monia skeemoja samanaikaisesti. Tämä tulkinta kuvaa algoritmin tehokkuutta, mutta sen tarkka merkitys ja rajat ovat keskustelun kohteena.
  • Ohjeet parametrivalintoihin: Teoreema osoittaa, miksi matala mutaatiotaso ja risteytys, joka kunnioittaa lyhyitä skeemoja (pieni d(H)), voivat auttaa säilyttämään hyödylliset rakennuspalikat. Tämä vaikuttaa geenien esitystapaan (representation), valintamekanismeihin ja operaattoreiden suunnitteluun.

Rajoitukset ja kritiikki

  • Teoreema perustuu odotusarvoihin ja antaa alarajan; se ei takaa, että konkreettisessa, äärellisessä populaatiossa kyseinen kasvu todella tapahtuu (satunnaisvaihtelu ja näytteenotto vaikuttavat).
  • Se olettaa yksinkertaisia valinta- ja periytymismalleja (esim. suhteellinen valinta), eikä ota täydellisesti huomioon skeemojen luomista risteytyksellä tai mutaatiolla.
  • Deceptive-ongelmat ja voimakas epistasia (vuorovaikutus geenien välillä) voivat tehdä pienistä paikallisista rakennuspalikoista harhaanjohtavia — tällöin skeemateoreeman optimistinen tulkinta ei päde käytännössä.
  • Useissa myöhemmissä analyyseissa on korostettu, että skeemateoreema on yksi työkalu GA:n analyysissä mutta ei yksiselitteinen selitys kaikkeen GA:n toimintaan. Esimerkiksi yhteys Price-yhtälöön näyttää, että skeemateoreema voidaan nähdä erikoistapauksena yleisemmälle evoluutiomekanismien analyysille.

Käytännön seuraukset

Kun suunnittelet geneettistä algoritmia, skeemateoreemasta voi ottaa opiksi seuraavat seikat:

  • Pidä kiinni tarkoituksenmukaisesta edustuksesta (representation), joka voi tehdä hyödyllisistä piirteistä lyhyitä ja matala-asteisia.
  • Valitse risteytys ja mutaatio siten, että ne eivät tarpeettomasti hävitä hyödyllisiä yhdistelmiä (esimerkiksi kohdennettu crossover tai pienemmät mutaatiomäärät tarpeen mukaan).
  • Muista, että äärelliset populaatiot, satunnaisuus, epistasia ja ongelman petollisuus voivat vaatia muita mekanismeja (esim. monen populaation käyttö, lajitteleva valinta, edistyneemmät risteytysstrategiat) robustin suorituskyvyn saavuttamiseksi.

Yhteenvetona: Hollandin skeemateoreema tarjoaa arvokkaan näkökulman siihen, miten geneettiset algoritmit voivat hyödyntää ja vahvistaa pieniä, hyvin toimivia rakenneosia. Sen muodollinen esitys kuitenkin sisältää oletuksia ja rajoituksia, joten sen käytännön merkitys on kontekstisidonnainen ja vaatii usein täydentävää analyysiä ja kokeellista varmistusta.

Kuvaus

Tarkastellaan binäärisiä merkkijonoja, joiden pituus on 6. Skeema 1*10*1 kuvaa kaikkien sellaisten merkkijonojen joukkoa, joiden pituus on 6 ja joiden kohdissa 1, 3 ja 6 on 1 ja kohdassa 4 on 0. * on jokerimerkki, mikä tarkoittaa, että paikoissa 2 ja 5 voi olla arvo joko 1 tai 0. Skeeman o ( H ) {\displaystyle o(H)}{\displaystyle o(H)} järjestys määritellään mallin kiinteiden paikkojen lukumääräksi, kun taas määrittelypituus δ ( H ) {\displaystyle \delta (H)}{\displaystyle \delta (H)} on ensimmäisen ja viimeisen tietyn paikan välinen etäisyys. Järjestys 1*10*1 on 4 ja sen määrittelypituus on 5. Skeeman kunto on kaikkien skeemaa vastaavien merkkijonojen keskimääräinen kunto. Merkkijonon kunto on koodatun ongelman ratkaisun arvon mitta, joka lasketaan ongelmakohtaisella arviointifunktiolla. Geneettisten algoritmien vakiintuneiden menetelmien ja geneettisten operaattoreiden avulla skeemateorema toteaa, että lyhyet, matala-asteiset skeemat, joiden fitness on keskimääräistä parempi, kasvavat eksponentiaalisesti peräkkäisissä sukupolvissa. Yhtälönä ilmaistuna:

E ( m ( H , t + 1 ) ) ≥ m ( H , t ) f ( H ) a t [ 1 - p ] . {\displaystyle \operatorname {E} (m(H,t+1))\geq {m(H,t)f(H) \over a_{t}}[1-p]. } {\displaystyle \operatorname {E} (m(H,t+1))\geq {m(H,t)f(H) \over a_{t}}[1-p].}

Tässä m ( H , t ) {\displaystyle m(H,t)}{\displaystyle m(H,t)} on niiden merkkijonojen lukumäärä, jotka kuuluvat skeemaan H {\displaystyle H}{\displaystyle H} sukupolvella t {\displaystyle t}. {\displaystyle t}, f ( H ) {\displaystyle f(H)}{\displaystyle f(H)} on skeeman H {\displaystyle H}{\displaystyle H} havaittu keskimääräinen kunto ja a t {\displaystyle a_{t}}{\displaystyle a_{t}} on havaittu keskimääräinen kunto sukupolvella t {\displaystyle t}{\displaystyle t} . Häiriötodennäköisyys p {\displaystyle p}{\displaystyle p} on todennäköisyys sille, että risteytys tai mutaatio tuhoaa skeeman H {\displaystyle H}{\displaystyle H} . Se voidaan ilmaista seuraavasti:

p = δ ( H ) l - 1 p c + o ( H ) p m {\displaystyle p={\delta (H) \over l-1}p_{c}+o(H)p_{m}}} {\displaystyle p={\delta (H) \over l-1}p_{c}+o(H)p_{m}}

jossa o ( H ) {\displaystyle o(H)}{\displaystyle o(H)} on skeeman järjestys, l {\displaystyle l}{\displaystyle l} on koodin pituus, p m {\displaystyle p_{m}}{\displaystyle p_{m}} on mutaation todennäköisyys ja p c {\displaystyle p_{c}}{\displaystyle p_{c}} on risteytyksen todennäköisyys. Siten skeema, jonka määrittelypituus δ ( H ) {\displaystyle \delta (H)}{\displaystyle \delta (H)} on lyhyempi, häiriintyy harvemmin.
Usein väärinymmärretty seikka on se, miksi skeemateoreema on epätasa-arvo eikä tasa-arvo. Vastaus on itse asiassa yksinkertainen: teoreema jättää huomiotta sen pienen, mutta nollasta poikkeavan todennäköisyyden, että skeemaan H {\displaystyle H}{\displaystyle H} kuuluva merkkijono syntyy "tyhjästä" mutaation kautta yhdestä merkkijonosta (tai kahden merkkijonon rekombinaatiosta), joka ei edellisessä sukupolvessa kuulunut skeemaan H {\displaystyle H} . {\displaystyle H}

Rajoitus

Skeemateoreema pätee olettaen, että geneettinen algoritmi ylläpitää äärettömän suurta populaatiota, mutta se ei aina siirry (äärelliseen) käytäntöön: alkupopulaation otantavirheen vuoksi geneettiset algoritmit voivat konvergoitua skeemoihin, joilla ei ole valikoivaa etua. Näin tapahtuu erityisesti multimodaalisessa optimoinnissa, jossa funktiolla voi olla useita huippuja: populaatio voi ajautua suosimaan yhtä huippua ja jättää muut huomiotta.

Syy siihen, että skeemateoreema ei voi selittää geneettisten algoritmien tehoa, on se, että se pätee kaikkiin ongelmatapauksiin eikä sillä voida erottaa toisistaan ongelmia, joissa geneettiset algoritmit suoriutuvat huonosti, ja ongelmia, joissa geneettiset algoritmit suoriutuvat hyvin.

Monimodaalisen funktion kuvaaja kahdella muuttujalla.Zoom
Monimodaalisen funktion kuvaaja kahdella muuttujalla.

Kysymyksiä ja vastauksia

K: Mikä on Hollandin skeemateoreema?


A: Hollandin skeemateoreema on geneettisiä algoritmeja koskeva teoreema, jonka mukaan yksilöt, joiden kunto on keskimääräistä korkeampi, ovat todennäköisemmin voittajia.

K: Kuka ehdotti Hollandin skeemateorian ja milloin?


V: John Holland ehdotti Hollandin skeemateoreemaa 1970-luvulla.

K: Mikä on skeema geneettisten algoritmien yhteydessä?


V: Geneettisten algoritmien yhteydessä skeema on malli, joka tunnistaa merkkijonojen osajoukon, jolla on samankaltaisuuksia tietyissä merkkijonon kohdissa.

K: Miten tulkitaan Hollandin skeemateoreemaa, jota käytettiin perustana geneettisten algoritmien tehoa koskeville selityksille?


V: Geneettisten algoritmien tehoa koskevien selitysten perustana käytetyn Hollandin skeemateorian tulkinta on, että yksilöt, joiden kunto on keskimääräistä korkeampi, pääsevät todennäköisemmin voitolle.

K: Mitä Hollandin skeemateoremin kritiikki on osoittanut sen olevan?


V: Hollandin skeemateoremin kritiikki on osoittanut sen olevan Price-yhtälön erikoistapaus, jossa skeemaindikaattorifunktio on makroskooppinen mitta.

K: Mikä on sylinterijoukkojen erikoistapaus?


V: Skeemat ovat sylinterijoukkojen erikoistapaus.

K: Millaisen avaruuden skeemat muodostavat?


V: Skeemat muodostavat topologisen avaruuden.


Etsiä
AlegsaOnline.com - 2020 / 2025 - License CC3