Kompendium i Populasjonsgenetikk
til kurset mnk BI211 Genetikk
Hans K. Stenøien
Våren 2001
Botanisk institutt, KB-fakultetet
Norges Teknisk- Naturvitenskapelige Universitet
Hva er populasjonsgenetikk?
Populasjonsgenetikk er studiet av den genetiske basisen for evolusjon:
Hvilke evolusjonære krefter har forårsaket variasjonen
vi observerer mellom individer av samme art?
Definisjoner
-
Evolusjon: forandring i allelfrekvenser i en populasjon over tid.
-
Populasjon: individer av samme art som virker sammen i grupper.
-
Allel ("gen"): et stykke DNA på en bestemt kromosomal posisjon
(locus). Et locus kan fremvise ulike alleliske varianter.
-
Genetisk variasjon: skyldes ulike alleler ved bestemte loci i en
art; deles inn i 1) innen-populasjon variasjon og 2) mellom-populasjon
variasjon. Et locus som fremviser genetisk variasjon sies å være
polymorft.
Et locus uten variasjon er monomorft.
-
Allelfrekvenser: den fundamentale måleenheten på genetisk
variasjon ved gitte loci; forandres som følge av evolusjonære
krefter.
-
Idealisert populasjon: tenkt populasjon der ingen evolusjonære
krefter virker og allelfrekvenser er konstante over tid. I en idealisert
populasjon med tilfeldig formering (panmiksi) vil også genotypefrekvenser
være konstante over tid.
Observasjon av variasjon
-
Enkleste måte å beskrive genetisk variasjon på er ved
å estimere frekvensfordeling av genotyper, dvs. andelen av
bestemte genotyper i en populasjon.
-
Et mer anvendelig mål er andelen av et bestemt allel sammenlignet
med det totale antall alleler i en populasjon, dvs. allelfrekvensfordelingen.
Kalkulering av allelfrekvenser
-
Anta at vi har et locus med to alleler A og a, hver med frekvens
lik hhv. p og q. Frekvensen av de tre genotypene AA,
Aa
og aa er hhv. fAA, fAa og faa.
Hvert homozygot AA individ består av to A alleler mens
hver heterozygot består av ett A allel. Dermed har vi at
.
For a alleler har vi tilsvarende uttrykk:
.
Merk at
, og dermed at q
= 1 - p.
-
For multiple alleler er frekvensen av hvert allel lik frekvensen av homozygoter
pluss halvparten av summen av frekvensene av alle genotypene der allelet
inngår:
,
der 1, 2,..., n benevner andre alleliske typer enn A
i en populasjon.
Kalkulering av heterozygoti (H) ved flere loci
-
Kalkulere frekvensen av heterozygoter ved hvert locus separat.
-
Behandle hvert locus sammen i en enhet (haplotype) og beregne andelen
av alle individer som bærer to ulike haplotypiske former. Haplotyper
betraktes som "alleler" i denne tilnærmingen. Dette kalles haplotypisk
eller gametisk diversitet.
Haplotypisk diversitet er større enn gjennomsnittlig heterozygoti
for individuelle loci, fordi et individ er haplotypisk heterozygot hvis
bare ett av lociene er heterozygote.
Eksempler på genetisk variasjon
Alle arter fremviser til dels høy genetisk variasjon i ulike
karakterer.
-
Morfologisk variasjon: F.eks. skallet på sneglen Cepaea
nemoralis, som er rosa eller gult, og dette skyldes to segregerende
alleler ved ett locus. Skallet er også stripet eller ustripet.
-
Kromosomal variasjon: Mange arter har ulike antall kromosomer og
kromosomenes morfologi er forskjellige (karyotyper er ikke artsspesifikke).
Dette skyldes ekstra kromosomer, resiprokale translokasjoner og inversjoner.
-
Immunologisk variasjon: En rekke loci i vertebrater koder for antigeniske
typer, f.eks. AB0 blodtyper.
-
Protein variasjon: Variasjon i polypeptider kodet av strukturelle
gener. En rekke kodon-forandringer medfører aminosyre(AA)-substitusjoner
i polypeptidkjeder (utskifting av "side-chain"). Dette kan føre
til endret masse og/eller elektrisk ladning av polypeptidet. Elektroforese
kalles en teknikk for å separere slike molekylære varianter.
I et elektrisk felt (gel) vil ladete molekyler vandre mot en elektrode
med motsatt ladning, og molekyler med ulik ladning og masse vil vandre
med ulik hastighet over gelen og kan dermed separeres. Dette er en mye
brukt teknikk i populasjonsgenetiske studier, selv om man ikke kan se på
regulatorgener
(gener som slår av og på transkripsjon av strukturgener).
-
DNA sekvens variasjon: Ulik oppløsning i slike studier:
-
Variasjon i nukleotidekjeder gjenkjent av restriksjonsenzymer (grov
oppløsning).
-
Komplett sekvensvariasjon (fineste oppløsning)
-
RFLP variasjon ("restriction fragment length polymorphisms"): Et
restriksjonsenzym (RE) vil gjenkjenne en 4 basepar (bp) lang sekvens eller
en 6bp lang sekvens og kutte DNA sekvensen i slike restriksjonsseter. Basesubstitusjoner
og/eller indels (insersjoner eller delesjoner) vil ødelegge gjenkjennelsessetet
("recognition site") for RE, og man vil få polymorfismer: i noen
individer kutter RE mens i andre kutter det ikke.
VNTR ("variable number of tandem repeats") er DNA sekvenser som
finnes i mange kopier og som ligger etter hverandre langs en sekvens. Tandem-repetisjoner
finnes spredt utover hele genomet. Man kan f.eks kutte med RE på
hver side av slike repetisjoner og separere dem elektroforetisk. Fragmenter
med ulike antall repetisjoner vil separeres (1bp oppløsning).
-
Komplett sekvensvariasjon: F.eks. ved å sekvensere et gen
på noen tusen bp. To typer info:
-
Variasjon i proteinkodende sekvenser (ekson): hvor mange og hvilke AA er
ulike mellom individer. Basesubstitusjoner som medfører AA-substitusjoner
kalles ikke-synonyme substitusjoner ("replacement" substitusjoner).
-
Variasjon i sekvenser som ikke koder for proteiner (introns, 5'- og 3'-flanking)
eller variasjon i ekson som ikke medfører AA-substitusjon (synonyme
substitusjoner).
-
25% av alle tilfeldige substitusjoner i kodon er synonyme. Men de fleste
observerte substitusjoner synonyme fordi substitusjoner sjelden er tilfeldige.
AA-forandringer som følge av ikke-synonyme substitusjoner kan påvirke
proteinets funksjon og vil kunne være skadelige for individet.
-
Kvantitativ variasjon: Biologisk mangfold kan ofte ikke inndeles
i noen få diskrete (kvalitative) klasser, men vil heller være
kontinuerlig (kvantitativ), f.eks. høyde på individer. Denne
variasjonen kan i mindre grad forklares ved allelfrekvens-variasjon i enkeltloci
(det finnes ikke alleler for å være 179cm vs. 180cm høy).
Slik variasjon skyldes samvirke mellom alleler ved mange loci, samt miljøet
organismen lever i, og behandles i kap. 25 i lærebok.
Hardy-Weinberg teoremet
-
Før Mendel: blending-teorien var en populær forklaring
på hvordan karakterer nedarves. Blending-teorien predikerer at seksuell
formering medfører nedgang i variabilitet (et stort problem for
Darwin). F.eks. hvis 1/2 av en tilfeldig formerende populasjon er lang
og 1/2 er kort, vil ekstreme fenotyper kun opprettholdes ved krysning mellom
korte eller krysning mellom lange individer. I neste generasjon vil 1/4
være korte (1/2 x 1/2), 1/4 vil være lange (1/2 x 1/2) mens
1/2 vil være intermediære. Variasjonen halveres hver generasjon,
og populasjonen vil være monomorf i løpet av få generasjoner,
dvs alle individer vil være intermediære.
-
Mendel ryddet opp i dette. Mendeliansk arvelære kjennetegnes
ved segregering av diskrete alleler i meiosen, slik at f.eks. krysning
mellom intermediære foreldre ikke nødvendigvis produserer
intermediært avkom. Ekstreme fenotyper (homozygoter) vil også
kunne produseres ved en slik krysning.
Eksempel på Mendeliansk nedarving:
-
Anta at hanner og hunner krysser seg tilfeldig med hverandre for et locus
A.
(Tilfeldig formering = panmiksi Û
blande alle egg og sperm og så tilfeldig sette dem sammen til zygoter
som vil danne neste generasjons individer.) Anta at locus A har
to alleler, A og a, hver med en frekvens på hhv. p=0,6
og q=1-p=0,4. Allelfrekvensen er lik i begge kjønn.
-
Sannsynligheten for at A sperm trekkes sammen med A egg er
0,6 x 0,6 = 0,36; 36% sjanse for AA avkom. Sannsynligheten for aa
avkom er 0,4 x 0,4 = 0,16. Heterozygot avkom dannes enten ved at
A
sperm trekkes med a egg, eller at a sperm trekkes
med A egg, dvs. samlet sannsynlighet for heterozygot avkom er 2
x 0,6 x 0,4 = 0,48.
-
Allelfrekvenser i neste generasjon (p' og q') vil være
, og
Dette ble første gang vist av Hardy og Weinberg.
Hardy-Weinberg likevekt
-
Anta et locus med to alleler A og a med frekvenser på
hhv. p og q=1-p i en panmiktisk populasjon. Sannsynligheten
for å produsere ulike genotyper i neste generasjon:
,
, og
,
og frekvensen av A og a i neste generasjon (p'
og q') blir dermed
, og
.
-
Likevektsfordelingen
kalles
Hardy-Weinberg
(HW) likevekt. Allel- og genotypefrekvenser vil ikke forandre seg over
generasjoner ved tilfeldig formering. Genetisk variasjon vil ikke forandre
seg i en populasjon i fravær av evolusjonære krefter.
-
HW-likevekt innebærer at genotypefrekvenser er helt bestemt av allelfrekvensen
p
etter bare én generasjon med tilfeldig formering. Sjeldne
alleler ("rare alleles") vil dermed sjelden finnes i homozygote genotyper.
F.eks. q = 0,001: faa =
.
-
Frekvenser av alleler i heterozygoter versus homozygoter er ifølge
HW
. (q2
ganges med 2 fordi to kopier av allelet finnes i homozygote individer.)
Hvis f.eks. q = 0,001, vil forholdet mellom heterozygote og homozygote
individer være 999:1.
Mutasjon
-
Evolusjon kan skje ved at ulike genetiske varianter har ulik overlevelsesevne,
og at den varianten med høyest overlevelsesevne til slutt tar over
i en populasjon (den fikseres). Alle andre varianter vil isåfall
tapes
fra populasjonen.
-
For å opprettholde evolusjon må populasjoner tilføres
ny variasjon, og dette kan skje enten via mutasjon, rekombinasjon eller
immigrasjon av individer fra andre populasjoner.
-
Rekombinasjon skaper ikke ny allelisk variasjon (bare haplotypisk variasjon),
og migrasjon skaper ikke ny variasjon i arten som helhet.
-
Mutasjon er den ultimate kilden til variasjon.
-
Mutasjonsraten til et locus er sannsynligheten for at en kopi av
et allel forandres til en annen allelisk form i løpet av en tidsenhet,
f.eks. en generasjon (benevnes ofte u eller m
).
-
Mutasjonsrater er for de fleste loci ekstremt små, og allelfrekvenser
vil forandre seg meget sakte bare som en følge av mutasjonsprosessen.
Dermed: mutasjoner er kilden til fortsatt evolusjon, men mutasjonsprosessen
i seg selv driver ikke evolusjonen fremover.
-
F.eks. anta en populasjon bestående kun av homozygote AA individer
for et locus. Hvis mutasjonsraten til et hvilket som helst allel a
er u = 10-5 vil frekvensen av mutant allel i neste
generasjon være q = 0,000010, og frekvensen av vill-typen
("wild-type") A vil være p = 0,99999. I påfølgende
generasjon fraksjonen nydannede a alleler være 0,99999 x 10-5
= 0,000009, og ny frekvens av a vil være q = 0,000019.
-
Forandringsraten går ned for hver generasjon fordi det blir færre
kopier igjen av A å mutere fra.
Effekten av mutasjoner på allelfrekvensen
-
Anta et locus med to alleler A og a med frekvenser lik hhv.
pt
og qt=1-pt i generasjon
t. Mutasjoner
fra A til a skjer med en rate u per generasjon. Forandring
i alleliske frekvenser etter én generasjon er
.
p synker med en rate proposjonal med u og andelen
A
alleler tilgjengelig for mutasjon. Mao.
blir
mindre når p blir mindre fordi færre A alleler
kan mutere til a.
-
Størrelsen på p etter n generasjoner: Hvis p0
er andelen A alleler i generasjon 0, så vil
,
,
og generelt
, der e er basen i den
naturlige logaritmen. (Merk:
når
a
er liten og b er stor.)
-
Eks. u=10-5, p0=1,0 og n=104:
.
(<10% av allelene er a etter 104 generasjoner.)
Rekombinasjon
-
Rekombinasjon er en mye raskere prosess for dannelse av genetisk variasjon
enn mutasjon hvis heterozygote loci er spredt utover kromosomer og man
har seksuell formering.
-
Hvis f.eks. et par homologe kromosomer er heterozygote ved n loci,
vil overkrysning kunne skje mellom ethvert av n - 1 intervaller
mellom kromosomene. Hver rekombinasjon danner 2 haplotypiske varianter
det er dermed mulighet for å danne 2(n - 1) nye haplotyper
fra en generasjon med overkrysning.
-
Organismer som sjelden rekombinerer vil bare ha mutasjoner som eneste kilde
til haplotypisk variasjon. I læreboken spekuleres det i at slike
organismer har en saktere evolusjon enn seksuelt rekombinerende organismer.
Det finnes imidlertid ikke pr. i dag noe belegg for å hevde at rekombinasjon
er sentral for evolusjonshastighet. Man vet lite om hva som er avgjørende
for evolusjonshastighet, men viktige faktorer som er foreslått inkluderer
generasjonstid, metabolsk rate og artsdannelsesrate.
Genflyt (migrasjon)
-
Genflyt er enhver form for introduksjon av gener fra en populasjon
til en annen. Variabilitet i en populasjon dannes ved immigrasjon av individer
eller gameter fra populasjoner med andre allelfrekvenser for gitte loci.
Resultatet blir en mikset populasjon med intermediær allelfrekvens
mellom opprinnelig frekvens i mottagende (recipient) populasjon
og frekvens i donor populasjon.
-
F.eks. recipient mottar immigranter som i antall utgjør 10% av populasjonsstørrelsen.
Etter én generasjon vil recipient ha allelfrekvenser som avspeiler
recipient og donor i forholdet 9:1. Hvis allelfrekvensen av allelet A
i recipient opprinnelig er pt=0,7 i generasjon t,
og den tilsvarende allelfrekvensen er P=0,4 i donor, så vil
allelfrekvensen i neste generasjon være
.
-
I motsetning til mutasjonsraten kan migrasjonsraten være høy,
og forandringer som følge av genflyt kan være store over noen
nå generasjoner.
Effekten av genflyt på allelfrekvenser
-
Anta at pt angir allelfrekvensen for allel A i
recipient populasjon i generasjon t, mens P angir tilsvarende
frekvens i donor populasjon (evt. gjennomsnittlig allelfrekvens hvis det
er flere donorer). m angir andel av recipient populasjon som mellom
hver generasjon blir utskiftet av migranter fra donor populasjon, og vi
har da at
,
Allelfrekvensen i recipient i neste generasjon skyldes miksing av (1
- m) gener fra recipient og m gener fra donor.
-
Forandringsraten i recipient populasjon's allelfrekvens mellom hver generasjon
er gitt ved
,
dvs. forandringen i allelfrekvensen i recipient er proporsjonal
med migrasjonsraten og ulikheten i frekvens mellom recipient og
donor.
-
Vi kan uttrykke endringen i pt når t øker
slik:
(og når vi setter t
= x)
.
Allelfrekvenser i recipient populasjon nærmer seg den i donor over
tid da
går mot null
når t øker.
Ikke-tilfeldig formering
-
To former for avvik fra tilfeldig formering: 1) formering mellom slektninger
skjer i større eller mindre grad enn forventet (hhv. innavl
og utavl), eller 2) formering mellom individer som ligner eller
som er ulike hverandre (hhv. positiv og negativ assortativ formering).
-
Assortativ formering er spesifikk for bestemte trekk (f.eks. hudfarge,
høyde), innavl virker på hele genomet. Mennesker med assortativ
formering mht. hudfarge kan ha tilfeldig formering mht. blodtype, mens
søsken vil i gjennomsnitt være like beslektede ved alle loci.
-
Merk: nære slektninger (eks. søsken) kan være helt ulike
i bestemte trekk, mens individer som ligner hverandre i bestemte trekk
(eks. hårfarge) kan være ubeslektede.
-
Positiv assortativ formering og innavl fører til økt grad
av homozygoti i en populasjon utover nivået predikert av Hardy-Weinberg
ligningen (men allelfrekvenser forandres ikke).
-
Hva angår innavl: to individer som er i slekt har pr. definisjon
en felles stamfar ("ancestor") i nær fortid. Sannsynligheten for
at et tilfeldig allel ved et locus er identiske for de to individene er
dermed større enn ved tilfeldig formering.
-
Mao: ved innavl er det større sannsynlighet for identity by descent
("homozygosity
by descent") mellom to individer, dvs. større sannsynlighet for
homozygoti (p2 + q2)i en populasjon
enn forventet ved tilfeldig formering.
-
Sannsynligheten for identity by descent (IBD) uttrykkes i innavlskoeffisienten
F
som er definert som sannsynligheten for at to tilfeldig trukkede alleler
fra to forskjellige individer i en bestemt generasjon er IBD.
Kalkulering av F
-
Effekten av formering mellom nære slektninger på grad av homozygoti
kan f.eks. uttrykkes som sannsynligheten for homozygot aa avkom
ved bror x søster formering. Dette vil være sannsynligheten
for at den ene eller den andre av besteforeldrene er heterozygote x sannsynligheten
for at a overføres til søster x sannsynligheten for
at a overføres til bror x sannsynligheten for et aa
avkom etter en Aa x Aa krysning; dvs
.
-
Hvis sannsynligheten for at begge besteforeldre er heterozygote være
tilnærmet lik null, at q << 1 og at
1,0,
da vil sannsynligheten for å få et homozygot aa avkom
være omlag
. Hvis
q
=
10-3, så vil 1 av 4000 avkom fra søsken-krysning
være recessive homozygoter, mens ved tilfeldig formering vil det
være 1 av 1.000.000 avkom.
-
Risiko-ratioen ved formering mellom helsøsken sammenlignet
med tilfeldig formering er tilnærmet lik
.
Når q = 10-3 vil den relative risikoen være
250:1. Ved formering mellom søskenbarn er den relative risikoen
være
, så hvis
q
= 10-3 vil det være 62,5 ganger så stor risiko for
skadet avkom sammenlignet med tilfeldig formering.
-
Innavl fører i ytterste konsekvens til fullstendig homozygote familier
(linjer), og hastigheten på tilnærming til homozygoti avhenger
av slektskap mellom formerende individer. Hvilket allel som fikseres innen
en linje er tilfeldig.
-
Hvis opprinnelig populasjon har en frekvens for allel A lik p
og a lik q=1-p, så vil til slutt p av
de homozygote linjene ha AA individer og q av linjene vil
ha aa individer, fordi det er tilfeldig hvilke alleler som fikseres
innen en linje. Innavl fører til at variasjon transformeres fra
innen populasjon variasjon til mellom linje/subpopulasjon variasjon.
Tilfeldig genetisk drift
-
Alle populasjoner er av begrenset størrelse, og vil dermed utsettes
for tilfeldige forandringer i allelfrekvenser (dvs. genetisk drift)
også i fravær av andre evolusjonære krefter. Genetisk
drift skyldes at ulike individer ved tilfeldighet bidrar med ulike antall
avkom til neste generasjon, samt tilfeldigheter forbundet med Mendeliansk
segregering.
-
F.eks. en haploid aseksuell populasjon med en populasjonsstørrelse
på 100 individer, med et allel A med en frekvens lik p=0,5
og et allel a med en frekvens lik q=0,5. 100 gameter trekkes
tilfeldig for å danne neste generasjon, og nye frekvenser er p'=0,47
og q'=0,53. Pga. samplingfeil har det skjedd evolusjon ved ren tilfeldighet.
-
Genetisk drift har to viktige konsekvenser:
-
Genetisk variasjon fjernes fra en populasjon (fjerningsrate inverst proposjonal
med populasjonsstørrelse, dvs. drift er en svak kraft i store populasjoner).
-
Drift påvirker sannsynligheten for overlevelse av nye mutasjoner
(i alle populasjoner).
Genetisk drift og tap av variasjon
-
Ved genetisk drift vil genetisk variasjon synke i individuelle populasjoner
og øke mellom populasjoner fordi populasjoner ved tilfeldighet
fikserer ulike alleler. Drift er dermed en slags innavlseffekt.
Det er større sannsynlighet for IBD enn det predikert av Hardy-Weinberg,
men effekten skyldes små populasjoner og ikke innavl.
-
Founder effekt: liten gruppe individer adskilles fra stor populasjon
og har liten populasjonsstørrelse i mange generasjoner. Genetisk
variasjon vil være redusert fordi 1) ikke all variasjon fra stor
populasjon er overført av ved founding, og 2) noen av de introduserte
variantene vil lettere kunne tapes pga. begrenset populasjonsstørrelse.
Eks. innfødte nordamerikanere mangler blodtype B.
-
Founding medfører en økt sannsynlighet for IBD, innavlskoeffisienten
F
øker og forventet heterozygoti H minsker.
Raten for tap av heterozygoti
-
Anta en liten panmiktisk gruppe av diploide individer av størrelse
N,
dvs. bestående av 2N haploide genomer. F er definert
som sannsynligheten for at to tilfeldig trukkede alleler i populasjonen
er identiske (eks. samme basesekvens). Ingen variasjon: F = 1, og
alle alleler ulike alle andre: F = 0. H = 1 - F uttrykker
andelen heterozygoter i populasjonen. Verdien av F i generasjon
t
kan uttrykkes som
.
-
Sannsynligheten for homozygoti i t er summen av 1) sannsynligheten
for at to tilfeldig trukkede alleler er kopier av samme allel fra forrige
generasjon (1/2N fordi alle alleler har samme sannsynlighet for
å bli trukket), og 2) sannsynligheten for at to alleler ikke har
samme ancestor i forrige generasjon, men at de likevel har identiske alleler
(uttrykt i Ft-1).
-
Uttrykk for tap av genetisk variasjon gjennom tid som følge av genetisk
drift:
{fordi (1-a)b@ e-ab
når a er liten og b er stor}
Når t blir stor vil Ht nærme seg null,
mao. drift fjerner variasjon gjennom tid.
-
Etter én generasjon vil andel heterozygoti ha blitt redusert med
en fraksjon 1/2N:
Hvor effektiv er genetisk drift?
-
Effektiviteten til genetisk drift: f.eks. hvor lang tid tar det å
halvere den genetiske variabiliteten uttrykt i form av H i en populasjon
som følge av drift (
)?
Mao:

Halveringstiden er proposjonal med N (intuitivt). Drift alene
er en svak evolusjonær kraft.
F.eks. N=106:
generasjoner;
34,5 mill år hvis generasjonstiden (g) er på 25 år.
F.eks. N=10:
generasjoner;
7225 år hvis g = 25.
Drift og mutasjon
-
De fleste nye mutasjoner tapes ved ren tilfeldighet.
-
Eks. anta at en mutasjon inntreffer i en populasjon. Det er en viss sannsynlighet
for at heterozygot bærer ikke reproduserer seg. Ved ett avkom: sannsynlighet
lik 1/2 for at mutasjon ikke overføres til neste generasjon. Ved
to avkom: sannsynlighet lik 1/4 for at mutasjon ikke overføres,
osv. Hvis mutant overføres til neste generasjon: en viss sannsynlighet
for at nytt individ ikke formerer seg, osv.
-
Sannsynligheten for fiksering av et nytt allel i en populasjon med
størrelse N er lik frekvensen av allelet, dvs. 1/2N.
F.eks. en ny mutant som dannes i en populasjon på 1000 individer
vil ha en sannsynlighet på 0,05% for å fikseres, og
sannsynlighet
for å tapes.
-
De fleste mutanter tapes veldig raskt fra populasjoner. Gjennomsnittlig
fikseringstid
for de mutantene som blir fikserte i populasjonen (kondisjonell
fikseringstid) er 4N generasjoner, dvs. 4000 generasjoner når
N
=
1000, og 100.000 år når g
= 25 år.
-
Substitusjonsraten, dvs. antall mutanter som fikseres per tidsenhet,
kan uttrykkes som følger: 1) Antall nye mutanter som oppstår
ved et locus er 2Nu per generasjon. 2) Sannsynligheten for fiksering
av disse nye mutantene er P = 1/2N. 3) Substitusjonsraten
er gitt ved K = 2NuP, og vi har dermed at
K = u.
I fravær av seleksjon er substitusjonsraten lik mutasjonsraten.
Substitusjonsraten er uavhengig av populasjonsstørrelsen.
-
I fravær av seleksjon vil man likevel ha genetisk variasjon ved et
locus, og denne variasjonen skyldes likevekten mellom innførsel
og tap av variasjon, dvs. mutasjon og drift.
Drift og mutasjon balanse
-
Drift-mutasjon balanse betyr at det er en dynamisk likevekt mellom
innførsel av variasjon pga. mutasjoner og tap av variasjon som følge
av drift. Allelisk variasjon "opprettholdes" ikke i bokstavelig forstand,
da alleler fikseres og tapes i konstante rater. Variasjonsnivået
vil ved tidspunkt t1 og t2 være
lik ved drift-mutasjon balanse, men alleliske former kan være forskjellige
ved t1 og t2.
-
Variabiliteten i en populasjon ved drift-mutasjon likevekt kan uttrykkes
som
, der
F er sannsynligheten for IBD i populasjonen (dvs. andelen homozygoti
i dette tilfellet), t er generasjonen, N er populasjonsstørrelsen
og u er mutasjonsraten.
-
Når u<<1, vil u2»0,
og u/N» 0. Ved likevekt
vil Ft+1=Ft,=
=
.
Dermed har vi at
.
-
Dette er forventet variabilitet i en populasjon i fravær av naturlig
seleksjon. F.eks. hvis N=104 og u=10-5,
så er forventet variabilitet for et locus som ikke selekteres lik
H=0,286.
Hvis observert variabilitet er H=0,286 i en populasjon, så
forventer vi i gjennomsnitt at 2Nu=0,2, dvs. at det produseres én
mutant per 5. generasjon i populasjonen (stor standard-error for faktiske
data-sett!).
Naturlig seleksjon
-
Darwin påpekte at følgende antagelser ligger til grunn
for evolusjon ved naturlig seleksjon
-
Alle arter har flere avkom enn det antall som kan overleve og reprodusere
(følger av observasjonen av at populasjonsvekst er eksponensiell
under optimale forhold).
-
Organismer har ulike evner til å overleve og reprodusere seg (dette
stemmer med faktiske forhold ut i naturen).
-
Deler av variasjonen i evne til å overleve og reprodusere seg er
arvelig (gjelder nærmest alle trekk observert i levende organismer).
Dette kan uttrykkes som at visse genotyper er mer adapterte til
sine miljø, noe som avspeiler seg i høyere fitness
til disse genotypene sammenlignet med andre genotyper.
-
Hvis disse tre premissene er oppfylte, vil man ha naturlig seleksjon:
prosessen der genotyper med høyere fitness i gjennomsnitt produserer
flere avkom enn genotyper med lavere fitness.
Fitness
-
Fitness uttrykker gjennomsnittlig sannsynlighet for overlevelse
of reproduksjon til en genotype sammenlignet med andre genotyper i en populasjon.
Man kan ikke snakke om fitness til individer, bare grupper av individer.
-
Fitness uttrykker hvordan en genotype klarer seg i et bestemt miljø,
dvs. samme genotype kan ha ulik fitness i ulike miljø. Dette skyldes
at 1) ulike miljø fører til utviklingen av forskjellige fenotyper
(f.eks. kuldebehandling av frø bestemmer blomstringstidspunkt),
og 2) ingen genotype er overlegen alle andre genotyper i alle miljø
(f.eks. pigmentmengde i hud er avgjørende for hvor godt man tåler
et liv i solrike versus solfattige strøk).
-
Miljøet er årsak og virkning til evolusjon av organismer.
Miljøet modifiseres av organismen og er dermed ikke fiksert
(f.eks. torvmoser etablerer seg i fattige og sure miljø, der de
skiller ut store mengder hydroksider, forsurer dermed sitt eget miljø,
og utkonkurrerer slik andre arter - miljøbetingelsene blir dermed
forandret for mosen).
Fitness-ulikhet i Mendelianske trekk
-
Eks. basesubstitusjon i strukturelt gen kodende for b
-kjeden av hemoglobin (b -genet) kan medføre
sigdcelleformede blodlégemer med lavt oksygenopptak. Homozygot HbSHbS
har sterk anemi og lav overlevelsesrate, mens heterozygot HbAHbS
vil ha mild anemi og den samme eller noe lavere fitness enn vill type HbAHbA.
-
I regioner med høy frekvens av malaria (falciparum) har heterozygot
høyere fitness enn vill-type: tilstedeværelsen av en viss
mengde sigdcelleformet hemoglobin beskytter mot malaria (heterozygot
fordel). Dette er ikke tilfelle i Europa eller Nord-Amerika.
-
Merk: dette er ikke et "enkelt Mendeliansk trekk" (selv om
alle lærebøker sier at det er det). Andre loci modifiserer
uttrykket av b -genet (epistasi): heterogenitet
i fitnessnedgang som følge av S-allelet, f.eks. Middelhavspopulasjoner
har liten fitness-reduksjon.
Hvordan seleksjon virker
-
F.eks. anta at recessiv mutant a er letal før reproduksjon
i homozygot bærer, og at q=0,10 i en gitt generasjon. Ved
tilfeldig formering er genotypefrekvens i zygoter lik fAA=0,81,
fAa=0,18
og faa=0,01. Ved reproduktiv alder har alle aa-individer
dødd, dvs faa=0. For at fAA, fAa
og faa skal representere genotype-frekvenser må
disse uttrykkene summeres til 1, og vi må derfor dele med 0,81+0,18+0=0,99.
Genotypefrekvenser i adult populasjon er fAA=0,818, fAa=0,182
og faa=0.
-
Frekvens av allel a i avkom blir

. Forandring i allelfrekvens etter én generasjon med seleksjon er
q'
-
q
= 0,091 - 0,100 = -0,009.
Effekt av seleksjon på allelfrekvens
-
Anta to alleler A og a med frekvens lik hhv. p og
q
for et gitt locus. Ved zygoteformasjon er populasjon i HW-likevekt, dvs.
fAA
= p2, fAa = 2pq og faa
= q2. Anta at de tre genotypene har en sannsynlighet
for overlevelse til reproduktiv alder (viabilitetsfitness) på
wAA,
wAa og waa.
Frekvensen av adulte
individer i populasjonen er dermed gitt ved
p2wAA,
2pqwAa og
q2waa.
-
Fitness er fraksjoner <1, og summen av adulte genotypefrekvenser som
uttrykt over blir derfor <1. Vi må dele hver fraksjon med summen
av alle genotypefrekvenser etter seleksjon, dvs. på
.
kalles
gjennomsnittlig
fitness for en populasjon, da det faktisk uttrykker gjennomsnittet
av fitnesser for alle genotyper i en populasjon.
-
Genotypefrekvenser for adulte individer er ditt ved hhv.
og
.
-
Frekvensen p' av allel A i neste generasjon er gitt
ved
.
-
Uttrykket
kalles gjennomsnittlig
fitness for allel A. Ifølge HW vil forholdet mellom A
alleler i homozygote versus heterozygote individer være p2/pq
= p/q. En andel p av alle A alleler vil ha
en fitness lik wAA, og en andel q vil ha en fitness
lik wAa. Gjennomsnittlig fitness for allel a er
likeledes gitt ved 
-
Poeng: Etter én generasjon med seleksjon er frekvensen av
A
lik opprinnelig frekvens av A (p) ganger forholdet mellom
gjennomsnittlig fitness til A og fitnessen til hele populasjonen.
Hvis
vil p'>1 og
A
øker i frekvens, mens hvis
vil
p'<1
og A synker i frekvens.
er
gjennomsnittlig fitness for både A of a alleler, så
hvis
så må
og
vice versa. Allelet med høyest gjennomsnittlig fitness øker
i frekvens.
-
Utfallet av seleksjon avhenger ikke av absolutt, men av relativ fitness.
F.eks. fitness til genotyper kan uttrykkes som absolutte reproduksjonsrater,
men det er likevel forholdet reproduksjonsratene imellom som avgjør
hvilket allel som øker i frekvens i populasjonen.
-
Seleksjon medfører at allelet med høyest gjennomsnittlig
fitness øker i frekvens i en populasjon. Dette innebærer at
seleksjon
øker gjennomsnittlig fitness til en populasjon over tid.
-
Denne økningen av

betyr ikke nødvendigvis at arten som helhet oppnår
"optimale egenskaper" over tid. Fitness er uttrykk for overlevelses- og
reproduksjonsevne til de ulike genotypene innen en populasjon. Fitness-maksimering
i en populasjon betyr ikke nødvendigvis at populasjonen blir større,
vokser raskere eller har mindre sannsynlighet for å bli utryddet.
Forandringsrate i allelfrekvens ved seleksjon
-
Gjennomsnittlig fitness for allel A og a er gitt ved hhv.
og
.
Vi kan dermed uttrykke gjennomsnittlig fitness for populasjonen som
.
-
Forandring i allelfrekvens til allel A etter én generasjon
med seleksjon er lik
.
I og med q = 1 - p blir dette forenklet til
,
og vi har at
.
-
Det at
, betyr at
er
positiv (A øker) hvis gjennomsnittlig fitness til A
alleler er større enn gjennomsnittlig fitness til a alleler.
Ligningen viser i tilegg at hastigheten på forandringen er avhengig
av ikke bare fitnessulikheter mellom alleler, men også faktoren
pq
som er proporsjonal med frekvensen av heterozygoti (2pq)
i populasjonen.
-
For en gitt differanse i fitness mellom alleler vil allelfrekvenser endres
raskest når allelene A og a har samme frekvens, fordi
dette maksimerer pq. Hvis en populasjon har liten genetisk variasjon
(pq» 0), vil man ha sakte evolusjon
som følge av seleksjon, uansett hvor fit A er i forhold til
a.
Utvikling i allelfrekvens av A som følge av seleksjon gjennom
tid. Like etter dannelsen av A, og når frekvensen av a
er liten, vil evolusjonen gå sakte. Evolusjon er raskest når
en populasjon har mye genetisk variasjon. Konsekvens: det er ekstremt vanskelig
å redusere frekvensen av et allel som allerede er sjeldent i en populasjon
(spesielt hvis det er recessivt).
Likevektssituasjoner
Når vil alleliske frekvenser i populasjoner med naturlig seleksjon
ikke lenger forandre seg, dvs. når vil
?
-
når enten p eller
q
er lik 0. Denne situasjonen inntreffer hvis
er
konsekvent positiv eller negativ fordi
vil
være konsekvent positiv eller negativ helt til ett av de to allelene
er fikserte. Dette kalles direksjonell seleksjon ("unidirectional
selection"). Forutsetning: heterozygot fitness er intermediær de
homozygote fitnessene. Eks.
;
her vil alltid
uansett genotypefrekvenser.
-
når
.
Forutsetning: heterozygot fitness er mer ekstrem enn begge de homozygote
fitnessene, dvs.
eller 
. Begge disse situasjonene vil innebære intermediære frekvenser
av A.
Balansert polymorfisme
-
Naturlig seleksjon kan føre til en likevektstilstand i allelfrekvenser
der genetisk variasjon opprettholdes i en populasjon. Gjennomsnittlig fitness
til et allel er definert som gjennomsnittet av genotypene som bærer
allelet, dvs.
og
.
Anta at
og at
.
For en andel av verdiene til p vil
,
mens for den resterende andelen vil
.
Mellom disse to settene med p verdier finnes en verdi
der
.
-
kan uttrykkes ved å løse
,
og ved å sette p=1-q blir dette
.
-
F.eks. wAA=0,9, wAa=1,0 og waa=0,8.
Da vil
. Når
<2/3
vil
, og når
>2/3
vil
.
-
Det er to kvalitativt forskjellige likevektstilstander av
:
-
Ustabil likevekt av
.
Ingen frekvensforandring i populasjon hvis p=
,
men ved det minste avvik (f.eks. som følge av drift), vil p
fikseres eller tapes som følge av direksjonell seleksjon. Forutsetning:
og
,
og denne situasjonen kalles underdominans.
-
Stabil likevekt av
.
;
dvs. avvik fra
fører
til en returnering til
.
Forutsetning:
og at
,
og denne situasjonen kalles overdominans. Likevektssituasjonen er
en balansert polymorfisme.
-
Usannsynlig at ustabil likevekt inntreffer i naturen. Polymorfismer som
har eksistert lenge i naturen kan representere balanserte polymorfismer
(eks. inversjonspolymorfismer innen Drosophila). En annen mulighet
er at seleksjon i praksis ikke opererer: selektiv nøytralitet,
dvs
og dermed
.
Variasjonsnivået er da et resultat av mutasjon og drift (eks. elektroforetisk
enzymvariasjon).
Mutasjon-seleksjon balanse
-
En annen årsak til opprettholdelse av variasjon: balanse mellom introduksjon
av nye alleler ved mutasjon og fjerning ved seleksjon: mutasjon-seleksjon
balanse, eks. lavfrekvente polymorfismer for menneskelige sykdommer.
-
Skadelige mutasjoner oppstår hele tiden pga. ulike mutagener og disse
er recessive eller delvis dominante. Frekvensen av skadelige alleler i
en populasjon ved likevekt mellom introduksjon og fjerning vil avhenge
av ratioen mellom mutasjonsraten og seleksjonstrykket mot skadelig
genotype.
Forandring i allelfrekvens som følge av
mutasjon og seleksjon
-
Hvis q er frekvensen av skadelig, komplett recessivt allel a,
vil
og økning i
allelfrekvens vil være proporsjonal med mutasjonsraten u fra
A
til a, dvs.
.
-
Vi kan uttrykke seleksjonstrykket som en nedgang i fitness lik s
i recessiv homozygot genotype, slik at fitnessutrykkene blir wAA
= wAa = 1,0 og waa = (1-s).
Nedgang i allelfrekvens av a som følge av seleksjon kan uttrykkes
som
{der
og
}
{fordi
}
-
Ved likevekt mellom mutasjon og seleksjon må
,
dvs.




,
når vi antar at
(mao.
vi ser bort fra andregradsuttrykk av
).
-
Eks. recessivt letalt allel (s=1) med u=10-5,
.
Forandring i allelfrekvens ved delvis dominans
-
Skadelige mutasjoner kan ha en viss heterozygot effekt (inkomplett dominans),
og fitness til ulike genotyper kan isåfall uttrykkes som wAA=1,0,
wAa=(1-hs)
og waa=(1-s), der s som før er seleksjonstrykk,
og h er grad av dominans for allel (h går mot 0: recessiv
mutant).
-
som før.
kan
uttrykkes som
Ved å se bort fra andregradsuttrykk av
,
samt uttrykk der
inngår,
får man
.
-
Hvis f.eks. u=10-5, s=1 og mutanter har en 5%
skadelig effekt i heterozygoter (h=0,05), så vil
.
Hvis mutant er komplett recessiv er
,
mao. omtrent 10 ganger mer frekvent.
-
Generelt: komplett recessive alleler har mye høyere frekvens enn
delvis dominante fordi seleksjon er mye mer effektiv mot delvis dominante.
Dette skyldes at det store flertallet av mutante alleler (de som finnes
i heterozygoter) ikke er fullstendig skjermet mot seleksjon.
Mutasjonsload
-
Skadelige alleler senker gjennomsnittlig fitness i en populasjon. Mutasjoner
er nødvendig for å opprettholde evolusjon, men innebærer
samtidig en kostnad ("load") for populasjoner. Mutasjonsload (L)
er et mål på denne kostnaden ved tilstedeværelsen av
mutasjon og seleksjon, og kan uttrykkes som
,
der wmax er fitness til maksimalt fit genotype, og
er
gjennomsnittlig fitness. Jo nærmere
er
wmax,
desto mindre mutasjonsload er det i en populasjon.
-
Gjennomsnittlig fitness til en populasjon ved mutasjon-seleksjon likevekt
er gitt ved
, og ved komplett
recessiv mutasjon er
,
mens ved inkomplett dominans er
.
-
Hvis wmax=1, så vil
,
og
.
-
Mutasjonsload er lik mutasjonsraten for et locus i en populasjon.
Ved delvis dominans blir flere mutanter uttrykt i en populasjon og gjennomsnittlig
fitness dermed redusert.
-
Nedgangen i fitness til en populasjon med gjentatte mutasjoner er uavhengig
av seleksjonstrykket mot de skadelige allelene. Dvs. letale mutanter
medfører ikke større mutasjonsload enn marginalt skadelige
mutasjoner. Dette skyldes at meget skadelige mutasjoner (sterkt seleksjonstrykk)
vil ha en lav likevektsfrekvens men sterkt skadelig effekt. Svakt selekterte
mutanter vil ha en høyere likevektsfrekvens i populasjonen, men
skadelig effekt av hvert allel på gjennomsnittlig fitness er liten.
Seleksjon og drift
-
Genetisk drift medfører at selv gunstige mutanter (som har
høyere fitness enn vill-type) som regel vil tapes fra en populasjon
etter
kort tid. Hvis en ny mutant har en selektiv fordel s i heterozygoten
den opptrer i, så vil den ha en 2s sannsynlighet for å
fikseres i populasjonen. Dvs. en mutant som er 1% mer fit enn vill-type,
vil ha 98% sannsynlighet for å tapes fra populasjonen pga. drift.
-
Mutanter med en selektiv ulempe vil ha en relativt stor sannsynlighet
for å fikseres (gitt ved
)
i en populasjon når 2Ns£ 1.
-
Mao. effekten av selektive prosesser achenger av mengden genetisk drift,
dvs. størrelsen på populasjonen. Effekten av drift er proporsjonalt
med resiprokalen til populasjonsstørrelsen 1/N, mens effekten
av seleksjon er avhengig av s. Seleksjon er bare effektiv når
.
Når Ns er liten pga. stor N eller liten s, vil
mutanter være effektivt nøytrale.
-
F.eks. den menneskelige populasjonen var liten i en stor del av historien
til denne arten. Mange mutasjoner kan dermed ha vært effektivt nøytrale
i en lang tid (
) fordi N
var liten. Dermed kan mye variasjon ha blitt opprettholdt bare pga. mutasjoner
og drift. Nå kan de samme allelene være under seleksjon fordi
populasjonsstørrelsen til arten har blitt mye større.
Oversikt