Lappoid skrev:
Jeg er uenig med påstanden du fremfører på grunnlag av følgende resonnement: Jeg har laget en enkel simulering som simulerer en mannslinje fra en grunnhaplotype bestående av DYS19, DYS389I, DYS389II, DYS390, DYS391, DYS392, DYS393. Jeg har anvendt den direkte observerte mutasjonsraten for disse markørene publisert på
http://www.yhrd.org. Jeg har deretter brukt tilfeldig tall generatoren i Excel til å simulere mutasjonstilfeller og når mutasjoner skjer har jeg brukt 50/50 sannsynlighet for at en mutasjon er +1/-1 (litteratur påpeker at dette kanskje ikke er 100% tilfelle), tilbakemutasjoner blir derfor tatt hensyn til. Jeg har på grunnlaget av dette simulert en mannslinje gjennom 400 generasjoner eller 10 000 år (25 år per generasjon) som er i nærheten av antydet splitt mellom Europeisk og Asiatisk/Sibirsk N3 ifølge Rootsi 2006 og Derenko 2007. Jeg kjørte simuleringen 268 ganger for å få en distribusjon av spredningen av genetisk distanse ut fra grunnleggerhaplotypen og fikk resultatet at en genetisk avstand på 4 er mest sannsynlig med 23.9% av tilfellene på det 10 000'ende året med snitt 3.83, en tilsvarende kjøring på 5 000'nde året eller 200 generasjoner ga resultatet at en genetisk avstand på 2 er mest sannsynlig i 31.3% av tilfellene (snitt 2.18). Så det kan virke som om en genetisk distanse på omkring 2 per 5 000 år fra grunnleggertypen er den mest sannsynlige ut fra simuleringen.
Jeg antar at du har sett på hvor mye
en enkelt haplotype i gjennomsnitt kan ventes å
endre seg fra utgangspunktet i løpet av 5,000 (2 mutasjoner fra utgangspunktet) og 10,000 år (ca 4 mutasjoner fra utgangspunktet). I så fall virker både fremgangsmåten din og resultatene dine rimelige på meg. Dersom du derimot har modelert hvor stor spredningen mellom to forskellige haplotyper blir ut fra et utgangspunkt blir, vikrer ikke resultatene rimelige på meg. Ordlyden din samt resultatene dine gjør at
alt jeg sier videre bygger på den første tolkningen min.
Lappoid skrev:
Så i hvilke grad stemmer disse simulerte data med reelle observerte genetiske distanser? Jeg har tatt utgangspunktet i hele datasettet (med de samme markørene som simuleringen) til Lappalainen 2006 av finnlendere som utgangspunkt og asiatiske data fra Rootsi et al 2004 og Derenko et al 2007, jeg har da kun brukt unike haplotyper siden vi diskuterer linjer og laget en genetisk distansematrise med 134 finske N3 haplotyper og 45 asiatiske N3 haplotyper. Hvis finsk N3x og sibirisk/asiatisk N3x hadde en felles forfader for ca 10 000 år siden burde dette ifølge prediksjonen til simuleringen vises som en mest sannsynlig genetisk distanse på 4. Resultatet var overraskende(?) "on the spot" i forhold til simuleringen med mest sannsynlig genetisk distanse på 4 mellom finske og asiatiske linjer og et aritmetissk snitt gennetisk distanse på 4, men med noe mer ujevn distribusjon av halene på begge sider.
Slik jeg tolker dataene er det ikke noe grunn til å tro at finsk N3 nylig skal ha kommet over fra Asia/Sibir i løpet 140 generasjoner (ellers ville den forventede genetiske distansen være under 2), men splittet for ca 400 generasjoner siden fra den felles finske-asiatiske grunnleggeren.
Jeg er ikke sikker at jeg skjønner helt hva du har gjort her. Jeg antat at metoden din er følgende: du har sett på gjennomsnittavstanden mellom Asiatiske og finske haplotyper. F.eks finsk haplotype 1 har gjennomsnittlig avstand til Asiatisk N3 på 3,5. Du har deretter summeret dette gjennomsnittet for alle finske haplotyper og kommet frem til ca 4.
Jeg er uenig i at en skal kun se på enkelt haplotyper, slik som du gjør. Videre er jeg uenig i at en benytter både N3a1 og N3a2 (og kanskje til og med N3a*). Det meste av finsk N3 bør antas å være N3a1, en bør derfor måle dette opp mot N3a1 i Derenko (og kun N3a1).
Videre mener jeg at du må dele avstand med ca 2 (fratrukket sannsynlighet for parallell-mutasjoner) for å kunne sammenlingene med resultatene fra simuleringen din. Dette fordi både finske og asiatiske haplotyper må kunne antas å ha mutert siden de ble splittet opp. Dette skulle si ca 5,000 år og ikke 10,000. Dersom du korrigerer for N3a2 haplotyper og utvider til å ta med også ikke unike haplotyper, tror jeg du vil få et noenlunde likt svar som meg.