Inleiding
sinds de eerste pogingen om biologische variatie bij de mens te gebruiken om ons inzicht in vroege migraties van de mens te bevorderen, is de bevolking van Europa een belangrijk onderzoeksgebied geweest . Na de ontwikkeling van de landbouw in de Vruchtbare Halve Maan zo ‘ n 10.000 jaar geleden, heeft deze technologie zich van het Nabije Oosten naar het westen verspreid naar Europa, waardoor een belangrijke culturele overgang van rondreizende jager–bijeenkomst naar sedentaire landbouw plaatsvond, wat leidde tot een dramatische Bevolkingsgroei , tijdens wat bekend is geworden als de neolithische overgang . Binnen dit archeologische kader woedt het debat over de relatieve bijdragen aan de moderne Europese bevolking van de eerste mensen van Europa en degenen die er met de neolithische overgang naar migreerden, zowel in termen van hun genetische erfenis als wat betreft de processen van migratie en opvolging . Het ware scenario is ongetwijfeld veelzijdig en complex. Zowel het vroege werk aan ‘klassieke tellers’ gebruikend hoofdcomponentenanalyse als recentere studies gebruikend het chromosoom van Y hebben aangetoond dat in Europa, genetische variatie langs een Zuidoost–Noordwest gradiënt wordt gedistribueerd. Dergelijke observaties zijn voorgesteld ter ondersteuning van een model van demische verspreiding voor de neolithische overgang in Europa (dat wil zeggen dat de verspreiding van de landbouw ook gepaard ging met een bijbehorende beweging van mensen uit het Nabije Oosten) .
nieuw werk heeft gericht op de Neolithische overgang in Europa door zich te concentreren op de belangrijkste West-Europese Y chromosoom haplogroup R1b1b2-M269 (hierna aangeduid als R-M269). Dit geslacht had tot nu toe ontvangen weinig recente aandacht in dit verband, wel voorgaand werk gesuggereerd dat naar de ruimere R-M173 clade (exclusief naar de R1a-M17 sub-lineage) en Haplogroup 1 (afgeleid ter enig nucleotide polymorphism, of SNP, 92r7) zitten waarschijnlijk voor hebben verbreid in Europa tijdens naar de Paleolithic , en derhalve onwaarschijnlijk voor zijn gedragen in Europa met naar de migrerend boeren. Balaresque et al. (hierna ‘Balaresque’ ) gebruikt 840 Y chromosomen binnen haplogroup R-M269 voor tonen dat, hoewel zulks haplogroup wordt gekenmerkt door te sterke frequentie cline van hoog ter naar de west naar laag ter naar de oosten, naar de geassocieerd cline ter haplotype diversiteit (gemeten als gemiddelde korte tandem herhalen, of STR, variantie) zit ter naar de tegenovergestelde richting. Zij stelden dat deze correlatie kon worden verklaard door een recentere verspreiding van deze afstamming uit het Nabije Oosten die samenvalt met de neolithische overgang in Europa. De afstamming werd geschat op ongeveer 6000 jaar oud in verschillende populaties, wat in overeenstemming zou zijn met dit model. Dit resultaat, zoals opgemerkt in hun inleiding, ‘geeft aan dat de grote meerderheid van de Y-chromosomen van Europeanen hun oorsprong hebben in de Neolithische expansie’ (p. 2 in ).
Myres et al. beschreef verscheidene nieuwe SNP veranderingen stroomafwaarts van R-M269 die sterke geografische structurering in een veel grotere steekproef van 2043 R-m269 chromosomen tonen. Zij wijzen op een in wezen Europees-specifieke clade, gedefinieerd door de aanwezigheid van SNPs M412 (ook bekend als S167) en L11 (S127), dat is clinal van hoge frequenties (meer dan 70%) in West-Europa, afnemend naar het oosten. Deze studie toonde aan dat de distributies van verschillende downstream SNPs vertonen opvallende frequentiepatronen en lijken te verspreiden vanuit verschillende gebieden van zeer gelokaliseerde frequenties, waarvan sommige ook werden waargenomen door Cruciani et al. . Myres et al. geschatte coalescentie keer voor de R-S116 haplogroep in verschillende populaties in Europa en stelde voor, in een brede overeenstemming met Balaresque, dat de R-M269 haplogroep kan hebben verspreid met de Neolithische, en meer specifiek met de Linearbandkeramik, een Neolithische landbouw-industrie, die verspreid over noord-Europa, Hongarije, Frankrijk, ongeveer 7500 jaar geleden.
de huidige onzekerheid rondom Str mutatie tarieven blijkt dat ondanks deze recente studies, er kan nog zijn geen consensus over wanneer en waar de R-M269 haplogroup ontstaan en verspreid in Europa. Zelfs wanneer een beroep doen op de oorsprong van naar de Europees Y chromosoom gen pool ‘moet worden bekeken voorzichtig vooral wanneer zodanig te argument is gebaseerd op slechts een enkel onvolledig opgelost haplogroup’ (p. 100 in), het is van diepgaand belang voor proberen te begrijpen hoe naar de overgrote meerderheid van West-Europese mannen (groter dan 100 miljoen) dragen Y chromosomen welk behoren tot naar de R-M269 Y chromosoom haplogroup.
daarom hebben we deze problemen aangepakt met onze eigen grote r-M269-dataset, zowel op zichzelf als in combinatie met compatibele gegevens uit de meest recente uitgebreide enquête . We tonen aan dat de fundamentele relatie tussen gemiddelde Str variantie en lengtegraad, die de basis is van de recente claim van ondersteuning voor de neolithische hypothese , niet geldt voor onze Grotere en geografisch bredere steekproef. We leggen ook uit hoe deze eerdere analyse kan hebben geresulteerd in deze valse associatie. Tot slot onderzoeken we de ruimtelijke verdeling van genetische diversiteit geassocieerd met de R-M269 Europese-specifieke sub-lineage, gedefinieerd door SNP S127, met een in wezen homogene achtergrond van microsatelliet variatie op verschillende sub-lineage niveaus, gebaseerd op een gemeenschappelijke set van 10 STRs getypt over 2000 R-M269 chromosomen.
hoewel onderzoekers onzekerheid erkennen, rapporteren onderzoekers meestal de leeftijd van Y-chromosoomlijnen op basis van verschillen tussen individuen over meerdere STRs, vaak met behulp van gemiddelde kwadraatafstand (ASD) of gerelateerde samenvattende statistieken als onbevooroordeelde schatters van coalescentietijd, T. we onderzochten hoe ASD verandert in onze dataset op basis van verschillende sets van STRs. In tegenstelling tot wat algemeen wordt aangenomen, variëren schattingen van ASD, en daarom T, sterk wanneer verschillende subsets van STRs worden gebruikt met dezelfde steekproef. Hoewel recent bewijsmateriaal de steun voor de Neolithische verspreiding van R-M269 heeft vergroot, concluderen wij dat het op dit moment niet mogelijk is een geloofwaardige schatting te maken van de divergentietijd op basis van de reeksen Y-STRs die in recente studies zijn gebruikt. Bovendien tonen we aan dat het de eigenschappen van Y-STRs zijn, niet het aantal dat per se wordt gebruikt, die de nauwkeurigheid van divergentietijdschattingen lijken te controleren, eigenschappen die in de praktijk zelden of nooit in aanmerking worden genomen.
materiaal en methoden
(a) ethische verklaring
alle mannen die werden bemonsterd, gaven geïnformeerde toestemming na ethische goedkeuring door de ethische commissies van de verschillende universiteiten waar de monsters werden verzameld.
(b) DNA-monsters en genotypering
we hebben een dataset samengesteld van 2486 R-M269 Y-chromosomen uit Heel Europa, het Nabije Oosten en West-Azië, uit een totale populatie van 6503, die zowel nieuwe als eerder gepubliceerde Y-chromosomen omvatte. Voor de beoordeling naar de frequentie distributie van R-M269 en diverse sub-haplogroups in Europa en Azië, wij gecombineerd onze gegevens met die van Myres et al. , die een gecombineerde set van 4529 R-M269 chromosomen uit een totale steekproef van 16 298 van 172 verschillende populaties (elektronisch aanvullend materiaal, tabel S1 en figuur S1). De frequenties van de volgende SNP ‘ s, waarvan de fylogenie in figuur 1 is weergegeven, zijn vastgesteld: S127/L11 (rs9786076), S21/U106 (rs16981293), S116 (rs34276300), S145/M529 (rs11799226) en S28/U152 (rs1236440). Monsters werden versterkt in een standaard PCR-reactie en het SNaPshot Multiplex systeem (Life Technologies Corp., Carlsbad, CA, USA) primer extension protocol werd gebruikt om het allel aanwezig op elke SNP loci te karakteriseren. Alle primers staan vermeld in het elektronische aanvullende materiaal.
Voor de meerderheid van de individuen getypt in deze studie (2289), de volgende 10 STRs beschikbaar waren: DYS19; DYS389I; DYS389b (af te trekken van de allelen scoorde op DYS389I van de DYS389II locus); DYS390; DYS391; DYS392; DYS393; DYS437; DYS438; en DYS439, ofwel een eerder gepubliceerd of met getypt door zelf met behulp van de Yfiler kit (Life Technologies Corp.) of de Promega Powerplex assay (Promega Corp., Madison, WI, USA) . Voor de monsters van Weale et al. , slechts vijf STRs werden eerder gepubliceerd, en dus de resterende vijf werden getypt met een intern ontworpen en geverifieerd multiplex met behulp van primers uit de studie van Butler et al. voor DYS391, DYS437, DYS389I en II en DYS439, en primers uit de studie van Gusmao & Alves voor DYS438. DYS391 oproepen werden gebruikt om te controleren op consistentie met de oorspronkelijke haplotypes van Weale et al. Drie van de Weale et al. populaties werden niet verder getypt voor deze STRs (114 individuen). Individuen getypt met behulp van de Yfiler kit (1035) werden gebruikt om het effect van STR selectie op Ass berekeningen te onderzoeken (elektronisch aanvullend materiaal, tabel S2).
populaties met een totale omvang van 30 of meer werden gebruikt om de frequentiekaarten te maken (elektronisch aanvullend materiaal, figuur S1). Variantie was berekend alleen voor die populaties waar haplotypes waren beschikbaar voor ten minste 10 individuen binnen de relevante haplogroup.
(c) Analyse
kaarten van SNP-frequenties werden weergegeven met behulp van ArcMap GIS (V.9.2; ESRI). Interpolatie werd uitgevoerd met behulp van de inverse afstand wegings procedure. Breedtegraden en lengtegraden voor alle populaties waren gebaseerd op het met de monsters geassocieerde bemonsteringscentrum met de hoogste resolutie en worden weergegeven in elektronisch aanvullend materiaal, tabel S1.
het R statistisch pakket werd gebruikt om de mediane Str variantie (de variantie in het aantal herhalingen binnen een locus gemiddeld over alle loci) te berekenen tussen alle individuen binnen een populatie na 1000 bootstrap-replicaties met vervanging over individuen. Regressie analyse werd uitgevoerd in R voor vergelijk gemiddelde Str variantie met breedtegraad en lengtegraad voor de R-M269, R-M269(xS127) en R-s127 haplogroups.
we onderzochten hoe ass schattingen veranderen binnen onze steekproef bij gebruik van verschillende combinaties van STRs op basis van twee afzonderlijke criteria: mutatiesnelheid, μ; en waargenomen lineariteit, θ(r) (tabel 1). We gebruikten de waargenomen μ Die onlangs werd berekend om de 15 STRs op een schaal van snelheid te rangschikken, en afzonderlijk berekende ASD gebaseerd op de zeven snelste en zeven langzaamste snelheden (elektronisch aanvullend materiaal, tabel S4). Ons tweede criterium was gebaseerd op de Geschatte duur van lineariteit, D, van verschillende groepen STRs. Tijdsduur van lineariteit is een schatting van de divergentietijd waarna ASD niet langer lineair toeneemt met de tijd. Voor STRs muteren onder een strikt stapsgewijs model, Goldstein et al. toonde aan dat ASD in eerste instantie lineair toeneemt met de tijd, maar dat deze lineariteit wordt beperkt door het maximum aantal herhalingen die een STR kan nemen, R . D wordt benaderd met behulp van θ (R) (een eenvoudige transformatie van R) en μ, en de effectieve populatiegrootte (Ne) (eqns 3 en 4 in). Hogere waarden van θ(R)/2μ opbrengst verhoogde schattingen van D. Met behulp van STRs met hogere waarden van θ(R) / 2μ zou lineariteit verder in het verleden kunnen worden aangenomen, en ASD berekend op basis van deze STRs zou minder waarschijnlijk worden onderschat als gevolg van verzadiging. Tabel 1 en elektronisch aanvullend materiaal, tabel S4 tonen de verschillende groepen STRs gebruikt en bijbehorende waarden van μ, R, θ(R) / 2μ en ASD.
om te controleren of eventuele verschillen in tijd met de meest recente schatting van gemeenschappelijke voorouders (tmrca) niet specifiek zijn voor methoden gebaseerd op ASD, gebruikten we BATWING op de Hgdp Bedoeïenen populatie waarvoor een groter aantal Y-STRs (n = 65) beschikbaar waren . We vergeleken vier verschillende sets van STRs met verschillende mate van duur van lineariteit schattingen (elektronisch aanvullend materiaal).
resultaten
om de oorsprong van de R-M269 Lijn in Europa te onderzoeken, analyseerden we een grote dataset van 4529 R-M269 chromosomen (waarvan 2486 niet eerder met een dergelijke gedetailleerde resolutie zijn gepubliceerd) uit verschillende populaties in Europa, het Nabije Oosten en West-Azië (elektronisch aanvullend materiaal, figuur S1 en tabel S1). Binnen Europa hebben we een noordwest–zuidoost frequentie cline waargenomen voor R-M269, vergelijkbaar met de eerder waargenomen frequentie , van hoge frequenties in West-Europa tot lagere frequenties in het oosten. Binnen haplogroep R-M269 wij genotyped te Nieuw gekarakteriseerd SNP, S127 (equivalent voor L11), voor welk naar de distributie ter Europa en naar het Midden Oosten, samen met die van R-M269 en R-M269(xS127), zitten vertoond in Figuur 2. De verdelingen van R-M269 en R-S127 overlappen elkaar in grote lijnen, maar de frequentie van R-S127 daalt af rond de Balkan en bereikt extreem lage waarden verder naar het oosten en buiten Europa. Omgekeerd toont R-M269 (xS127) hogere frequenties in oostelijke populaties. Frequentie kaarten tonen drie geografisch gelokaliseerde R-S127 sub-haplogroups (R-S21, R-S145 en R-S28) zijn getoond in figuur 3.
wij vervolgens berekend Str diversiteit voor iedere bevolking voor naar de whole R-M269 lineage, en voor naar de R-S127 en R-M269(xS127) sub-haplogroups, en onderzocht naar de relatie tussen gemiddelde Str variance en lengtegraad en breedtegraad ter precies naar de zelfde mode als Balaresque. We geven schattingen van onzekerheid voor deze waarden door bootstrapping over individuen, en rapporteren de mediaan van de waargenomen variantiewaarden en de 95 procent BI (figuur 2). Wij genormaliseerde breedtegraad en lengtegraad, en verrichtte te lineaire regressie tussen deze waarden en naar de mediaan microsatellite variantie voor naar de drie R-M269 sub-haplogroups. Wij vonden geen correlatie met latitude (gegevens niet getoond) en, in tegenstelling tot Balaresque, wij vonden geen significante correlatie tussen Lengtegraad en variantie voor elke haplogroup.
de balaresque dataset presenteert genotype gegevens alleen met de resolutie van SNP R-M269. Onze resultaten tonen dat naar de overgrote meerderheid van R-M269 samples ter Anatolia, ongeveer 90 procent, behoren tot naar de R-M269(xS127) sub-haplogroup. Het verwijderen van deze Turkse populaties uit de balareske gegevens en het herhalen van de regressie verwijdert de significante correlatie (R2 = 0,23, p = 0,09; details in het elektronische aanvullende materiaal en figuur S2). Deze populaties zijn daarom intrinsiek aan de significante correlatie.
we merkten op dat de Ierse haplotypes die in de Balaresque analyse werden gebruikt, een zeer lage STR variantie hadden (0,208) vergeleken met die in onze Analyse (0,35; oorspronkelijk gepubliceerd door Moore et al. ). Balaresque gebruikte een voorbeeld van Ierse haplotypes die zijn gedownload van de online YSearch-database (http://www.ysearch.org). Om te testen of de YSearch haplotypes representatief waren voor de Ierse R-M269 van Moore et al. , we onafhankelijk resamped The Moore et al. dataset 10 000 keer, het selecteren van sub-monsters van 75 haplotypes waaruit we de variantie geschat met behulp van dezelfde negen STRs gebruikt in het Balaresque papier (gedetailleerde methodologie en rechtvaardiging kan worden gevonden in het elektronische aanvullende materiaal). De mediane variantie van deze 10 000 herhalingen was 0,354 met een 95 procent bi van (0,285-0,432). Toen we de regressieanalyse herhaalden met deze verschillende variantieschatting, was de correlatie niet langer significant (R2 = 0,09, p = 0,19).
ASD op basis van microsatelliet blijkt lineair met de tijd toe te nemen en is gebruikt als een onbevooroordeelde schatting van de gemiddelde coalescentietijd, aangezien het ongeveer 2µT bedraagt . Men zou verwachten dat het gebruik van verschillende sets STRs de schatting van T niet dramatisch zou veranderen: als μ verandert, zou ASD op dezelfde manier moeten veranderen, waarbij T constant blijft. Tabel 1 toont schattingen van de duur van lineariteit op basis van recent geschatte waargenomen mutatiesnelheden en het geschatte bereik van de YHRD . Naar de ASD voor R-S127 was berekend ter vergelijking naar de 15 STR haplotypes van zijn twee belangrijke sub-haplogroups, R-S21 (141 chromosomen) en R-S116 (717; elektronisch aanvullend materiaal, tabel S3). Figuur 4a is een plot van T (geschat als ASD / 2μ) voor verschillende sets STRs met verschillende kenmerken (elektronisch aanvullend materiaal, tabel S4).
om de correlatie tussen T-en STR-selectie verder te onderzoeken, berekenden we T op dezelfde manier als hierboven beschreven op basis van chromosomen die behoren tot de twee diepste takken van de Y-chromosoomfylogenie, AxA1 en B (figuur 4b; elektronisch aanvullend materiaal, tabel S4). Ter vergelijking, ASD berekend uit dezelfde Str deelverzamelingen wordt weergegeven voor de R-S127 op dezelfde plot.
discussie
hier, we hebben bevestigd met de breedste analyse tot op heden dat de ruimtelijke distributie van Y chromosoom haplogroup M269 kan worden gesplitst door R-S127 in Europese en westelijke Euraziatische geslachten. In tegenstelling tot de resultaten van Balaresque zien we geen relatie tussen diversiteit en lengtegraad (figuur 2) voor R-M269. De aanwezigheid van twee groepen populaties in het Balaresque papier lijkt Causaal te zijn voor de waargenomen relatie: de onderschatte diversiteit van de Ierse bevolking en de opname van de Turkse chromosomen, waarvan de meerderheid potentieel tot de niet-Europese clade R-M269(xS127) behoort. Wanneer deze elementen naar behoren in aanmerking worden genomen, gezamenlijk of onafhankelijk, bestaat de correlatie niet meer. Deze correlatie is het centrale uitgangspunt van de hypothese dat R-M269 werd verspreid met groeiende Neolithische boeren.
Morelli et al. (hierna ‘Morelli’) vond Str-motieven die R-M269 splitsten in oostelijke en westelijke geslachten. We merkten op dat 71 procent van de Myres et al. R-M269(xS127) chromosomen waarvoor STR informatie beschikbaar is hebben het oostelijke motief (DYS393-12/DYS461-10), terwijl 80 procent van de R-S127 chromosomen van Myres et al. hebben het westerse motief (DYS393-13 / DYS461-11). Geen R-s127 chromosomen toonden het oostelijke motief, terwijl 5 percent van R-m269(xs127) chromosomen het westelijke motief toonden (die allen of L23 (S141) of M412 (s127)-afgeleid waren). In beide gevallen verschilden deze motieven echter van die welke door Morelli werden gesuggereerd door één herhaling minder te hebben op de DYS461 locus. De door Morelli waargenomen dichotomie op basis van een twee STR-motief wordt daarom, althans gedeeltelijk, bevestigd door de aanwezigheid van deze SNP.
datering van Y-chromosoomlijnen is notoir controversieel , waarbij het belangrijkste probleem is dat de keuze van het Str-mutatiepercentage kan leiden tot leeftijdsschattingen die een factor drie verschillen (d.w.z. de evolutionaire versus waargenomen (genealogische) mutatiepercentages ). Interessant, ondanks het feit dat Myres et al. en Balaresque gebruikte verschillende Str-mutatiesnelheden en datingbenaderingen, hun tmrca-schattingen overlappen: 8590-11 950 jaar met een mutatiesnelheid van 6.9 × 10-4 per generatie en 4577-9063 jaar met een gemiddelde mutatiesnelheid van respectievelijk 2,3 × 10-3. Apart, Morelli berekende de tmrca alleen gebaseerd op Sardijnse en Anatolische chromosomen, en schatte de R-M269 lijn te zijn ontstaan 25 000-80 700 jaar geleden), gebaseerd op dezelfde evolutionaire mutatie snelheid als Myres et al.
bij het zoeken naar een geschikte set van STRs waarmee te schatten de gemiddelde coalescentie tijd, T, van sub-haplogroup R-S127, hebben wij aangetoond dat niet alle STRs zijn van gelijk gebruik in deze context. We concentreerde ons op het schatten van de duur van lineariteit, D, met behulp van verschillende sets van STRs. Onze analyses suggereren dat de D van een STR de sleutel is tot zijn vermogen om diepe voorouders te ontdekken. Duur van lineariteit verwijst naar de tijdsduur in het verleden gedurende welke ASD en T lineair gerelateerd blijven voor een specifieke STR. Goldstein et al. aangetoond dat D wordt beïnvloed door twee eigenschappen van de STRs die worden gebruikt om ASD te berekenen: de mutatiesnelheid en het bereik van mogelijke allelen die de STR kan nemen. Toen we onze keuze van STR marker manipuleerden gebaseerd op θ(R)/2μ (een surrogaat voor D; tabel 1), vonden we dat verschillende sets van STRs gaf verschillende waarden voor T. Het is duidelijk, dan, dat coalescentieschattingen expliciet afhankelijk van de STRs die men gebruikt.
onze analyse bevestigt dat dit fenomeen is niet specifiek voor de R-M269 haplogroep noch voor methoden met behulp van ASD. Figuur 4b laat zien dat STRs met hoge D Grotere schattingen van T. produceren wat duidelijk is is dat schattingen van T impliciet afhangen van de STRs die zijn geselecteerd om deze conclusie te maken. Met behulp van BATWING op een HGDP-populatie waarvoor 65 y-STRs beschikbaar zijn, hebben we aangetoond dat de mediane schatting van TMRCA meer dan vijf keer kan verschillen wanneer STRs worden geselecteerd op basis van de verwachte duur van lineariteit (elektronisch aanvullend materiaal, figuur S4). Terwijl de onderzoekers rekening houden met de mutatiepercentages van STR bij het schatten van divergentietijd met ASD, hebben de algemeen gebruikte STRs niet de specifieke eigenschappen die lineariteit toestaan om verder in het verleden te worden verondersteld. De meerderheid van haplogroup data gebaseerd op zodanig sets van STRs mei daarom zijn systematisch onderschat.
conclusie
de distributies van de belangrijkste R-S127 sub-haplogroups, R-S21, R-S145 en R-S28, tonen duidelijk gelokaliseerde concentraties (figuur 3). Als de R-M269 afstamming recenter van oorsprong is dan de neolithische expansie, dan moet de huidige verdeling het gevolg zijn van belangrijke bevolkingsbewegingen die zich sinds die oorsprong voordoen. Voor zulks haplogroup voor zitten zo alomtegenwoordig, naar de bevolking dragende R-S127 zou hebben ontheemd most van naar de bevolking aanwezig ter West Europa na naar de Neolithic landbouw overgang. Als alternatief, als R-S127 ontstond vóór de neolithische golf van expansie, dan ofwel was het al aanwezig in het grootste deel van Europa vóór de expansie, of de mutatie vond plaats in het oosten, en werd verspreid voor of na de expansie, in welk geval we hogere diversiteit in het oosten dichter bij de oorsprong van de landbouw verwachten, dat is niet wat we waarnemen. De kaarten van R-S127 sub-haplogroup frequenties voor R-S21, R-S145 en R-S28 tonen radiale distributies van specifieke Europese locaties (figuur 3). Deze centra hebben hoge absolute frequenties: R-S21 heeft een frequentie van 44 procent in Friesland, en R-S28 bereikt 25 procent in de Alpen; en in de populaties waar ze op de hoogste frequentie, de overgrote meerderheid van de R-S127 behoren tot die specifieke sub-lineage. Bijvoorbeeld, de helft van alle R-M269 in Zuid-Europa is R-S28-afgeleid, en ongeveer 60 procent van de R-M269 in Midden-Europa is R-S21-afgeleid. Op naar de sub-haplogroup niveau, vervolgens, R-M269 zit split ter geografisch gelokaliseerd pockets met individuele R-M269 sub-haplogroups dominerend, voorstellend dat naar de frequentie van R-M269 over Europa kon zitten verwantschap voor naar de groei van multiple, geografisch specifieke sub-lineages welk verschillen ter verschillend delen van Europa.Een recente analyse van koolstofdatums van neolithische plaatsen in heel Europa onthult dat de verspreiding van het Neolithicum geenszins constant was, en dat verscheidene ‘centra van hernieuwde expansie’ zichtbaar zijn in heel Europa, die gebieden van kolonisatie vertegenwoordigen, waarvan drie intrigerend dicht naar de centra van de sub-haplogroups foci (elektronisch aanvullend materiaal, figuur S3) in kaart brengen. Toekomstig werk implicerend ruimtelijk expliciete simulaties, samen met nauwkeurige maten van Y chromosoom diversiteit, zijn nodig voor onderzoeken hoe naar de huidige distributie van sub-haplogroups mei zijn geweest geproduceerd. In deze context verwierp recent werk van Sjödin & François een Paleolithische dispersie voor R1b-M269 met behulp van ruimtelijke simulaties gebaseerd op de dataset van Balaresque. Niettemin merken we op dat aanvullend werk nog steeds nodig is omdat deze auteurs zich niet bewust waren van de beperking van de Balaresque dataset die hier wordt gepresenteerd, en niet volledig de impact van de verschillende moleculaire kenmerken van de onderzochte loci op hun analyse hebben onderzocht.
leeftijd schattingen gebaseerd op sets van Y-STRs zorgvuldig geselecteerd voor bezitten de attributen noodzakelijk voor het blootleggen van diepe voorouders (bijvoorbeeld, van de bijna 200 onlangs gekarakteriseerd hier ), en van gehele Y chromosoom sequentie vergelijkingen, zal bieden robuuste data voor dit haplogroup in de toekomst. Voor nu, kunnen wij geen datum met betrekking tot de leeftijd van R-M269 of R-S127 aanbieden, maar geloven dat onze analyses van STR suggereren de recente leeftijdschattingen van R-M269 en R-S116 waarschijnlijk jonger zijn dan de ware waarden, en de homogeniteit van STR variantie en distributie van subtypes over het continent zijn inconsistent met de hypothese van de Neolithische verspreiding van de R-M269 y chromosoomlijn.