El poblamiento de Europa y el cuento con moraleja del linaje del cromosoma Y R-M269

Introducción

Desde los primeros intentos de utilizar la variación biológica en humanos para ayudar a comprender las primeras migraciones humanas, el poblamiento de Europa ha sido un foco de investigación importante . Tras el desarrollo de la agricultura en la Media Luna Fértil hace unos 10 000 años, esta tecnología se extendió desde el Cercano Oriente hacia el oeste hacia Europa, causando una importante transición cultural de la caza itinerante a la agricultura sedentaria , lo que llevó a un crecimiento dramático de la población, durante lo que se ha conocido como la transición neolítica . Dentro de este marco arqueológico, se debate sobre las contribuciones relativas a las poblaciones europeas modernas de los primeros pueblos de Europa y de aquellos que migraron a ella con la transición neolítica, tanto en términos de su legado genético como en cuanto a los procesos de migración y sucesión . El verdadero escenario es, sin duda, multifacético y complejo. Tanto los primeros trabajos sobre «marcadores clásicos» utilizando análisis de componentes principales como los estudios más recientes utilizando el cromosoma Y han demostrado que en Europa, la variación genética se distribuye a lo largo de un gradiente sureste–noroeste. Se ha sugerido que tales observaciones apoyan un modelo de difusión demica para la transición neolítica en Europa (es decir, que la expansión de la agricultura también implicó un movimiento asociado de personas del Cercano Oriente) .

Un nuevo trabajo ha abordado la transición neolítica en Europa centrándose en el principal haplogrupo del cromosoma Y de Europa occidental R1b1b2-M269 (en lo sucesivo, R-M269). Este linaje había recibido poca atención reciente en este contexto, aunque trabajos anteriores sugirieron que el clado más amplio R-M173 (excluyendo el sub-linaje R1a-M17) y el Haplogrupo 1 (derivado del polimorfismo de un solo nucleótido, o SNP, 92r7) probablemente se hayan extendido a Europa durante el Paleolítico , y por lo tanto es poco probable que se hayan llevado a Europa con los agricultores migrantes. Balaresque et al. (en lo sucesivo, «Balaresque») utilizó cromosomas de 840 Y dentro del haplogrupo R-M269 para demostrar que, aunque este haplogrupo se caracteriza por una fuerte frecuencia de cline de alta en el oeste a baja en el este, la cline asociada en la diversidad de haplotipos (medida como repetición corta en tándem media, o varianza STR) está en la dirección opuesta. Plantearon que esta correlación podría explicarse por una dispersión más reciente de este linaje desde el Cercano Oriente coincidiendo con la transición neolítica en Europa. Se estimó que el linaje tenía aproximadamente 6000 años en varias poblaciones, lo que se argumentó que era consistente con este modelo. Este resultado, como se señala en su introducción, «indica que la gran mayoría de los cromosomas Y de los europeos tienen su origen en la expansión neolítica» (p. 2 en).

Myres et al. se describieron varias mutaciones SNP nuevas aguas abajo de R-M269 que muestran una fuerte estructuración geográfica en una muestra mucho más grande de 2043 cromosomas R-M269. Destacan un clado esencialmente específico de Europa, definido por la presencia de SNPs M412 (también conocido como S167) y L11 (S127), que es clinal de altas frecuencias (más del 70%) en Europa occidental, disminuyendo hacia el este. Este estudio mostró que las distribuciones de varios SNP aguas abajo exhiben patrones de frecuencia llamativos y parecen extenderse desde diferentes áreas de frecuencias altamente localizadas, algunas de las cuales también fueron observadas por Cruciani et al. . Myres et al. tiempos de coalescencia estimados para el haplogrupo R-S116 en diferentes poblaciones de Europa y sugirió, en amplio acuerdo con Balaresque, que el haplogrupo R-M269 puede haberse extendido con el Neolítico, y más específicamente con el Linearbandkeramik, una industria agrícola neolítica que se extendió por todo el norte de Europa, desde Hungría hasta Francia, hace unos 7500 años.

La incertidumbre actual en torno a las tasas de mutación de STR muestra que, a pesar de estos estudios recientes, todavía no puede haber consenso sobre cuándo y dónde se originó y propagó el haplogrupo R-M269 en Europa. Incluso si invocar los orígenes del acervo genético europeo del cromosoma Y «debe considerarse con cautela, especialmente cuando tal argumento se basa en un solo haplogrupo incompleto» (p. 100 en), es de profundo interés tratar de entender cómo la gran mayoría de los hombres de Europa occidental (más de 100 millones) portan cromosomas Y que pertenecen al haplogrupo del cromosoma Y R-M269.

En consecuencia, hemos abordado estos problemas con nuestro propio conjunto de datos R-M269 de gran tamaño, tanto por sí solo como en combinación con datos compatibles de la encuesta exhaustiva más reciente . Mostramos que la relación fundamental entre la varianza media de STR y la longitud, que es la base de la reciente afirmación de apoyo a la hipótesis neolítica , no se sostiene para nuestra muestra más grande y geográficamente más amplia. También explicamos cómo este análisis previo puede haber resultado en esta asociación espuria. Finalmente, exploramos la distribución espacial de la diversidad genética asociada con el sub-linaje específico europeo R-M269, definido por SNP S127, mostrando un fondo esencialmente homogéneo de variación de microsatélites en varios niveles de sub-linaje diferentes, basado en un conjunto común de 10 STRs tipificados en 2000 cromosomas R-M269.

Aunque reconocen la incertidumbre, los investigadores generalmente informan la edad de los linajes del cromosoma Y en función de las diferencias entre los individuos a través de múltiples STR, a menudo utilizando la distancia cuadrada media (ASD) o estadísticas de resumen relacionadas como estimadores imparciales del tiempo de coalescencia, T. Investigamos cómo cambian los ASD en nuestro conjunto de datos en función de diferentes conjuntos de STR. Contrariamente a la creencia común, las estimaciones de ASD, y por lo tanto de T, varían ampliamente cuando se utilizan diferentes subconjuntos de ITS con la misma muestra. Si bien la evidencia reciente ha aumentado el apoyo a la propagación neolítica del R-M269, concluimos que en la actualidad no es posible hacer una estimación creíble del tiempo de divergencia basada en los conjuntos de Y-STR utilizados en estudios recientes. Además, mostramos que son las propiedades de los Y-STR, no el número utilizado per se, lo que parece controlar la precisión de las estimaciones de tiempo de divergencia, atributos que rara vez, si es que alguna vez, se consideran en la práctica.

Material y métodos

(a) Declaración de ética

Todos los varones de la muestra dieron su consentimiento informado tras la aprobación ética de los comités de ética de las distintas universidades donde se recogieron las muestras.

(b) Muestras de ADN y genotipado

Reunimos un conjunto de datos de 2486 cromosomas R-M269 Y de toda Europa, el Cercano Oriente y Asia occidental, de una población total de 6503, que incluía cromosomas Y nuevos y publicados previamente. Para evaluar la distribución de frecuencias de R-M269 y varios sub-haplogrupos en Europa y Asia, combinamos nuestros datos con los de Myres et al. , que dio un conjunto combinado de 4529 cromosomas R-M269 de una muestra total de 16 298 de 172 poblaciones diferentes (material suplementario electrónico, tabla S1 y figura S1). Se determinaron las frecuencias de los siguientes SNP, cuya filogenia se muestra en la figura 1: S127 / L11 (rs9786076), S21/U106 (rs16981293), S116 (rs34276300), S145/M529 (rs11799226) y S28/U152 (rs1236440). Las muestras se amplificaron en una reacción de PCR estándar y se utilizó el protocolo de extensión de imprimación del Sistema Multiplex de instantáneas (Life Technologies Corp., Carlsbad, CA, EE. UU.) para caracterizar el alelo presente en cada loci de SNP. Todos los cebadores se enumeran en el material complementario electrónico.

Gráfico 1 Árbol del cromosoma Y que muestra las relaciones de los SNPs aguas abajo del R-M269 probado en este estudio. La nomenclatura alternativa para algunos SNPs se proporciona en cursiva.

Para la mayoría de los individuos mecanografiados en este estudio (2289), estaban disponibles los siguientes 10 STRs: DYS19; DYS389I; DYS389b (restando los alelos anotados en DYS389I del locus DYS389II); DYS390; DYS391; DYS392; DYS393; DYS437; DYS438; y DYS439, ya sea publicados previamente o escritos por nosotros mismos utilizando el kit Yfiler (Life Technologies Corp.) o el ensayo Promega Powerplex (Promega Corp., Madison, WI, EE. UU.). Para las muestras de Weale et al. , solo cinco STR fueron publicados previamente, por lo que los cinco restantes fueron mecanografiados con un multiplex diseñado y verificado internamente utilizando primers del estudio de Butler et al. para DYS391, DYS437, DYS389I y II y DYS439, y cebadores del estudio de Gusmao & Alves para DYS438. Se utilizaron llamadas DYS391 para verificar la consistencia con los haplotipos originales de Weale et al. Tres de los Weale et al. las poblaciones no se tipificaron más para estos informes sobre transacciones sospechosas (114 individuos). Se utilizaron individuos mecanografiados con el kit Yfiler (1035) para investigar el efecto de la selección de STR en los cálculos de ASD (material electrónico suplementario, tabla S2).Para construir los mapas de frecuencias se utilizaron

Poblaciones con un tamaño total de 30 o más (material electrónico suplementario, figura S1). La varianza se calculó solo para aquellas poblaciones en las que se disponía de haplotipos para al menos 10 individuos dentro del haplogrupo relevante.

(c) Análisis

Se visualizaron mapas de frecuencias SNP utilizando ArcMap GIS (v. 9.2; ESRI). La interpolación se realizó mediante el procedimiento de ponderación de distancia inversa. Las latitudes y longitudes de todas las poblaciones se basaron en el centro de muestreo de mayor resolución asociado a las muestras y se muestran en el material electrónico suplementario, tabla S1.

Se utilizó el paquete estadístico R para calcular la varianza mediana de STR (la varianza en el número de repeticiones dentro de un locus promediado en todos los loci) entre todos los individuos dentro de una población después de 1000 réplicas de arranque con reemplazo sobre los individuos. El análisis de regresión se realizó en R para comparar la varianza media de STR con la latitud y longitud de los haplogrupos R-M269, R-M269(xS127) y R-S127.

Investigamos cómo cambian las estimaciones de los TEA dentro de nuestra muestra al usar diferentes combinaciones de STR según dos criterios separados: tasa de mutación, μ; y linealidad observada, θ(R) (tabla 1). Se utilizó el μ observado calculado recientemente para clasificar los 15 STR en una escala de velocidad, y se calculó separadamente el ASD en función de las siete velocidades más rápidas y las siete más lentas (material electrónico suplementario, tabla S4). Nuestro segundo criterio se basó en la duración estimada de linealidad, D, de diferentes grupos de STR. La duración de la linealidad es una estimación del tiempo de divergencia después del cual el TEA deja de aumentar linealmente con el tiempo. Para los STR mutantes bajo un estricto modelo escalonado, Goldstein et al. mostró que el TEA inicialmente aumenta linealmente con el tiempo, pero que esta linealidad está limitada por el número máximo de repeticiones que un STR puede tomar, R . D se aproxima usando θ(R) (que es una transformación simple de R) y μ, y el tamaño efectivo de la población (Ne) (eqns 3 y 4 in ). Mayores valores de θ(R)/2μ producen mayores estimaciones de D. El uso de STRs con mayores valores de θ (R)/2μ debería permitir asumir la linealidad en el pasado, y la ASD calculada a partir de estos STRs debería ser menos probable que se infravalore como resultado de la saturación. En la tabla 1 y en el material electrónico suplementario, la tabla S4 muestra los diferentes grupos de STR utilizados y los valores asociados de μ, R, θ(R)/2μ y ASD.

Para verificar que cualquier diferencia en el tiempo con la estimación del ancestro común más reciente (TMRCA) no es específica de los métodos basados en ASD, utilizamos ALAS de MURCIÉLAGO en la población beduina de PDGH para la que se disponía de un mayor número de Y-STR (n = 65). Se compararon cuatro conjuntos diferentes de informes sobre transacciones sospechosas con diferentes grados de duración de las estimaciones de linealidad (material electrónico suplementario).

Resultados

Para investigar los orígenes del linaje R-M269 en Europa, analizamos un gran conjunto de datos de 4529 cromosomas R-M269 (2486 de los cuales no se han publicado previamente con una resolución tan detallada) de varias poblaciones de Europa, el Cercano Oriente y Asia occidental (material electrónico suplementario, figura S1 y tabla S1). Dentro de Europa, observamos una línea de frecuencia noroeste–sureste para R-M269, similar a las observadas anteriormente , desde frecuencias altas en Europa occidental hasta frecuencias más bajas en el este. Dentro del haplogrupo R-M269 genotipamos un SNP de nueva caracterización, S127 (equivalente a L11), cuya distribución en Europa y Oriente Próximo, junto con la de R-M269 y R-M269(xS127), se muestra en la figura 2. Las distribuciones de R-M269 y R-S127 se superponen ampliamente, pero la frecuencia de R-S127 disminuye alrededor de los Balcanes, alcanzando valores extremadamente bajos más al este y fuera de Europa. Por el contrario, R-M269 (xS127) muestra frecuencias más altas en las poblaciones orientales. Mapas de frecuencia que muestran tres sub-haplogrupos R-S127 localizados geográficamente (R-S21, R-S145 y R-S28) se muestran en la figura 3.

Gráfico 2 Frequency distributions and variation of Y chromosome haplogrupes R-M269, R-S127 and R-M269(xS127) in Europe. Los tres paneles muestran mapas de contorno basados en las frecuencias de los diferentes haplogrupos encontrados en Europa y Asia occidental: (a) R-M269, (b) R-S127 y (c) R-M269(xS127). Los mapas de la izquierda se basan en las frecuencias de los SNP en todas las poblaciones marcadas en el mapa (datos en material electrónico suplementario, tabla S1 y figura S1). Los gráficos de la derecha muestran la relación entre la longitud y la varianza de arranque basada en 10 STRs para todas las poblaciones con al menos 10 individuos portadores de ese SNP. Los valores R2 y p asociados se muestran para las correlaciones en los gráficos. Los códigos de población se detallan en el cuadro 1 y en el material electrónico complementario, cuadro S1.

Gráfico 3 Frequency distributions of R-M269 sub-haplogroups. Mapas de contorno para linajes definidos por el marcador (a) R-S21, (b) R-S145 y (c) R-S28.

A continuación, calculamos la diversidad de STR para cada población para todo el linaje R-M269, y para los sub-haplogrupos R-S127 y R-M269(xS127), e investigamos la relación entre la varianza media de STR y la longitud y latitud de la misma manera que Balaresque. Proporcionamos estimaciones de incertidumbre para estos valores por arranque sobre individuos, e informamos la mediana de los valores de varianza observados y su IC del 95 por ciento (figura 2). Normalizamos la latitud y la longitud, y realizamos una regresión lineal entre estos valores y la varianza mediana del microsatélite para los tres sub-haplogrupos R-M269. No encontramos correlación con la latitud (datos no mostrados) y, contrariamente a Balaresque, no encontramos ninguna correlación significativa entre longitud y varianza para ningún haplogrupo.

El conjunto de datos Balaresco presenta datos de genotipo solo con la resolución de SNP R-M269. Nuestros resultados muestran que la gran mayoría de las muestras de R-M269 en Anatolia, aproximadamente el 90 por ciento, pertenecen al sub-haplogrupo R-M269(xS127). La eliminación de estas poblaciones turcas de los datos balareses y la repetición de la regresión eliminan la correlación significativa (R2 = 0.23, p = 0.09; detalles en el material electrónico suplementario y la figura S2). Por lo tanto, estas poblaciones son intrínsecas a la correlación significativa.

Observamos que los haplotipos irlandeses utilizados en el análisis Balaresco tenían una varianza de STR muy baja (0,208) en comparación con los incluidos en nuestro análisis (0,35; publicado originalmente por Moore et al. ). Balaresque utilizó una muestra de haplotipos irlandeses descargados de la base de datos en línea de Ysearch (http://www.ysearch.org). Para probar si los haplotipos de Ysearch eran representativos del R-M269 irlandés de Moore et al. , hemos remuestreado independientemente el Moore et al. conjunto de datos 10 000 veces, seleccionando submuestras de 75 haplotipos a partir de los cuales se estimó la varianza utilizando los mismos nueve STRs utilizados en el artículo Balaresco (la metodología detallada y la justificación se pueden encontrar en el material electrónico suplementario). La variación mediana de estas 10.000 repeticiones fue de 0,354 con un IC del 95% de (0,285-0,432). Cuando repetimos el análisis de regresión con esta estimación de varianza diferente, la correlación ya no fue significativa (R2 = 0,09, p = 0,19).

Se ha demostrado que el TEA basado en microsatélites aumenta linealmente con el tiempo y se ha utilizado como un estimador imparcial del tiempo de coalescencia medio, dado que se aproxima a 2µT . Se esperaría que el uso de diferentes conjuntos de STRs no alterara drásticamente la estimación de T: a medida que μ cambia, ASD debería cambiar de manera similar, con T permaneciendo constante. La Tabla 1 muestra estimaciones de la duración de la linealidad basadas en las tasas de mutación observadas estimadas recientemente y el rango estimado a partir de la ERJ . El TEA para R-S127 se calculó comparando los 15 haplotipos STR de sus dos sub-haplogrupos principales, R-S21 (141 cromosomas) y R-S116 (717; material electrónico suplementario, tabla S3). La Figura 4a es una gráfica de T (estimada como ASD / 2μ) para varios conjuntos diferentes de STR con diferentes características (material electrónico suplementario, tabla S4).

Gráfico 4 Relación entre el tiempo y el ancestro común más reciente, T, y la tasa de mutación, μ, para varios subconjuntos STR. a) Estimaciones de T para el haplogrupo R-S127. Los puntos se etiquetan con el subconjunto de STR utilizados para calcular T y se detallan en material electrónico suplementario, tabla S4. (b) Los mismos datos, pero esta vez junto con estimaciones de T basadas en comparaciones de haplogrupos de cromosomas Y A y B (véase el texto principal).

Para explorar más a fondo la correlación entre la selección de T y STR, calculamos T de la misma manera descrita anteriormente en base a los cromosomas pertenecientes a las dos ramas más profundas de la filogenia del cromosoma Y, AxA1 y B (figura 4b; material electrónico suplementario, tabla S4). Como comparación, se muestra la ASD calculada a partir de los mismos subconjuntos STR para el R-S127 en la misma gráfica.

Discusión

Aquí, hemos confirmado con el análisis más amplio hasta la fecha que la distribución espacial del haplogrupo del cromosoma Y M269 se puede dividir por R-S127 en linajes europeos y euroasiáticos occidentales. Contrariamente a los resultados de Balaresque, no vemos relación entre diversidad y longitud (figura 2) para R-M269. La presencia de dos conjuntos de poblaciones en el Balaresque papel parece ser causal de la relación observada: la diversidad subestimada de la población irlandesa y la inclusión de los cromosomas turcos, la mayoría de los cuales pertenecen potencialmente al clado no europeo R-M269(xS127). Cuando estos elementos se tienen debidamente en cuenta, de forma conjunta o independiente, la correlación ya no existe. Esta correlación es el principio central de la hipótesis de que R-M269 se propagó con agricultores neolíticos en expansión.

Morelli et al. (en adelante, «Morelli») encontró motivos STR que dividían el R-M269 en linajes orientales y occidentales. Observamos que el 71% de los Myres et al. Los cromosomas R-M269(xS127) para los que se dispone de información STR tienen el motivo oriental (DYS393-12/DYS461-10), mientras que el 80 por ciento de los cromosomas R-S127 de Myres et al. tienen el motivo occidental (DYS393-13 / DYS461-11). Ningún cromosoma R-S127 mostraba el motivo oriental, mientras que el 5% de los cromosomas R-M269(xS127) mostraba el motivo occidental (todos los cuales eran derivados de L23 (S141) o M412 (S127)). En ambos casos, sin embargo, estos motivos diferían de los sugeridos por Morelli al tener una repetición menos en el locus DYS461. La dicotomía observada por Morelli basada en un motivo de dos STR es corroborada, por lo tanto, al menos en parte, por la presencia de este SNP.

La datación de linajes del cromosoma Y es notoriamente controvertida, el problema principal es que la elección de la tasa de mutación STR puede llevar a estimaciones de edad que difieren en un factor de tres (es decir, las tasas de mutación evolutiva versus las observadas (genealógicas)). Curiosamente, a pesar de que Myres et al. y Balaresque utilizó diferentes tasas de mutación STR y enfoques de datación, sus estimaciones de TMRCA se superponen: 8590-11 950 años utilizando una tasa de mutación de 6.9 × 10-4 por generación y 4577-9063 años utilizando una tasa de mutación promedio de 2,3 × 10-3, respectivamente. Por separado, Morelli calculó la TMRCA basándose solo en los cromosomas sardos y anatolios, y estimó que el linaje R-M269 se originó hace 25 000-80 700 años), basándose en la misma tasa de mutación evolutiva que Myres et al.

Al buscar un conjunto adecuado de STR con el que estimar el tiempo de coalescencia promedio, T, del sub-haplogrupo R-S127, hemos demostrado que no todos los STR son de igual uso en este contexto. Nos concentramos en estimar la duración de la linealidad, D, utilizando diferentes conjuntos de STRs. Nuestros análisis sugieren que la D de un STR es clave para su capacidad de descubrir ancestros profundos. La duración de la linealidad se refiere a la longitud de tiempo en el pasado durante el cual los TEA y T continúan estando relacionados linealmente para un STR específico. Goldstein et al. demostró que D se ve afectada por dos propiedades de los STRs utilizados para calcular el ASD: la tasa de mutación y el rango de posibles alelos que puede tomar el STR. Cuando manipulamos nuestra elección de marcador STR basado en θ(R)/2μ (un sustituto de D; tabla 1), encontramos que diferentes conjuntos de STRs dieron valores diferentes para T. Está claro, entonces, que las estimaciones de coalescencia dependen explícitamente de los STRs que se usan.

Nuestro análisis confirma que este fenómeno no es específico del haplogrupo R-M269 ni de los métodos que utilizan TEA. La Figura 4b muestra que los informes sobre transacciones sospechosas con D alta producen estimaciones más grandes de T. Lo que está claro es que las estimaciones de T dependen implícitamente de los informes sobre transacciones sospechosas que se seleccionan para hacer esta inferencia. Utilizando ALAS de MURCIÉLAGO en una población de PDGH para la que se dispone de 65 STR Y, hemos demostrado que la estimación mediana de TMRCA puede diferir en más de cinco veces cuando se seleccionan los STR sobre la base de la duración esperada de la linealidad (material electrónico suplementario, figura S4). Si bien los investigadores tienen en cuenta las tasas de mutación de STR al estimar el tiempo de divergencia con los TEA, los STR comúnmente utilizados no tienen los atributos específicos que permiten asumir la linealidad en el pasado. Por lo tanto, la mayoría de las fechas de los haplogrupos basadas en esos conjuntos de informes sobre transacciones sospechosas pueden haberse subestimado sistemáticamente.

Conclusión

Las distribuciones de los sub-haplogrupos principales R-S127, R-S21, R-S145 y R-S28, muestran concentraciones marcadamente localizadas (figura 3). Si el linaje R-M269 es de origen más reciente que la expansión neolítica, entonces su distribución actual tendría que ser el resultado de grandes movimientos de población ocurridos desde ese origen. Para que este haplogrupo fuera tan ubicuo, la población portadora de R-S127 habría desplazado a la mayoría de las poblaciones presentes en Europa occidental después de la transición agrícola neolítica. Alternativamente, si R-S127 se originó antes de la ola neolítica de expansión, entonces ya estaba presente en la mayor parte de Europa antes de la expansión, o la mutación ocurrió en el este, y se extendió antes o después de la expansión, en cuyo caso esperaríamos una mayor diversidad en el este más cercana a los orígenes de la agricultura, que no es lo que observamos. Los mapas de frecuencias de sub-haplogrupo R-S127 para R-S21, R-S145 y R-S28 muestran distribuciones radiales de ubicaciones europeas específicas (figura 3). Estos centros tienen altas frecuencias absolutas: El R-S21 tiene una frecuencia del 44% en Frisia, y el R-S28 alcanza el 25% en los Alpes; y en las poblaciones donde tienen la frecuencia más alta, la gran mayoría del R-S127 pertenece a ese sub-linaje en particular. Por ejemplo, la mitad de todo el R-M269 en el sur de Europa es derivado del R-S28, y alrededor del 60% del R-M269 en Europa central es derivado del R-S21. A nivel de sub-haplogrupo, entonces, R-M269 se divide en bolsas geográficamente localizadas con sub-haplogrupos individuales R-M269 dominando, lo que sugiere que la frecuencia de R-M269 en toda Europa podría estar relacionada con el crecimiento de múltiples sub-linajes geográficamente específicos que difieren en diferentes partes de Europa.

Un análisis reciente de fechas de radiocarbono de sitios neolíticos en toda Europa revela que la propagación del Neolítico no fue en absoluto constante, y que varios «centros de expansión renovada» son visibles en toda Europa, representando áreas de colonización, tres de las cuales se ubican curiosamente cerca de los centros de los focos de sub-haplogrupos (material electrónico suplementario, figura S3). Se necesita un trabajo futuro que incluya simulaciones espaciales explícitas, junto con medidas precisas de la diversidad del cromosoma Y, para investigar cómo puede haberse producido la distribución actual de sub-haplogrupos. En este contexto, un trabajo reciente de Sjödin & François rechazó una dispersión paleolítica para R1b-M269 utilizando simulaciones espaciales basadas en el conjunto de datos de Balaresque. Sin embargo, observamos que aún es necesario un trabajo adicional, ya que estos autores desconocían la limitación del conjunto de datos Balaresco presentado aquí y no exploraron completamente el impacto de las diferentes características moleculares de los loci investigados en su análisis.

Las estimaciones de edad basadas en conjuntos de Y-STR cuidadosamente seleccionados para poseer los atributos necesarios para descubrir ancestros profundos (por ejemplo, de los casi 200 recientemente caracterizados aquí ), y de comparaciones de secuencias de cromosomas Y completos, proporcionarán fechas sólidas para este haplogrupo en el futuro. Por ahora, no podemos ofrecer ninguna fecha en cuanto a la edad de R-M269 o R-S127, pero creemos que nuestros análisis de STR sugieren que las estimaciones recientes de edad de R-M269 y R-S116 probablemente sean más jóvenes que los valores verdaderos, y la homogeneidad de la varianza de STR y la distribución de subtipos en todo el continente son inconsistentes con la hipótesis de la difusión neolítica del linaje del cromosoma Y R-M269.

Notas a pie de página

Esta revista es © 2011 The Royal Society

Deja una respuesta

Tu dirección de correo electrónico no será publicada.

Previous post blog
Next post Naltrexona en Dosis Bajas: Un» Nuevo » Tratamiento para Enfermedades Autoinmunes