はじめに
初期の人間の移動の理解を助けるために人間の生物学的変異を使用する最初の試み以来、ヨーロッパの人々は主要な研究の焦点となってい 約10 000年前に肥沃な三日月の農業の発展に続いて、この技術は、新石器時代の移行として知られるようになったものの間に、劇的な人口増加につながった遍歴狩猟採集から座りがちな農業への主要な文化的移行を引き起こし、近東西からヨーロッパに広がった。 この考古学的枠組みの中で、ヨーロッパの最初の人々と新石器時代の移行とともにそれに移住した人々の現代ヨーロッパの人口への相対的な貢献についての議論は、遺伝的遺産の面でも、移住と継承のプロセスに関しても激怒している。 真のシナリオは間違いなく多面的で複雑です。 主成分分析を用いた”古典的マーカー”に関する初期の研究とY染色体を用いたより最近の研究の両方が、ヨーロッパでは遺伝的変異が南東–北西の勾配に沿って分布していることを示している。 このような観測は、ヨーロッパにおける新石器時代の移行のためのdemic拡散のモデルを支持することが示唆されている(すなわち、農業の普及は近東からの人々の関連する動きも関与している)。
新しい研究は、西ヨーロッパの主要なY染色体ハプログループR1B1B2-M269(以下、R-M269と呼ぶ)に焦点を当てて、ヨーロッパにおける新石器時代の移行に対 これまでの研究では、より広範なR-M173クレード(R1A-M17亜系統を除く)とハプログループ1(一塩基多型、またはSNP、92r7に由来する)は旧石器時代にヨーロッパに広がった可能性が高いことが示唆されており、移住した農家とともにヨーロッパに運ばれた可能性は低い。 バラレスク他 ハプログループR-M269内の840本のY染色体を用いて、このハプログループは西の高いところから東の低いところまで強い頻度のクラインによって特徴付けられるが、ハプロタイプ多様性における関連するクライン(平均短いタンデム繰り返し、またはSTR、分散として測定される)が反対方向にあることを示した。 彼らは、この相関関係は、ヨーロッパにおける新石器時代の移行と一致する近東からのこの系統のより最近の分散によって説明できると主張した。 系統は様々な集団で約6000年前と推定され、このモデルと一致すると主張された。 この結果は、彼らの導入に記載されているように、”ヨーロッパ人のY染色体の大部分が新石器時代の拡大に起源を持っていることを示しています”(p.2in)。
2043R-M269染色体のはるかに大きなサンプルで強力な地理的構造を示すR-M269の下流のいくつかの新しいSNP変異を説明しました。 彼らは、西ヨーロッパの高周波(70%以上)からのclinalであるSnp M412(S167としても知られている)とL11(S127)の存在によって定義される本質的にヨーロッパ固有のクレードを強調しており、東に減少している。 この研究は、いくつかの下流のSnpの分布が顕著な周波数パターンを示し、高度に局在した周波数の異なる領域から広がるように見えることを示した。 . Myres et al. ヨーロッパの異なる集団におけるR-S116ハプログループの合体時間を推定し、バラレスクとの広範な合意で、R-M269ハプログループは新石器時代に、より具体的には約7500年前にハンガリーからフランスまで北ヨーロッパ全体に広がった新石器時代の農業産業であるリニアバンドケラミクに広がった可能性があることを示唆した。
STR変異率を取り巻く現在の不確実性は、これらの最近の研究にもかかわらず、R-M269ハプログループがいつ、どこでヨーロッパで発生し、広がったかにつ ヨーロッパのY染色体遺伝子プールの起源を呼び出す場合でも、”特にそのような議論が不完全に解決された単一のハプログループに基づいている場合には慎重に見なければならない”(p.100in)、西ヨーロッパの男性(100万人を超える)の大半がR-M269Y染色体ハプログループに属するY染色体をどのように運ぶかを理解しようとすることは深い関心を持っている。
その結果、私たちは独自の大規模なR-M269データセットを独自に、最新の包括的な調査の互換性のあるデータと組み合わせて、これらの問題に対処しました。 我々は、新石器時代の仮説の支持の最近の主張の基礎である平均STR分散と経度の間の基本的な関係は、私たちのより大きく、地理的に広いサンプルのた また,この以前の分析がどのようにしてこの偽の関連をもたらしたのかを説明した。 我々は最終的に10STRsの共通セットに基づいて、いくつかの異なるサブ系統レベルでマイクロサテライト変異の本質的に均質な背景を示す、SNP S127によ
不確実性を認めながら、研究者は通常、複数のSTRsにわたる個人間の違いに基づいてY染色体系統の年齢を報告し、多くの場合、平均二乗距離(ASD)または関連す 一般的な考え方とは対照的に、Asd、したがってTの推定値は、Strの異なるサブセットが同じサンプルで使用される場合に大きく異なります。 最近の証拠は、R-M269の新石器時代の広がりのためのサポートを増加しているが、我々は現時点では、最近の研究で使用されるY-STRsのセットに基づいて発散時間の信頼できる推定を行うことは不可能であると結論付けている。 さらに,実際にはほとんど考慮されていない発散時間推定値の精度を制御するように見えるのは,Y-Strの特性であり,それ自体が使用される数ではないことを示した。
材料および方法
(a)倫理声明
サンプリングされたすべての男性は、サンプルが収集された各大学の倫理委員会による倫理的承認に続いてインフォームドコンセントを
(b)DNAサンプルとジェノタイピング
我々は、新規および以前に公開されたY染色体の両方を含む6503の総人口から、ヨーロッパ、近東および西アジアから2486R-M269Y染色体のデータセットを組み立てました。 ヨーロッパおよびアジアにおけるR-M269および様々なサブハプログループの頻度分布を評価するために、私たちのデータをMyres et al. これは、1 7 2の異なる集団からの1 6 2 9 8の合計試料からの4 5 2 9個のR−M2 6 9染色体の組み合わせセットを得た(電子補足材料、表S1および図S1)。 S1 2 7/L1 1(rs9 7 8 6 0 7 6)、S2 1/U1 0 6(rs1 6 9 8 1 2 9 3)、S1 1 6(rs3 4 2 7 6 3 0 0)、S1 4 5/M5 2 9(rs1 1 7 9 9 2 2 6)およびS2 8/U1 5 2(rs1 2 3 6 4 4 0)のSnpの頻度が確認された。 試料を標準的なPCR反応で増幅し、Snapsiot Multiplex System(Life Technologies Corp.,Carlsbad,C A,USA)プライマー伸長プロトコルを使用して、各SNP遺伝子座に存在する対立遺伝子を特徴付ける。 すべてのプライマーは電子補足材料にリストされています。
この研究(2 2 8 9)でタイプされた個体の大部分について、以下の1 0のStrが利用可能であった:DYS1 9;DYS3 8 9I;Dys3 8 9B(dys3 8 9II遺伝子座からdys3 8 9Iでスコア化された対立遺伝子を差し引いた);DYS3 9 0;DYS3 9 1;DYS3 9 2;DYS3 9 3;DYS4 3 7;Dys4 3 8;およびDYS4 3 9(以前に公開されているか、またはYfilerキット(Life Technologies Corp.)またはdys4 3 9を使用して自分自身によってタイプ化されているかのいずれかである)。Promega powerplex assay(promega corp.,Madison,WI,USA)。 Weale e t a l. これまでに出版されたのは5つのStrのみであり、残りの5つはButlerらの研究から得られたプライマーを使用して内部的に設計され検証された多重型で型付けされた。 dys391、DYS437、DYS389IおよびIIおよびDYS439、およびDys438のためのGusmao&Alvesの研究からのプライマー。 Dys3 9 1呼び出しを使用して、Wealeらの元のハプロタイプとの整合性をチェックした。 ウィールらの三人。 集団は、これらのSTRs(114人)のためにさらにタイプされていませんでした。 Yfilerキット(1 0 3 5)を使用して入力された個体を使用して、ASD計算に対するSTR選択の効果を調査した(electronic supplential material、表S2)。
合計サイズが30以上の個体群を使用して周波数マップを作成しました(電子補足資料、図S1)。 分散は、ハプロタイプが関連するハプログループ内の少なくとも10人の個人のために利用可能であったそれらの集団についてのみ計算された。
(c)解析
SNP周波数のマップは、ArcMap GIS(v.9.2;ESRI)を使用して表示されました。 補間は、逆距離重み付け手順を使用して実行した。 すべての集団の緯度と経度は、サンプルに関連する最高解像度のサンプリングセンターに基づいており、電子補足資料、表S1に示されています。
R統計パッケージを使用して、1000個のブートストラップ反復後の母集団内のすべての個体間の中央値STR分散(すべての遺伝子座にわたって平均化された遺伝子座内の反復数の分散)を計算し、個体を置換した。 回帰分析をRで実施して、R−M2 6 9、R−M2 6 9(XS1 2 7)およびR−S1 2 7ハプログループについての平均STR分散を緯度および経度と比較した。
我々は、2つの別々の基準に基づいて、Strの異なる組み合わせを使用した場合、ASD推定値がサンプル内でどのように変化するかを調べました:突然変異率μ;およ 我々は、最近計算された観測されたμを使用して、速度のスケールで15STRsをランク付けし、7つの最速速度と7つの低速速度に基づいてASDを別々に計算した(電子補 我々の第二の基準は、Strの異なるグループの線形性の推定持続時間Dに基づいていた。 直線性の持続時間は、ASDが時間とともに直線的に増加しなくなるまでの発散時間の推定値である。 厳密な段階的モデルの下で変異するStrsについては、Goldstein e t a l. ASDは最初は時間とともに線形に増加するが、この直線性はSTRが取ることができる最大繰り返し数Rによって制約されることを示しました。 Dは、(Rの単純な変換である)λ(R)とλ、および有効母集団サイズ(Ne)(eqns3と4in)を使用して近似されます。 Θ(R)/2.の値が大きいほど、Dの推定値が増加します。θ(R)/2.の値が大きいStrを使用すると、線形性が過去にさらに仮定されるはずであり、これらのStrから計算されたASDは、飽和の結果として過小評価される可能性が低くなります。 表1および電子補足資料、表S4は、使用されるStrの異なるグループおよびσ、R、σ(R)/2σおよびASDの関連する値を示す。
最新の共通祖先(TMRCA)推定との時間差がASDに基づく方法に固有ではないことを確認するために、より多くのY-STRs(n=65)が利用可能であったHGDPベドウィン母 線形性推定の持続時間の程度を変化させた四つの異なるセットのSTRsを比較した(電子補足材料)。
結果
ヨーロッパにおけるR-M269系統の起源を調査するために、ヨーロッパ、近東および西アジアのいくつかの集団から4529本のR-M269染色体(2486本)の大規模なデータセットを分析した(電子補足資料、図S1および表s1)。 ヨーロッパ内では、西ヨーロッパの高周波数から東の低い周波数まで、以前に観測されたものと同様に、R–M269の北西-南東周波数クラインを観察しました。 ハプログループR-M269内では、新たに特徴付けられたSNP、S127(L11に相当)を遺伝子型化し、R-M269およびR-M269(xs127)の分布とともに、ヨーロッパおよび近東での分布を図2に示す。 R-M269とR-S127の分布は大きく重複していますが、R-S127の頻度はバルカン半島周辺で低下し、さらに東およびヨーロッパ外に極端に低い値に達します。 逆に、r-M269(xs127)は東部集団でより高い頻度を示しています。 3つの地理的に局在したR-S127サブハプログループ(R-S21、R-S145およびR-S28)を示す周波数マップを図3に示します。
次に、R-M269系統全体とR-S127とR-M269(xs127)サブハプログループの各母集団のSTR多様性を計算し、平均STR分散と経度と緯度の関係をBalaresqueとまったく同じ方法で調 これらの値の不確実性の推定値を個人にブートストラップすることによって提供し、観測された分散値の中央値とその95パーセントCIを報告します(図2)。 我々は、緯度と経度を正規化し、これらの値と三つのR-M269サブハプログループの中央マイクロサテライト分散との間の線形回帰を実行しました。 緯度との相関は見られず(データは示されていない)、Balaresqueとは対照的に、どのハプログループでも経度と分散との間に有意な相関は見られなかった。
Balaresqueデータセットは、SNP R-M269の解像度にのみ遺伝子型データを提示します。 我々の結果は、アナトリアのR-M269サンプルの大半は、約90パーセントは、R-M269(xs127)サブハプログループに属していることを示しています。 Balaresqueデータからこれらのトルコ人の集団を削除し、回帰を繰り返すと、有意な相関が削除されます(R2=0.23、p=0.09、電子補足資料および図S2の詳細)。 したがって、これらの集団は、有意な相関に固有のものである。
バラレスク分析で使用されたアイルランドのハプロタイプは、分析に含まれているものと比較して非常に低いSTR分散(0.208)を有することが観察された(0.35;Moore et al. ). Balaresqueは、オンラインYsearchデータベース(http://www.ysearch.org)からダウンロードされたアイルランドのハプロタイプのサンプルを使用しました。 YsearchハプロタイプがMooreらのIrish R−M2 6 9を代表するものであるかどうかを試験する。 、我々は独立してMooreらをリサンプリングした。 データセット10 000回、バラレスク紙で使用されているのと同じ9つのStrを使用して分散を推定した75のハプロタイプのサブサンプルを選択します(詳細な方法論と正当化は電子補足資料に記載されています)。 これらの10,000回の繰り返しの中央値分散は0.354であり、95%CIは(0.285–0.432)であった。 この異なる分散推定値で回帰分析を繰り返したとき、相関はもはや有意ではなかった(R2=0.09、p=0.19)。
マイクロサテライトベースのASDは、時間とともに直線的に増加することが示されており、平均合体時間の不偏推定量として使用されています。 異なるセットのSTRsを使用しても、tの推定を劇的に変更すべきではないことが予想されます。as Θが変化すると、ASDも同様に変化し、Tは一定のままです。 表1は、最近推定された観察された突然変異率およびYHRDから推定された範囲に基づく直線性の持続時間の推定値を示す。 R−S1 2 7のASDは、その2つの主要なサブハプログループ、R−S2 1(1 4 1本の染色体)およびR−S1 1 6(7 1 7;electronic supplential material、表S3)の1 5個のSTRハプロタイプを比較することによっ 図4aは、異なる特性を有するいくつかの異なるStrのセット(電子補助材料、表S4)に対するTのプロット(ASD/2πとして推定)である。
TとSTR選択の間の相関をさらに調べるために、我々は、Y染色体系統発生の2つの最も深い枝、Axa1およびBに属する染色体に基づいて、上記と同じ方法でTを計算した(図4b;電子補足材料、表S4)。 比較として、同じSTRサブセットから計算されたASDが、同じプロット上のR-S127について示されています。
議論
ここでは、Y染色体ハプログループM269の空間分布がR-S127によってヨーロッパと西ユーラシアの系統に分割できることをこれまでの最も広範な分析 バラレスクの結果とは対照的に、R-M269の多様性と経度の間には関係がありません(図2)。 バラレスク紙の集団の二組の存在は、観察された関係に因果関係があるように見えます: アイルランドの人口の過小評価された多様性とトルコの染色体の包含、その大部分は潜在的に非ヨーロッパのクレードR-M269(xs127)に属しています。 これらの要素が適切に考慮されると、共同でまたは独立して、相関関係はもはや存在しない。 この相関関係は、R-M269が拡大する新石器時代の農家に広がったという仮説の中心的な教義です。
Morelli et al. (以下”モレリ”)は、R-M269を東西の系統に分割したSTRモチーフを発見した。 私たちは、Myres et alの71%が観察されました。 STR情報が利用可能なR-M269(xs127)染色体は東部モチーフ(DYS393-12/DYS461-10)を有し、Myresらのr-S127染色体の80%はMyresらのr-S127染色体の80%はMyresらのr-S127染色体の80%はMyresらのr-S127染色体の80%はMyresらのr- 西洋のモチーフ(DYS393-13/DYS461-11)を持っています。 R-S127染色体は東部モチーフを表示しなかったが、R-M269(xs127)染色体の5%は西部モチーフを表示した(すべてがL23(S141)またはM412(S127)由来のいずれかであった)。 両方のケースでは、しかし、これらのモチーフは、Dys461遺伝子座で一つの繰り返しが少ないことによってMorelliによって示唆されたものとは異なっていた。 したがって、二つのSTRモチーフに基づいてMorelliによって観察された二分法は、少なくとも部分的には、このSNPの存在によって裏付けられている。
Y染色体系統の年代測定は議論の余地があることで有名であり、主な問題は、STR突然変異率の選択が三つの要因(すなわち、進化的変異率対観察された(系図的)突然変異率)によって異なる年齢推定値につながる可能性があることである。 興味深いことに、Myres et al. Balaresqueは異なるSTR突然変異率と年代測定アプローチを使用し、TMRCAの推定値は重複しています:8590-11 950年の突然変異率を使用して6。世代あたり9×10-4、および4577-9063年はそれぞれ2.3×10-3の平均突然変異率を使用しています。 これとは別に、MorelliはSardinian染色体とAnatolian染色体のみに基づいてTMRCAを計算し、R-M269系統はMyres et alと同じ進化的変異率に基づいて25 000-80 700年前に発生したと推定した。
サブハプログループR-S127の平均合体時間Tを推定するのに適したStrのセットを見つけることを求めて、この文脈ではすべてのStrが同等に使用されているわけではないことを示した。 我々は、Strの異なるセットを使用して、直線性の持続時間Dを推定することに集中しました。 我々の分析は、STRのDが深い祖先を明らかにする能力の鍵であることを示唆している。 直線性の持続時間は、ASDとTが特定のSTRに対して線形に関連し続ける過去までの時間の長さを指します。 Goldstein et al. Dは、ASDを計算するために使用されるStrの2つの特性、すなわちSTRが取ることができる可能性のある対立遺伝子の突然変異率および範囲によって影響 STR(R)/2D(Dの代理)に基づいてSTRマーカーの選択を操作したとき; したがって、合体推定値は明示的に使用するSTRsに依存することは明らかです。
我々の分析では、この現象はR-M269ハプログループやASDを用いた方法に特有のものではないことが確認されています。 明らかなことは、Tの推定値は、この推論を行うために選択されたStrに暗黙的に依存するということです。 65Y-STRsが利用可能であるHGDP母集団にBATWINGを使用して、我々はTMRCAの中央値の推定値は、STRsが直線性の予想持続時間に基づいて選択されたときに五倍以上異なる 研究者はASDで発散時間を推定する際にSTR変異率を考慮に入れますが、一般的に使用されるStrには、線形性を過去にさらに仮定することを可能にする特 したがって、このようなStrのセットに基づくハプログループの日付の大部分は、体系的に過小評価されている可能性があります。
結論
主要なR-S127サブハプログループ、R-S21、R-S145およびR-S28の分布は、著しく局在化した濃度を示しています(図3)。 R-M269系統が新石器時代の拡大よりも起源が最近である場合、その現在の分布は、その起源以来の主要な人口移動の結果でなければならない。 このハプログループが非常に遍在しているためには、R-S127を運ぶ人口は、新石器時代の農業移行後に西ヨーロッパに存在する人口のほとんどを変位させたであろう。 あるいは、R-S127が新石器時代の拡大の波の前に発生した場合、それは拡大の前にヨーロッパのほとんどにすでに存在していたか、突然変異が東で発生し、拡大の前または後に広がっていたかのいずれかであり、その場合、私たちが観察するものではない農業の起源に近い東でより高い多様性を期待するでしょう。 R-S21、R-S145、およびR-S28のR-S127サブハプログループ頻度のマップは、特定のヨーロッパの場所からの半径方向の分布を示しています(図3)。 これらのセンターは高い絶対周波数を持っています: R-s21はフリースラントで44パーセントの頻度を持ち、R-S28はアルプスで25パーセントに達し、最も高い頻度にある個体群では、R-S127の大部分はその特定の亜系統に属している。 たとえば、南ヨーロッパのすべてのR-M269の半分はR-S28由来であり、中央ヨーロッパのR-M269の約60%はR-S21由来です。 サブ-ハプログループ-レベルでは、R-M269は地理的に局在したポケットに分割され、個々のR-M269サブ-ハプログループが支配的であり、ヨーロッパ全体のR-M269の頻度は、ヨーロッパの異なる地域で異なる複数の地理的に特定のサブ系統の成長に関連している可能性があることを示唆している。
ヨーロッパ全土の新石器時代のサイトの放射性炭素年代の最近の分析は、新石器時代の広がりは決して一定ではなく、いくつかの”新たな拡大の中心”がヨーロッパ全土に見られ、植民地化の領域を表しており、そのうちの三つはサブハプログループの焦点の中心に興味深いほど密接にマッピングされていることを明らかにしている(電子補足資料、図S3)。 空間的に明示的なシミュレーションを含む将来の研究は、一緒にY染色体の多様性の正確な測定は、サブハプログループの現在の分布が生成されている この文脈では、Sjödin&Françoisによる最近の研究では、Balaresqueのデータセットに基づく空間シミュレーションを使用して、R1B-M269の旧石器時代の分散を拒否しました。 それにもかかわらず、我々はこれらの著者がここに提示Balaresqueデータセットの制限を認識していなかったし、完全に彼らの分析に調査遺伝子座の異なる分子特
深い祖先を明らかにするために必要な属性を持つように慎重に選択されたY-Strのセット(例えば、ここで最近特徴付けられたほぼ200から)、およびY染色体配列全体の比較から基づく年齢推定は、将来的にこのハプログループの堅牢な日付を提供する。 今のところ、我々はR-M269またはR-S127の年齢に関する日付を提供することはできませんが、我々のSTR分析は、R-M269およびR-S116の最近の年齢推定値は真の値よりも若い可能性が高く、str分散の同質性および大陸全体のサブタイプの分布は、R-M269Y染色体系統の新石器時代の拡散の仮説と矛盾していると考えています。
です