メンデル病遺伝子における遺伝子内コピー数の変動の有病率と特性

大規模な臨床コホートにおける遺伝子内Cnvの有病率

我々は、診断NGS遺伝子パネルテストのために呼ばれる1507遺伝子の様々なサブセットを143,515人の無関係な個人で試験した。 合計で約480万個の単一遺伝子解析が完了しました。 すべてのタイプのほぼ8.1万の変異体の中で、我々は2844intragenic Cnv(1237の異なるイベント)を同定した。 これらのCnvは、全変異体の0.03%、報告された変異体の3.1%、特にLP/Pに分類される変異体の9.1%を占めていた(補足表1および補足図1)。 これらの変異体は384の遺伝子にわたって発見され、1810の欠失および1034の重複が含まれており、このコホートでは1.9%、少なくとも一つの報告された変異体を持つ個人の間で4.4%、より有意に、任意のタイプのLP/P変異体を有する報告を受けた個人の間で9.8%の有病率を表していた。

遺伝子内CNV発生のパターン

Cnvは、単一のまれな事象、共通の再発事象、および低頻度の再発事象の3つのカテゴリのいずれかに分類された(図1)。 1a)。 各カテゴリーは、観測されたすべてのCnvの約三分の一を表していました。 Cnvを有する3 8 4個の遺伝子の大部分は、それぞれ1つのCNVのみを有していたが、これらの単一のCnvを合わせて、全ての事象の1 0%未満を占めていた(図1B)。 1b)。 対照的に、384個の遺伝子のうち31個は15個以上のCnvを有していたが、これらはすべてのCnvのほぼ70%を占めていた。 頻度は別として、これらの特性が臨床的影響を決定することができるので、cnvの遺伝子内の位置およびサイズを調べた。 Cnvの4分の1にはエクソンが1つだけ含まれていた。 遺伝子内Cnvの大部分は、多エキソン部分遺伝子事象であり、大部分は、末端(最初または最後の)コードエクソンを伴わずに、内部エクソンのみを包含した(図 1c、d)。 末端エクソンを含む部分遺伝子Cnvの中では,重複よりも多くの欠失が最初のエクソンを含んでいたが,同様の数の欠失および重複が最後のエクソンを含んでいた。 最後に、欠失よりも重複の割合が大きいのは、完全な遺伝子を含んでいた。 すべての別個の(非冗長)Cnvのほぼ5分の1は完全な遺伝子を含み、4 0例では、Cnvはいくつかの隣接遺伝子を含み、少なくとも1 0本の染色体上に存在していた(補表1、2)。

図1.1.1. 臨床的に試験された遺伝子において観察されたコピー数変異体(Cnv)の頻度、サイズ、解釈、および分布。

試験された遺伝子で観察された別個のCnvの数を示すヒストグラム。 チャートの列は、Cnvが観測された回数を示しています。 折れ線グラフは、各周波数ビンで観測された総Cnvの割合を示しています。 たとえば、最初の列は、約900のCnvが一度だけ発生し、合計ですべてのCnvの約30%を占めていることを示しています。 b臨床コホートにCnvを含む遺伝子の数を示すヒストグラム。 チャートの列は、遺伝子で観察されたCnvの数の増分増加を示しています。 折れ線グラフは、遺伝子あたりのCNV発生の任意の増分でのCnvの割合を示しています。 例えば、ほぼ200の遺伝子は1つのCNVだけであり、これはすべての事象の10%未満を占めていました。 対照的に、約30個の遺伝子はそれぞれ15個以上のCnvを有し、これはすべてのCnvのほぼ70%を表していた。 c影響を受けたエクソンの数および臨床解釈による欠失および重複の分布。 細胞遺伝学的事象は、単一の染色体上の隣接する遺伝子に影響を与える同じ接合性の連続したCnvとして定義される。 いくつかの全遺伝子事象は、実際にはより大きな細胞遺伝学的事象の一部である可能性があるが、予測された細胞遺伝学的事象内の他の遺伝子は、我々のアッセイから存在せず、したがって分析のために利用できなかったので、そのようにリストされていない。 臨床およびベースラインのCNVデータで検出されたCNVの重複および欠失の数。 CNVは、遺伝子全体(クラスi、V)、少なくとも最後のエクソン(クラスI I、VI)、少なくとも最初のエクソン(クラスIII、VII)、または内部エクソンのみ(クラスIV、VIII)を含 一般的な遺伝子構造が上部に示されています。 緑色と紫色のボックスは、テキストで説明されているように、”末端エクソン”を示し、他のすべては”内部エクソン”です。 空のボックスは削除されたエクソンを示します。 この図は、原性内複製が並行して発生することを前提としており、これはしばしばそのような事象の場合である。 プロモーター領域だけを含むcnvは、この図では表されていません。 ピアソンのカイ二乗分割表は、重複とp=1に対してp<1×10-5のp値を与えます。これは、遺伝子全体にわたるCnvの分布の差が、単に臨床CnvとベースラインCnvとの間のサンプリング差によるものではないことを示す。 臨床的に試験された遺伝子におけるeおよびfの欠失および重複およびそれらの解釈。 (E)のグラフは、機能喪失(LOF)変異機構を有する遺伝子を示し、(f)のグラフは、機能喪失(LOF)機構を有さない遺伝子を示している。 我々のパネルに含まれるほとんどの遺伝子は、LOF機構を有するものとしてキュレーションされた。 各CNVの臨床分類,cnvとの遺伝子の遺伝パターン,変異体の接合性を比較した。 X−連結(X L)遺伝子については、雌のヘテロ接合性Cnvを、雄のCnvとは別に示す。 AD常染色体優性、AR常染色体劣性、F女性、hetヘテロ接合体、homホモ接合体、M男性、LP可能性病原性変異体、P病原性変異体、不確実な有意性のVUS変異体。 C、e、およびfにおける「病原性」標識には、病原性および病原性の可能性が高いと分類されるCnvが含まれる。

CNVs

欠失の臨床分類は、この臨床コホートでより頻繁であり、大部分がLP/P変異体として報告された(図10B)。 1c)。 しかし、いくつかの欠失は、主に機能喪失(LOF)変異機構のない遺伝子のフレーム内変異体であったため、VUSとして分類された。 対照的に、重複の半分以上がVUに分類されました。 部分的な遺伝子重複のうち、359は末端エクソンを関与し、225は内部エクソンのみを関与した(図。 1d)。 内部エクソンのみを含む少なくとも166の複製は、転写物の読み取りフレームに悪影響を及ぼすと予測され、したがってLP/Pとして分類された(補足表2)。 少なくとも30の重複のために、我々は分割読み取りシーケンスデータに基づいて推定ブレークポイントを観察し、転写産物の読み取りフレームを混乱させるタンデム配置を予測した。 これは、遺伝子内複製は、典型的には、挿入転座などのより複雑な事象に対して、局所的なタンデム再配列であるという以前の主張をサポートしている。また、常染色体優性(AD)、常染色体劣性(AR)、およびX連鎖(XL)障害に関連する遺伝子におけるCnvの分布および接合性についても検討した(図18)。 1e、f)。 テストされた遺伝子のほとんどは、これらの遺伝パターンを持っていたので、この結果はバイアスを反映しているが、Cnvの大部分は、ADまたはXLの遺伝 LP/Pとして分類された2096のCnvのうち、85%はADまたはXL継承に関連する遺伝子であり、15%はAR継承に関連する遺伝子であった。 後者のうち、6.7%はホモ接合欠失であり、2.8%は他の対立遺伝子の病原性SNVに伴う化合物ヘテロ接合変化であった(AR障害の陽性分子診断を構成する;補足表1)、5.5%は単一のヘテロ接合事象であった。

このコホートのほぼすべてのCnvは、LOF機構を持つ遺伝子で発見されました(図。 1e)。 これらの遺伝子のほとんどのCnvは病原性として分類された欠失であったが、重複の半分以上がVUSとして分類された。 比較的、LOF機構を有さない3 0 4個の遺伝子は、ほとんどCnvを有しておらず、主にvusまたは良性に分類された(図1 0A)。 8×1 0−9)、および欠失よりも有意に多くの重複(p=1.

Cnvおよび罹患率

多数の多遺伝子パネルの分析では、疾患群間でCNVの有病率が変化していることが示された(図1)。 2a、b;補足表4)。 Cnvを有する遺伝子は、大部分が再発事象、大部分が固有事象、または両方の混合のいずれかを有していた(図1 0A)。 2c)。 いずれかのタイプの少なくとも10の病原性変異体をもたらしたパネルの中で、三分の一以上の病原性変異体の10%以上を占めるCnvを持っていました。 Cnvの数が最も多かった遺伝子パネルは,脊髄性筋萎縮症,Charcot–Marie–Tooth病,ジストロフィノパチーであった。 しかし、先天性心不全およびヘテロタクシー、リンチ症候群、肉腫、筋ジストロフィー、およびジストニアのパネルも多くのCnvを同定した。 対照的に、最も低いCNV頻度を有する遺伝子パネルは、慢性膵炎、RASopathies、心筋症、および遺伝性血栓症のためのものが含まれていた。

図1.1.1. 遺伝子およびパネルによる病原性コピー数変異体(Cnv)。

各臨床専門分野のパネルには、1つ以上の病原性Cnvを含む陽性報告の割合が示されています。 少なくとも100回臨床的に試験され、任意のタイプの少なくとも10の病原性変異体を有するパネルのみが含まれる。 各パネルは円で表されます。 b様々なパネルに病原性Cnvを含む陽性報告の割合。 これらのパネルは、各臨床専門分野で最も病原性の高い変異体を有する上位5つでした。 C CNV発生の三つのパターンが識別可能であった:再発事象(例えば、PMP22およびSMN1で)、主にまれなユニークな事象(例えば、DMDおよびBRCA2で)、および両方の混合(例えば、BRCA1およびMSH2で)。 異なる変異体の数は青色で示され、これらの変異体の追加/再発観察は緑色で示されている。 様々な遺伝子におけるCnvであった病原性変異体のD画分。 あらゆるタイプの最も病原性のある変異体を持つ上位5つの遺伝子は、各臨床専門分野で示されています

遺伝性癌症候群の遺伝子は、病原性変異体の中でCnvの高い(全体で8.3%、パネルの中で0〜50%の範囲)有病率を示した(図10B)。 2a;補足表3および4)。 これらの遺伝子で観察された1059の病原性Cnvのうち、219は一度だけ観察され、174は再発した。 BRCA1とBRCA2は、以前の研究と一致して、病原性変異体の間で6.1%(信頼区間:5.4–6.9%)の組み合わせCNV有病率を有していた(個別に、BRCA1 11。4%、BRCA2 1.7%)。15,19,20Cnvはまた、EPCAM、STK11、およびVHLなどの他の遺伝子、および低い全体的な診断収率を有する様々なパネル上の遺伝子に富化された。 我々のNGS法を使用して、我々はまた、90Cnv pms2の機能的遺伝子コピーのセグメント複製エクソン12-15で観察した(補足表1)。 最後に、25のCnvは、GREM1、TP53、およびAPCのプロモーター領域で観察された。

小児および希少疾患に関連する遺伝子におけるCnvは、病原性変異体の7.7%を占めた(パネル間で0-82%の範囲、図。 2c)。 我々は、早期小児てんかん脳症、ジュベール症候群、結節性硬化症、および脳海綿状奇形のためのパネルでCnvの最高頻度を発見した(補足表4)。 病原性Cnvによって最も頻繁に影響を受けた遺伝子は、NF1、NPHP1、およびTSC2であった(補足表3)。 てんかん遺伝子の中で、我々はUBE3A15q13.1とPRRT2 16p11.2では、おそらく再発細胞遺伝学的再編成されたを含むCNVsを観察しました。 我々は、繊毛症、RASopathies、骨形成不全、および嚢胞性線維症(補足表4)の遺伝子パネルで低いCNV頻度を観察した。 ヌーナン症候群および慢性膵炎のパネルは、病原性Cnvをほとんど同定しなかったが、少なくとも270人が試験され、60以上の病原性変異体が各パネルで報告された。

心血管疾患の遺伝子は、病原性変異体の間でCnvの有病率が比較的低いことを示した(全体で4.7%、パネルでは0-16.7%の範囲)。 Cnvの最高頻度は、心筋症および骨格筋疾患(包括的な心筋症パネルのサブセット)、家族性高コレステロール血症、およびBrugada症候群(補足表4)のパネルで発生した。 対照的に、不整脈(Brugada以外)および大動脈病のパネルでは非常に少数のCnvが見られたが、心筋病パネルでは病原性Cnvの有病率が最も低かった。 病原性Cnvの数が最も多い遺伝子は、LDLR、FBN1、PKP2、MYBPC3、およびRYR2であった(補足表3)。 明らかに高いCNV有病率をもたらすいくつかのパネルでは、全てではないにしてもほとんどのCnvは、1つまたは2つの遺伝子(例えば、ENGおよびLDLR)のみに 全体的な診断収率が最も高い心血管疾患のパネルは、cnvが枯渇し、ほとんどの陽性診断がSnvによって代わりに説明された不整脈および心筋症のものを除いて、Cnvの有病率が最も高い遺伝子を有していた。

神経疾患(主に神経筋疾患)の遺伝子パネルは、病原性変異体の中で遺伝子内Cnvの最も高い有病率を示した(全体で35%、パネル間で0-100%の範囲;図。 2a、c;補足表4)。 この結果は、pmp2 2における再発性遺伝子重複および相互欠失、SMN1における欠失、およびDMDにおける種々のCnvによって主に説明された(補足表3;図3)。 図2c,d;補足図2)。 カスタムNGSメソッドを使用して、我々は疑われる脊髄性筋萎縮症を持つ135人の間でSMN1削除の819例を発見し、SMN2コピーの範囲は0から5まで変化した。 PMP22、SMN1、およびDMDが除外された場合でも、神経疾患にリンクされている遺伝子における遺伝子内Cnvは、まだ私たちのコホートのすべての病原性変異体の6% 一般的にCnvによって影響を受ける神経疾患のための他の遺伝子には、PARK2、LAMA2、およびSPG11が含まれていました。

ベースラインCnvの分析

私たちの診断テストは、医師によって要求された疾患遺伝子に限定されていましたが、提示された臨床表現型とは無関係の多くの遺伝子も私たちのNGSアッセイで配列決定されました。 我々は143,142人で配列決定されたすべての1507遺伝子のデータを非同定し、これらのイベントのベースラインの有病率を推定するために非接収遺伝子における これらの表現型非依存性Cnvは、以後、「ベースラインCnv」と称される。”ベースラインCnvの検索は、個々の7-616遺伝子で行われ、合計16万個の単一遺伝子解析が行われました。 この検索は、4054遺伝子内Cnv(1465の異なるイベント)3772個の599遺伝子(補足表5)全体で得られた。 これらのCnvのほとんどは一度だけ存在したが、いくつかは2回から15回以上見られた(図。 3a;補足表6)。 しかし、累積的な再発イベントは、ベースラインCNV観測のほとんどを占めていました。 ベースラインCnvを有する遺伝子の大部分は、5つ以下の事象を有していた(図1 0A)。 3b)。 わずか47の遺伝子は、同一の再発事象を有する遺伝子と多数のユニークな事象を有する遺伝子の両方を含む、観察されたすべてのベースラインCnvの半分以 遺伝子内ベースラインCNVを持つほとんどの個体は、単一のイベントを持っていたが、146人の個体は、異なる染色体上の遺伝子に追加のCnvを持っていた。 平均して、我々は我々のアッセイで配列決定されたすべての3979遺伝子で1の割合でベースラインCNVを検出した。

図1.1.1. 3: 大規模なコホートにおける臨床表現型とは無関係のベースラインコピー数変異体(Cnv)。

これらのCnvの臨床的意義は、既知の機能喪失(LOF)変異機構を有するAmerican College of Medical Geneticsおよびゲノミクスに記載された遺伝子における欠失を超えて評価され 臨床検査のために注文されたものと同じ臨床専門に属していた遺伝子のcnvは、分析から除去された。 単一エクソン低品質の呼び出しは、潜在的な偽陽性の呼び出しを減らすために削除されました。 ベースラインCnvについて分析された遺伝子で観察された別個のCnvの数を示すヒストグラム。 チャートの列は、Cnvが観測された回数を示しています。 折れ線グラフは、各周波数ビンで観測された総Cnvの割合を示しています。 たとえば、最初の列は、1100を超えるCnvが一度だけ発生し、合計ですべてのCnvの約25%を占めていることを示しています。 対照的に、最後の列は、36個のCnvが15回以上発見され、すべてのベースラインCnvの40%以上を表していることを示しています。 bベースラインCnvを含む遺伝子の数を示すヒストグラム。 チャートの列は、遺伝子で観察されたCnvの数の増分増加を示しています。 折れ線グラフは、遺伝子あたりのCNV発生の任意の増分でのCnvの割合を示しています。 例えば、約240の遺伝子には1つのCNVしかなく、これらのCnvを合わせると、すべての事象の約6%を占めていました。 対照的に、約45個の遺伝子はそれぞれ15個以上のCnvを有し、これはすべてのCnvのわずかに60%以上を表していた。 ベースラインCnvのC分布は、影響を受けるエクソンの数に応じて示される。 Multiexon Cnvは、5’末端エクソン、内部エクソン、および3’末端エクソンの三つのクラスを含む。 (DおよびE)遺伝性および接合性の様式による遺伝子におけるベースラインCnvの負担。 LOF変異機構を有する遺伝子のcnvを部分(d)に示し,LOF機構を有さない遺伝子のcnvを部分(e)に示した。 X連鎖(X l)遺伝子のcnvは,雌ではヘテロ接合性事象,雄ではヘミ接合性事象として観察されたものに分類された。 AD常染色体優性、AR常染色体劣性、F女性、M男性、hetヘテロ接合、homホモ接合

このコホートにおいて臨床的に試験された遺伝子で同定されたCnvとは対照的に、ほとんどのベースライン内遺伝子性Cnvは重複していた(図1および図2)。 1c、dおよび3c)。 大部分はまた、A R遺伝子または確立されたLOF機構を欠いた遺伝子のヘテロ接合変異体であった(図1 0B)。 3d、e)。 少数のベースラインCnvは、AD遺伝またはLOF機構に関連する遺伝子で発生した(図1 6A、1 6B、1 6C)。 1e、fおよび3d、e)。 最も一般的なベースラインCnvは、NPHP1、NIPA1、MYH1 1、DNAI2、HFE2、SMN1、およびPMP2 2における全遺伝子事象、ならびにTFG、BBS9、CTNNA3、PARK2、KCTD7、DNAJC6、GLIS2、およびTUBB4Aにおける部分 疾患遺伝子におけるベースラインCnvの存在を説明し得る特性に関して、本発明者らは、これらのCnvのほぼ4 0%が全遺伝子を包含し、したがって転写物読 3c)。 さらに、LOF機構を有する遺伝子の重複の約90%は、末端エクソンを含む全遺伝子事象または部分遺伝子事象であったが、これらの遺伝子の欠失の半分だけが同じパターンを示した(補足表5)。

ベースラインCnvの全体的な有病率および特性を評価することに加えて、予測される臨床的影響を検討した。 我々は237ヘテロ接合欠失ADまたはXL継承とLOFメカニズムを持つ97遺伝子で観察した;ほとんどはPMP22、DMD、AARS、KCNQ1、FIG4、CHEK2、およびLRSAM1であった(補足表5と7)。 我々は、AR継承(NPHP1とSPG7)と男性のXL継承(DMD)を持つ単一の遺伝子で唯一の二つのホモ接合欠失を発見しました。 A r遺伝を有する遺伝子の他のすべてのホモ接合性Cnvs,または男性のXL遺伝を有する遺伝子のヘミ接合性Cnvsは重複であった。 さらに,ACMGによる医学的作用性を考慮した遺伝子においてCnvを特異的に観察した。21,22我々は、テストに使用されるアッセイに応じて、58の59ACMGリストされた遺伝子(PMS2を除く)の5,300-69,000人の個体におけるCnvを評価した。 合計46個の欠失および110個の重複が検出され、これらの遺伝子について試験された個体の間で最大0.8%(CI:0.58–1.11%)の頻度が示唆された。 MYH11、MYH7、KCNQ1、およびRYR2は、Cnvのほとんどが含まれていました。 具体的には、1 6個の遺伝子(KCNQ1、MYH1 1、MYH7、MYBPC3、PCSK9、BRCA1、RYR2、PKP2、TGFBR2、SMAD3、OTC、NF2、FBN1、DSP、DSC2、およびAPC)に欠失があり、その半数以上がLOF機構を有する(補表7)。

コメントを残す

メールアドレスが公開されることはありません。

Previous post Netbeans IDE12をDebian、Ubuntu、およびLinuxにインストールする方法Mint
Next post 83歳でこの男はフィットネスの最先端に留まる