大規模な臨床コホートにおける遺伝子内Cnvの有病率
我々は、診断NGS遺伝子パネルテストのために呼ばれる1507遺伝子の様々なサブセットを143,515人の無関係な個人で試験した。 合計で約480万個の単一遺伝子解析が完了しました。 すべてのタイプのほぼ8.1万の変異体の中で、我々は2844intragenic Cnv(1237の異なるイベント)を同定した。 これらのCnvは、全変異体の0.03%、報告された変異体の3.1%、特にLP/Pに分類される変異体の9.1%を占めていた(補足表1および補足図1)。 これらの変異体は384の遺伝子にわたって発見され、1810の欠失および1034の重複が含まれており、このコホートでは1.9%、少なくとも一つの報告された変異体を持つ個人の間で4.4%、より有意に、任意のタイプのLP/P変異体を有する報告を受けた個人の間で9.8%の有病率を表していた。
遺伝子内CNV発生のパターン
Cnvは、単一のまれな事象、共通の再発事象、および低頻度の再発事象の3つのカテゴリのいずれかに分類された(図1)。 1a)。 各カテゴリーは、観測されたすべてのCnvの約三分の一を表していました。 Cnvを有する3 8 4個の遺伝子の大部分は、それぞれ1つのCNVのみを有していたが、これらの単一のCnvを合わせて、全ての事象の1 0%未満を占めていた(図1B)。 1b)。 対照的に、384個の遺伝子のうち31個は15個以上のCnvを有していたが、これらはすべてのCnvのほぼ70%を占めていた。 頻度は別として、これらの特性が臨床的影響を決定することができるので、cnvの遺伝子内の位置およびサイズを調べた。 Cnvの4分の1にはエクソンが1つだけ含まれていた。 遺伝子内Cnvの大部分は、多エキソン部分遺伝子事象であり、大部分は、末端(最初または最後の)コードエクソンを伴わずに、内部エクソンのみを包含した(図 1c、d)。 末端エクソンを含む部分遺伝子Cnvの中では,重複よりも多くの欠失が最初のエクソンを含んでいたが,同様の数の欠失および重複が最後のエクソンを含んでいた。 最後に、欠失よりも重複の割合が大きいのは、完全な遺伝子を含んでいた。 すべての別個の(非冗長)Cnvのほぼ5分の1は完全な遺伝子を含み、4 0例では、Cnvはいくつかの隣接遺伝子を含み、少なくとも1 0本の染色体上に存在していた(補表1、2)。
CNVs
欠失の臨床分類は、この臨床コホートでより頻繁であり、大部分がLP/P変異体として報告された(図10B)。 1c)。 しかし、いくつかの欠失は、主に機能喪失(LOF)変異機構のない遺伝子のフレーム内変異体であったため、VUSとして分類された。 対照的に、重複の半分以上がVUに分類されました。 部分的な遺伝子重複のうち、359は末端エクソンを関与し、225は内部エクソンのみを関与した(図。 1d)。 内部エクソンのみを含む少なくとも166の複製は、転写物の読み取りフレームに悪影響を及ぼすと予測され、したがってLP/Pとして分類された(補足表2)。 少なくとも30の重複のために、我々は分割読み取りシーケンスデータに基づいて推定ブレークポイントを観察し、転写産物の読み取りフレームを混乱させるタンデム配置を予測した。 これは、遺伝子内複製は、典型的には、挿入転座などのより複雑な事象に対して、局所的なタンデム再配列であるという以前の主張をサポートしている。また、常染色体優性(AD)、常染色体劣性(AR)、およびX連鎖(XL)障害に関連する遺伝子におけるCnvの分布および接合性についても検討した(図18)。 1e、f)。 テストされた遺伝子のほとんどは、これらの遺伝パターンを持っていたので、この結果はバイアスを反映しているが、Cnvの大部分は、ADまたはXLの遺伝 LP/Pとして分類された2096のCnvのうち、85%はADまたはXL継承に関連する遺伝子であり、15%はAR継承に関連する遺伝子であった。 後者のうち、6.7%はホモ接合欠失であり、2.8%は他の対立遺伝子の病原性SNVに伴う化合物ヘテロ接合変化であった(AR障害の陽性分子診断を構成する;補足表1)、5.5%は単一のヘテロ接合事象であった。
このコホートのほぼすべてのCnvは、LOF機構を持つ遺伝子で発見されました(図。 1e)。 これらの遺伝子のほとんどのCnvは病原性として分類された欠失であったが、重複の半分以上がVUSとして分類された。 比較的、LOF機構を有さない3 0 4個の遺伝子は、ほとんどCnvを有しておらず、主にvusまたは良性に分類された(図1 0A)。 8×1 0−9)、および欠失よりも有意に多くの重複(p=1.
Cnvおよび罹患率
多数の多遺伝子パネルの分析では、疾患群間でCNVの有病率が変化していることが示された(図1)。 2a、b;補足表4)。 Cnvを有する遺伝子は、大部分が再発事象、大部分が固有事象、または両方の混合のいずれかを有していた(図1 0A)。 2c)。 いずれかのタイプの少なくとも10の病原性変異体をもたらしたパネルの中で、三分の一以上の病原性変異体の10%以上を占めるCnvを持っていました。 Cnvの数が最も多かった遺伝子パネルは,脊髄性筋萎縮症,Charcot–Marie–Tooth病,ジストロフィノパチーであった。 しかし、先天性心不全およびヘテロタクシー、リンチ症候群、肉腫、筋ジストロフィー、およびジストニアのパネルも多くのCnvを同定した。 対照的に、最も低いCNV頻度を有する遺伝子パネルは、慢性膵炎、RASopathies、心筋症、および遺伝性血栓症のためのものが含まれていた。
遺伝性癌症候群の遺伝子は、病原性変異体の中でCnvの高い(全体で8.3%、パネルの中で0〜50%の範囲)有病率を示した(図10B)。 2a;補足表3および4)。 これらの遺伝子で観察された1059の病原性Cnvのうち、219は一度だけ観察され、174は再発した。 BRCA1とBRCA2は、以前の研究と一致して、病原性変異体の間で6.1%(信頼区間:5.4–6.9%)の組み合わせCNV有病率を有していた(個別に、BRCA1 11。4%、BRCA2 1.7%)。15,19,20Cnvはまた、EPCAM、STK11、およびVHLなどの他の遺伝子、および低い全体的な診断収率を有する様々なパネル上の遺伝子に富化された。 我々のNGS法を使用して、我々はまた、90Cnv pms2の機能的遺伝子コピーのセグメント複製エクソン12-15で観察した(補足表1)。 最後に、25のCnvは、GREM1、TP53、およびAPCのプロモーター領域で観察された。
小児および希少疾患に関連する遺伝子におけるCnvは、病原性変異体の7.7%を占めた(パネル間で0-82%の範囲、図。 2c)。 我々は、早期小児てんかん脳症、ジュベール症候群、結節性硬化症、および脳海綿状奇形のためのパネルでCnvの最高頻度を発見した(補足表4)。 病原性Cnvによって最も頻繁に影響を受けた遺伝子は、NF1、NPHP1、およびTSC2であった(補足表3)。 てんかん遺伝子の中で、我々はUBE3A15q13.1とPRRT2 16p11.2では、おそらく再発細胞遺伝学的再編成されたを含むCNVsを観察しました。 我々は、繊毛症、RASopathies、骨形成不全、および嚢胞性線維症(補足表4)の遺伝子パネルで低いCNV頻度を観察した。 ヌーナン症候群および慢性膵炎のパネルは、病原性Cnvをほとんど同定しなかったが、少なくとも270人が試験され、60以上の病原性変異体が各パネルで報告された。
心血管疾患の遺伝子は、病原性変異体の間でCnvの有病率が比較的低いことを示した(全体で4.7%、パネルでは0-16.7%の範囲)。 Cnvの最高頻度は、心筋症および骨格筋疾患(包括的な心筋症パネルのサブセット)、家族性高コレステロール血症、およびBrugada症候群(補足表4)のパネルで発生した。 対照的に、不整脈(Brugada以外)および大動脈病のパネルでは非常に少数のCnvが見られたが、心筋病パネルでは病原性Cnvの有病率が最も低かった。 病原性Cnvの数が最も多い遺伝子は、LDLR、FBN1、PKP2、MYBPC3、およびRYR2であった(補足表3)。 明らかに高いCNV有病率をもたらすいくつかのパネルでは、全てではないにしてもほとんどのCnvは、1つまたは2つの遺伝子(例えば、ENGおよびLDLR)のみに 全体的な診断収率が最も高い心血管疾患のパネルは、cnvが枯渇し、ほとんどの陽性診断がSnvによって代わりに説明された不整脈および心筋症のものを除いて、Cnvの有病率が最も高い遺伝子を有していた。
神経疾患(主に神経筋疾患)の遺伝子パネルは、病原性変異体の中で遺伝子内Cnvの最も高い有病率を示した(全体で35%、パネル間で0-100%の範囲;図。 2a、c;補足表4)。 この結果は、pmp2 2における再発性遺伝子重複および相互欠失、SMN1における欠失、およびDMDにおける種々のCnvによって主に説明された(補足表3;図3)。 図2c,d;補足図2)。 カスタムNGSメソッドを使用して、我々は疑われる脊髄性筋萎縮症を持つ135人の間でSMN1削除の819例を発見し、SMN2コピーの範囲は0から5まで変化した。 PMP22、SMN1、およびDMDが除外された場合でも、神経疾患にリンクされている遺伝子における遺伝子内Cnvは、まだ私たちのコホートのすべての病原性変異体の6% 一般的にCnvによって影響を受ける神経疾患のための他の遺伝子には、PARK2、LAMA2、およびSPG11が含まれていました。
ベースラインCnvの分析
私たちの診断テストは、医師によって要求された疾患遺伝子に限定されていましたが、提示された臨床表現型とは無関係の多くの遺伝子も私たちのNGSアッセイで配列決定されました。 我々は143,142人で配列決定されたすべての1507遺伝子のデータを非同定し、これらのイベントのベースラインの有病率を推定するために非接収遺伝子における これらの表現型非依存性Cnvは、以後、「ベースラインCnv」と称される。”ベースラインCnvの検索は、個々の7-616遺伝子で行われ、合計16万個の単一遺伝子解析が行われました。 この検索は、4054遺伝子内Cnv(1465の異なるイベント)3772個の599遺伝子(補足表5)全体で得られた。 これらのCnvのほとんどは一度だけ存在したが、いくつかは2回から15回以上見られた(図。 3a;補足表6)。 しかし、累積的な再発イベントは、ベースラインCNV観測のほとんどを占めていました。 ベースラインCnvを有する遺伝子の大部分は、5つ以下の事象を有していた(図1 0A)。 3b)。 わずか47の遺伝子は、同一の再発事象を有する遺伝子と多数のユニークな事象を有する遺伝子の両方を含む、観察されたすべてのベースラインCnvの半分以 遺伝子内ベースラインCNVを持つほとんどの個体は、単一のイベントを持っていたが、146人の個体は、異なる染色体上の遺伝子に追加のCnvを持っていた。 平均して、我々は我々のアッセイで配列決定されたすべての3979遺伝子で1の割合でベースラインCNVを検出した。
このコホートにおいて臨床的に試験された遺伝子で同定されたCnvとは対照的に、ほとんどのベースライン内遺伝子性Cnvは重複していた(図1および図2)。 1c、dおよび3c)。 大部分はまた、A R遺伝子または確立されたLOF機構を欠いた遺伝子のヘテロ接合変異体であった(図1 0B)。 3d、e)。 少数のベースラインCnvは、AD遺伝またはLOF機構に関連する遺伝子で発生した(図1 6A、1 6B、1 6C)。 1e、fおよび3d、e)。 最も一般的なベースラインCnvは、NPHP1、NIPA1、MYH1 1、DNAI2、HFE2、SMN1、およびPMP2 2における全遺伝子事象、ならびにTFG、BBS9、CTNNA3、PARK2、KCTD7、DNAJC6、GLIS2、およびTUBB4Aにおける部分 疾患遺伝子におけるベースラインCnvの存在を説明し得る特性に関して、本発明者らは、これらのCnvのほぼ4 0%が全遺伝子を包含し、したがって転写物読 3c)。 さらに、LOF機構を有する遺伝子の重複の約90%は、末端エクソンを含む全遺伝子事象または部分遺伝子事象であったが、これらの遺伝子の欠失の半分だけが同じパターンを示した(補足表5)。
ベースラインCnvの全体的な有病率および特性を評価することに加えて、予測される臨床的影響を検討した。 我々は237ヘテロ接合欠失ADまたはXL継承とLOFメカニズムを持つ97遺伝子で観察した;ほとんどはPMP22、DMD、AARS、KCNQ1、FIG4、CHEK2、およびLRSAM1であった(補足表5と7)。 我々は、AR継承(NPHP1とSPG7)と男性のXL継承(DMD)を持つ単一の遺伝子で唯一の二つのホモ接合欠失を発見しました。 A r遺伝を有する遺伝子の他のすべてのホモ接合性Cnvs,または男性のXL遺伝を有する遺伝子のヘミ接合性Cnvsは重複であった。 さらに,ACMGによる医学的作用性を考慮した遺伝子においてCnvを特異的に観察した。21,22我々は、テストに使用されるアッセイに応じて、58の59ACMGリストされた遺伝子(PMS2を除く)の5,300-69,000人の個体におけるCnvを評価した。 合計46個の欠失および110個の重複が検出され、これらの遺伝子について試験された個体の間で最大0.8%(CI:0.58–1.11%)の頻度が示唆された。 MYH11、MYH7、KCNQ1、およびRYR2は、Cnvのほとんどが含まれていました。 具体的には、1 6個の遺伝子(KCNQ1、MYH1 1、MYH7、MYBPC3、PCSK9、BRCA1、RYR2、PKP2、TGFBR2、SMAD3、OTC、NF2、FBN1、DSP、DSC2、およびAPC)に欠失があり、その半数以上がLOF機構を有する(補表7)。