prevalența cnv-urilor intragenice într-o cohortă clinică mare
am testat diferite subseturi de 1507 gene la 143.515 persoane fără legătură, menționate pentru testarea panoului de gene NGS. Un total de ~4,8 milioane de analize cu o singură genă au fost finalizate. Dintre aproape 8,1 milioane de variante de toate tipurile, am identificat 2844 cnv-uri intragenice (1237 evenimente distincte). Aceste VNC au reprezentat 0,03% din toate variantele, 3,1% din variantele raportate și, în special, 9,1% din variantele clasificate ca LP/P (tabelul suplimentar 1 și figura suplimentară 1). Aceste variante au fost găsite în 384 de gene și au inclus 1810 ștergeri și 1034 duplicări, care împreună au reprezentat o prevalență de 1,9% în această cohortă, 4,4% în rândul persoanelor cu cel puțin o variantă raportată și, mai semnificativ, 9,8% în rândul persoanelor care au primit un raport cu o variantă LP/P de orice tip.
modele de apariție INTRAGENICĂ a CNV
cnv—urile au căzut într-una din cele trei categorii-evenimente rare unice, evenimente recurente comune și evenimente recurente de joasă frecvență (Fig. 1a). Fiecare categorie a reprezentat aproximativ o treime din totalul VNC observate. Marea majoritate a celor 384 de gene cu cnv au avut doar un CNV fiecare, dar aceste cnv-uri unice au reprezentat împreună mai puțin de 10% din toate evenimentele (Fig. 1b). În schimb, 31 din cele 384 de gene aveau 15 sau mai multe cnv-uri, dar acestea reprezentau aproape 70% din toate cnv-urile. În afară de frecvențe, au fost examinate locațiile intragenice și dimensiunile cnv-urilor, deoarece aceste proprietăți pot determina impactul clinic. Un sfert din cnv-uri au inclus doar un exon. Majoritatea cnv-urilor intragenice au fost evenimente cu gene parțiale multi-exonice și cele mai multe au cuprins numai exoni interni fără a implica exonii de codificare terminali (primul sau ultimul) (Fig. 1c, d). Printre cnv-urile cu gene parțiale care implică exoni terminali, mai multe ștergeri decât duplicări au inclus primii exoni, în timp ce un număr similar de ștergeri și duplicări au inclus ultimii exoni. În cele din urmă, o proporție mai mare de duplicări decât ștergeri a inclus gena completă. Aproape o cincime din toate cnv-urile distincte (non-redundante) au inclus o genă completă și, în 40 de cazuri, cnv-urile au cuprins mai multe gene vecine și au fost prezente pe cel puțin 10 cromozomi (tabelele suplimentare 1, 2).
clasificarea clinică a VNC
ștergerile au fost mai frecvente în această cohortă clinică și cele mai multe au fost raportate ca variante LP/P (Fig. 1c). Cu toate acestea, câteva ștergeri au fost clasificate ca vu, în primul rând pentru că erau variante în cadru în gene fără mecanisme mutaționale de pierdere a funcției (LOF). În schimb, mai mult de jumătate din duplicări au fost clasificate ca VU. Dintre duplicările genelor parțiale, 359 au implicat exoni terminali și 225 au implicat doar exoni interni (Fig. 1d). S-a estimat că cel puțin 166 de duplicări care includ numai exoni interni au un efect advers asupra cadrului de citire a transcrierii și, prin urmare, au fost clasificate ca LP/P (tabelul suplimentar 2). Pentru cel puțin 30 de duplicări, am observat puncte de întrerupere presupuse pe baza datelor secvenței de citire divizată și am prezis un aranjament tandem care ar perturba cadrul de citire a transcrierii. Aceasta susține afirmațiile anterioare conform cărora duplicările intragenice sunt de obicei rearanjări tandem localizate față de evenimente mai complicate, cum ar fi translocații inserționale.18
am luat în considerare, de asemenea, distribuția și zigozitatea cnv-urilor în genele asociate cu tulburări autosomale dominante (AD), autosomale recesive (AR) și X-legate (XL) (Fig. 1e, f). Marea majoritate a cnv – urilor au fost în gene asociate cu moștenirea AD sau XL, deși acest rezultat reflectă o prejudecată, deoarece majoritatea genelor testate aveau aceste modele de moștenire. Din 2096 cnv clasificate ca LP / P, 85% au fost în gene asociate cu moștenirea AD sau XL și 15% au fost în gene asociate cu moștenirea AR. Dintre acestea din urmă, 6,7% au fost deleții homozigote, 2,8% au fost modificări heterozigote compuse care însoțesc un SNV patogen pe cealaltă alelă (constituind un diagnostic molecular pozitiv pentru o tulburare AR; tabelul suplimentar 1) și 5,5% au fost evenimente heterozigote unice.
aproape toate cnv-urile din această cohortă au fost găsite în gene cu mecanisme LOF (Fig. 1e). Majoritatea cnv – urilor din aceste gene au fost deleții clasificate ca patogene, în timp ce mai mult de jumătate din duplicări au fost clasificate ca VU. Comparativ, cele 304 gene fără mecanisme LOF au avut puține cnv-uri, în mare parte clasificate ca VUS sau benigne (Fig. 1F), și semnificativ mai multe duplicări decât ștergeri (p = 1,8 inktual10-9).
cnv și morbiditatea
analiza unui număr mare de panouri multigene a arătat o prevalență variabilă a CNV în grupurile de boli (Fig. 2a,b; tabelul suplimentar 4). Genele cu cnv au avut fie evenimente în mare parte recurente, în mare parte evenimente unice, fie un amestec al ambelor (Fig. 2c). Dintre panourile care au produs cel puțin 10 variante patogene de orice tip, mai mult de o treime au avut cnv-uri reprezentând mai mult de 10% din variantele patogene. Panourile genetice care au obținut cel mai mare număr de cnv au fost cele pentru atrofia musculară spinală, boala Charcot–Marie–Tooth și distrofinopatiile, așa cum era de așteptat. Cu toate acestea, panourile pentru defecte cardiace congenitale și heterotaxie, sindrom Lynch, sarcom, distrofie musculară și distonie au identificat, de asemenea, multe cnv-uri. În schimb, panourile genetice cu cele mai mici frecvențe CNV au inclus cele pentru pancreatită cronică, Rasopatii, cardiomiopatii și trombofilie ereditară.
genele pentru sindroamele de cancer ereditar au arătat o prevalență ridicată (8,3% în total; 0-50% în rândul panourilor) a cnv în rândul variantelor patogene (Fig. 2a; tabelele suplimentare 3 și 4). Dintre cele 1059 cnv patogene observate la aceste gene, 219 au fost observate o singură dată și 174 au fost recurente. BRCA1 și BRCA2 au avut o prevalență combinată a VNC de 6,1% (interval de încredere : 5,4–6,9%) în rândul variantelor patogene, în concordanță cu studiile anterioare (individual, BRCA1 11.4%, BRCA2 1,7%).15,19,20 cnv – uri au fost, de asemenea, îmbogățite în alte gene, cum ar fi EPCAM, STK11 și VHL, și în gene pe diferite panouri cu randamente generale de diagnostic scăzute. Folosind metoda noastră NGS, am observat, de asemenea, 90 CNVs în exonii duplicați segmental 12-15 ai copiei genei funcționale a PMS2 (tabelul suplimentar 1). În cele din urmă, 25 de cnv-uri au fost observate în regiunile promotor GREM1, TP53 și APC.
cnv-urile în genele asociate tulburărilor pediatrice și rare au reprezentat 7,7% din variantele patogene (intervalul 0-82% dintre panouri; Fig. 2c). S-au constatat cele mai mari frecvențe ale SNC în paneluri pentru encefalopatia epileptică infantilă timpurie, sindromul Joubert, scleroza tuberoasă și malformațiile cavernoase cerebrale (tabelul suplimentar 4). Genele cel mai frecvent afectate de cnv patogene au fost NF1, NPHP1 și TSC2 (tabelul suplimentar 3). Dintre genele epilepsiei, am observat cnv care implică UBE3A în 15q13.1 și PRRT2 în 16p11.2, care au fost probabil rearanjări citogenetice recurente. Am observat frecvențe CNV mai mici în panourile genetice pentru ciliopatii, Rasopatii, osteogeneză imperfectă și fibroză chistică (tabelul suplimentar 4). Panelurile de sindrom Noonan și pancreatită cronică au identificat foarte puține sau deloc cnv patogene, deși au fost testate cel puțin 270 de persoane și au fost raportate mai mult de 60 de variante patogene în fiecare panel.
genele pentru afecțiuni cardiovasculare au arătat o prevalență relativ mai scăzută a cnv în rândul variantelor patogene (4,7% în total; 0-16, 7% în rândul Panel-urilor). Cele mai mari frecvențe ale CNVs au apărut în paneluri pentru cardiomiopatie și boli ale mușchilor scheletici (un subset al panelului cardiomiopatie cuprinzătoare), hipercolesterolemie familială și sindrom Brugada (tabelul suplimentar 4). În schimb, foarte puține cnv-uri au fost găsite în panouri pentru aritmii (altele decât Brugada) și aortopatii, în timp ce panoul cardiomiopatii a avut cea mai mică prevalență a cnv-urilor patogene. Genele cu cel mai mare număr de cnv patogene au fost LDLR, FBN1, PKP2, MYBPC3 și RYR2 (tabelul suplimentar 3). În unele panouri cu o prevalență aparent ridicată a CNV, majoritatea, dacă nu toate cnv-urile au fost în doar una sau două gene (de exemplu, ENG și LDLR). Panourile pentru tulburările cardiovasculare cu cel mai mare randament global de diagnostic au avut, de asemenea, genele cu cea mai mare prevalență a cnv-urilor, cu excepția celor pentru aritmii și cardiomiopatii, care au fost epuizate de cnv-uri și în care cele mai multe diagnostice pozitive au fost explicate în schimb de SNV-uri.
panourile genetice pentru tulburări neurologice (în special tulburări neuromusculare în panourile noastre) au prezentat cea mai mare prevalență a cnv-urilor intragenice în rândul variantelor patogene (35% în total, 0-100% interval între panouri; Fig. 2a,c; tabelul suplimentar 4). Acest rezultat a fost explicat în mare măsură prin duplicarea genică recurentă și ștergerea reciprocă în PMP22, ștergerile în SMN1 și diverse cnv-uri în DMD (tabelul suplimentar 3; Fig. 2c, d; figura suplimentară 2). Folosind o metodă personalizată NGS, am găsit 135 de cazuri de ștergere SMN1 la 819 persoane cu suspiciune de atrofie musculară spinală, iar gama de copii SMN2 a variat de la 0 la 5. Chiar și atunci când PMP22, SMN1 și DMD au fost excluse, cnv-urile intragenice din genele legate de tulburările neurologice au reprezentat încă 6% din toate variantele patogene din cohorta noastră. Alte gene pentru tulburările neurologice frecvent afectate de cnv au inclus PARK2, LAMA2 și SPG11.
analiza cnv-urilor inițiale
testarea noastră diagnostică a fost limitată la genele bolii rechiziționate de medici, dar multe gene care nu au legătură cu fenotipul clinic prezent au fost, de asemenea, secvențiate pe testele NGS. Am dezidentificat datele pentru toate cele 1507 gene secvențiate la 143.142 de indivizi și am investigat apariția cnv-urilor intragenice la genele ne-rechiziționate pentru a estima prevalența inițială a acestor evenimente. Aceste cnv independente de fenotip sunt denumite în continuare ” cnv de bază.”O căutare a cnv-urilor de bază a fost efectuată în 7-616 gene pe individ pentru un total de 16 milioane de analize cu o singură genă. Această căutare a dat 4054 cnv-uri intragenice (1465 evenimente distincte) la 3772 de indivizi din 599 de gene (tabelul suplimentar 5). Majoritatea acestor cnv – uri au fost prezente o singură dată, dar câteva au fost văzute de 2 până la mai mult de 15 ori (Fig. 3a; tabelul suplimentar 6). Cu toate acestea, evenimentele recurente în ansamblu au reprezentat majoritatea observațiilor privind VNC de bază. Marea majoritate a genelor cu cnv-uri inițiale au avut cinci sau mai puține evenimente (Fig. 3b). Doar 47 de gene conțineau mai mult de jumătate din toate cnv-urile inițiale observate, incluzând atât genele cu evenimente recurente identice, cât și cele cu o multitudine de evenimente unice. Majoritatea persoanelor cu un CNV inițial intragenic au avut doar un singur eveniment, dar 146 de persoane au avut cnv-uri suplimentare în gene pe cromozomi diferiți. În medie, am detectat un CNV de bază la o rată de 1 din fiecare 3979 de gene secvențiate cu testele noastre.
spre deosebire de VNC identificate în genele testate clinic din această cohortă, majoritatea VNC intragenice inițiale au fost duplicări (Fig. 1c, d și 3c). Majoritatea au fost, de asemenea, variante heterozigote în genele AR sau gene care nu aveau mecanisme LOF stabilite (Fig. 3d, e). O minoritate a cnv-urilor inițiale a apărut la genele asociate cu moștenirea AD sau mecanismele LOF (Fig. 1e, f și 3d, e). Cele mai frecvente cnv de bază au inclus evenimente genice întregi în NPHP1, NIPA1, MYH11, DNAI2, HFE2, SMN1 și PMP22 și evenimente genice parțiale în TFG, BBS9, CTNNA3, PARK2, KCTD7, DNAJC6, GLIS2 și TUBB4A (tabelul suplimentar 6). În ceea ce privește caracteristicile care pot explica existența cnv-urilor de bază în genele bolii, am observat că aproape 40% din aceste cnv-uri au cuprins o genă întreagă și, prin urmare, nu au perturbat direct cadrele de citire a transcrierii (Fig. 3c). Mai mult, aproximativ 90% din duplicările genelor cu mecanisme LOF au fost evenimente genice întregi sau evenimente genice parțiale, inclusiv un Exon terminal, în timp ce doar jumătate din ștergerile din aceste gene au prezentat aceleași tipare (tabelul suplimentar 5).
în plus față de evaluarea prevalenței globale și a proprietăților cnv-urilor inițiale, am luat în considerare implicațiile clinice prezise. Am observat 237 de deleții heterozigote în 97 de gene cu moștenire AD sau XL și mecanisme LOF; cele mai multe au fost în PMP22, DMD, AAR, KCNQ1, FIG4, CHEK2 și LRSAM1 (tabelele suplimentare 5 și 7). Am găsit doar două ștergeri homozigote în genele cu moștenire AR (NPHP1 și SPG7) și doar două ștergeri hemizigote într-o singură genă cu moștenire XL (DMD) la bărbați. Toate celelalte cnv-uri homozigote din genele cu moștenire AR sau cnv-uri hemizigote din genele cu moștenire XL la bărbați au fost duplicări. Mai mult, am observat cnv-uri în mod specific în gene cu considerente de acționabilitate medicală în conformitate cu ACMG.21,22 am evaluat CNVs la 58 din cele 59 de gene listate ACMG (excluzând PMS2) la 5.300-69.000 de indivizi, în funcție de testele utilizate pentru testare. Au fost detectate un total de 46 de ștergeri și 110 duplicări, sugerând o frecvență de până la 0,8% (CI: 0,58–1,11%) în rândul persoanelor testate pentru aceste gene. MYH11, MYH7, KCNQ1 și RYR2 conțineau majoritatea cnv-urilor. Mai exact, au existat ștergeri în 16 gene—KCNQ1, MYH11, MYH7, MYBPC3, PCSK9, BRCA1, RYR2, PKP2, TGFBR2, SMAD3, OTC, NF2, FBN1, DSP, DSC2 și APC—mai mult de jumătate dintre acestea au mecanisme LOF (tabelul suplimentar 7).