prevalența și proprietățile variației numărului de copii intragenici în genele bolii mendeliene

prevalența cnv-urilor intragenice într-o cohortă clinică mare

am testat diferite subseturi de 1507 gene la 143.515 persoane fără legătură, menționate pentru testarea panoului de gene NGS. Un total de ~4,8 milioane de analize cu o singură genă au fost finalizate. Dintre aproape 8,1 milioane de variante de toate tipurile, am identificat 2844 cnv-uri intragenice (1237 evenimente distincte). Aceste VNC au reprezentat 0,03% din toate variantele, 3,1% din variantele raportate și, în special, 9,1% din variantele clasificate ca LP/P (tabelul suplimentar 1 și figura suplimentară 1). Aceste variante au fost găsite în 384 de gene și au inclus 1810 ștergeri și 1034 duplicări, care împreună au reprezentat o prevalență de 1,9% în această cohortă, 4,4% în rândul persoanelor cu cel puțin o variantă raportată și, mai semnificativ, 9,8% în rândul persoanelor care au primit un raport cu o variantă LP/P de orice tip.

modele de apariție INTRAGENICĂ a CNV

cnv—urile au căzut într-una din cele trei categorii-evenimente rare unice, evenimente recurente comune și evenimente recurente de joasă frecvență (Fig. 1a). Fiecare categorie a reprezentat aproximativ o treime din totalul VNC observate. Marea majoritate a celor 384 de gene cu cnv au avut doar un CNV fiecare, dar aceste cnv-uri unice au reprezentat împreună mai puțin de 10% din toate evenimentele (Fig. 1b). În schimb, 31 din cele 384 de gene aveau 15 sau mai multe cnv-uri, dar acestea reprezentau aproape 70% din toate cnv-urile. În afară de frecvențe, au fost examinate locațiile intragenice și dimensiunile cnv-urilor, deoarece aceste proprietăți pot determina impactul clinic. Un sfert din cnv-uri au inclus doar un exon. Majoritatea cnv-urilor intragenice au fost evenimente cu gene parțiale multi-exonice și cele mai multe au cuprins numai exoni interni fără a implica exonii de codificare terminali (primul sau ultimul) (Fig. 1c, d). Printre cnv-urile cu gene parțiale care implică exoni terminali, mai multe ștergeri decât duplicări au inclus primii exoni, în timp ce un număr similar de ștergeri și duplicări au inclus ultimii exoni. În cele din urmă, o proporție mai mare de duplicări decât ștergeri a inclus gena completă. Aproape o cincime din toate cnv-urile distincte (non-redundante) au inclus o genă completă și, în 40 de cazuri, cnv-urile au cuprins mai multe gene vecine și au fost prezente pe cel puțin 10 cromozomi (tabelele suplimentare 1, 2).

Fig. 1: Frecvența, dimensiunea, interpretarea și distribuția variantelor de număr de copii (cnv) observate la genele testate clinic.

o histogramă care arată numărul de cnv-uri distincte observate în genele testate. Coloanele din grafic indică de câte ori au fost observate cnv-urile. Graficul liniar arată proporția cnv-urilor totale observate în fiecare coș de frecvență. De exemplu, prima coloană arată că aproape 900 de cnv-uri au apărut o singură dată și, în total, au reprezentat aproximativ 30% din totalul cnv-urilor. B histograma care arată numărul de gene care conțin CNVs în cohorta noastră clinică. Coloanele din diagramă arată creșteri incrementale ale numărului de cnv-uri observate într-o genă. Graficul liniar arată proporția cnv – urilor la creșteri arbitrare ale apariției CNV pe genă. De exemplu, aproape 200 de gene au avut doar 1 CNV, care împreună au reprezentat mai puțin de 10% din toate evenimentele. În schimb, aproximativ 30 de gene aveau mai mult de 15 cnv-uri Fiecare, ceea ce reprezenta aproape 70% din toate cnv-urile. c distribuția ștergerilor și duplicărilor în funcție de numărul de exoni afectați și de interpretarea clinică. Evenimentele citogenetice sunt definite ca cnv-uri contigue ale aceleiași zigozități care afectează genele vecine pe un singur cromozom. Unele evenimente genice întregi pot fi, de fapt, parte a evenimentelor citogenetice mai mari, dar nu sunt enumerate ca atare, deoarece alte gene din cadrul evenimentului citogenetic prezis au lipsit din testul nostru și, prin urmare, nu au fost disponibile pentru analiză. D numărarea duplicărilor și ștergerilor CNV detectate în datele clinice și inițiale ale CNV. Cnv – urile sunt împărțite în cele care includ o genă întreagă (clasele I, V), cel puțin ultimul exon (clasele II, VI), cel puțin primul exon (clasele III, VII) sau doar un Exon(e) intern (clasele IV, VIII). O structură genică generică este prezentată în partea de sus. Casetele verzi și violete denotă ” exoni terminali „și toate celelalte sunt” exoni interni”, așa cum este descris în text. Casetele goale indică exonii șterși. Această cifră presupune că duplicările intragenice apar în tandem, ceea ce se întâmplă adesea cu astfel de evenimente. Cnv-urile care implică doar regiuni promotoare nu sunt reprezentate în această cifră. Un tabel de contingență chi-pătrat al lui Pearson oferă o valoare p de p < 1 10-5 pentru duplicări și p = 1.5 10-5 pentru eliminări, indicând faptul că diferența de distribuție a VNC în cadrul genei nu se datorează doar diferențelor de eșantionare dintre VNC clinice și cele inițiale. E și F ștergeri și duplicări în genele testate clinic și interpretările lor. Diagrama din (e) prezintă gene cu mecanisme mutaționale de pierdere a funcției (LOF) și că în (f) prezintă gene fără mecanisme de pierdere a funcției (LOF). Majoritatea genelor incluse în panourile noastre au fost curate ca având mecanisme LOF. Se compară clasificarea clinică a fiecărui CNV, modelul de moștenire al genei cu CNV și zigozitatea variantelor. Pentru genele legate de X (XL), cnv-urile heterozigote la femei sunt prezentate separat de cnv-urile la bărbați. AD autozomal dominant, ar autozomal recesiv, F femelă, heterozigotă het, homozigotă hom, m mascul, varianta patogenă probabilă LP, varianta patogenă P, variante VUS cu semnificație incertă. Eticheta „patogenă” din c, E și f include VNC clasificate ca patogene și probabile patogene

clasificarea clinică a VNC

ștergerile au fost mai frecvente în această cohortă clinică și cele mai multe au fost raportate ca variante LP/P (Fig. 1c). Cu toate acestea, câteva ștergeri au fost clasificate ca vu, în primul rând pentru că erau variante în cadru în gene fără mecanisme mutaționale de pierdere a funcției (LOF). În schimb, mai mult de jumătate din duplicări au fost clasificate ca VU. Dintre duplicările genelor parțiale, 359 au implicat exoni terminali și 225 au implicat doar exoni interni (Fig. 1d). S-a estimat că cel puțin 166 de duplicări care includ numai exoni interni au un efect advers asupra cadrului de citire a transcrierii și, prin urmare, au fost clasificate ca LP/P (tabelul suplimentar 2). Pentru cel puțin 30 de duplicări, am observat puncte de întrerupere presupuse pe baza datelor secvenței de citire divizată și am prezis un aranjament tandem care ar perturba cadrul de citire a transcrierii. Aceasta susține afirmațiile anterioare conform cărora duplicările intragenice sunt de obicei rearanjări tandem localizate față de evenimente mai complicate, cum ar fi translocații inserționale.18

am luat în considerare, de asemenea, distribuția și zigozitatea cnv-urilor în genele asociate cu tulburări autosomale dominante (AD), autosomale recesive (AR) și X-legate (XL) (Fig. 1e, f). Marea majoritate a cnv – urilor au fost în gene asociate cu moștenirea AD sau XL, deși acest rezultat reflectă o prejudecată, deoarece majoritatea genelor testate aveau aceste modele de moștenire. Din 2096 cnv clasificate ca LP / P, 85% au fost în gene asociate cu moștenirea AD sau XL și 15% au fost în gene asociate cu moștenirea AR. Dintre acestea din urmă, 6,7% au fost deleții homozigote, 2,8% au fost modificări heterozigote compuse care însoțesc un SNV patogen pe cealaltă alelă (constituind un diagnostic molecular pozitiv pentru o tulburare AR; tabelul suplimentar 1) și 5,5% au fost evenimente heterozigote unice.

aproape toate cnv-urile din această cohortă au fost găsite în gene cu mecanisme LOF (Fig. 1e). Majoritatea cnv – urilor din aceste gene au fost deleții clasificate ca patogene, în timp ce mai mult de jumătate din duplicări au fost clasificate ca VU. Comparativ, cele 304 gene fără mecanisme LOF au avut puține cnv-uri, în mare parte clasificate ca VUS sau benigne (Fig. 1F), și semnificativ mai multe duplicări decât ștergeri (p = 1,8 inktual10-9).

cnv și morbiditatea

analiza unui număr mare de panouri multigene a arătat o prevalență variabilă a CNV în grupurile de boli (Fig. 2a,b; tabelul suplimentar 4). Genele cu cnv au avut fie evenimente în mare parte recurente, în mare parte evenimente unice, fie un amestec al ambelor (Fig. 2c). Dintre panourile care au produs cel puțin 10 variante patogene de orice tip, mai mult de o treime au avut cnv-uri reprezentând mai mult de 10% din variantele patogene. Panourile genetice care au obținut cel mai mare număr de cnv au fost cele pentru atrofia musculară spinală, boala Charcot–Marie–Tooth și distrofinopatiile, așa cum era de așteptat. Cu toate acestea, panourile pentru defecte cardiace congenitale și heterotaxie, sindrom Lynch, sarcom, distrofie musculară și distonie au identificat, de asemenea, multe cnv-uri. În schimb, panourile genetice cu cele mai mici frecvențe CNV au inclus cele pentru pancreatită cronică, Rasopatii, cardiomiopatii și trombofilie ereditară.

Fig. 2: variante patogene de copiere-număr (cnv) după genă și panou.

un panou din fiecare specialitate clinică este prezentat cu procentul de rapoarte pozitive care au inclus unul sau mai multe cnv patogene. Sunt incluse numai panouri care au fost testate clinic de cel puțin 100 de ori și au avut cel puțin 10 variante patogene de orice tip. Fiecare panou este reprezentat de un cerc. B proporția rapoartelor pozitive care au inclus cnv-uri patogene în diferite panouri. Aceste panouri au fost primele cinci cu cele mai multe variante patogene în fiecare specialitate clinică. c trei modele de apariție a CNV au fost perceptibile: evenimente recurente (de exemplu, în PMP22 și SMN1), evenimente unice predominant rare (de exemplu, în DMD și BRCA2) și un amestec al ambelor (de exemplu, în BRCA1 și MSH2). Numărul de variante distincte este prezentat în albastru, iar observațiile suplimentare/recurente ale acestor variante sunt prezentate în verde. d fracțiunea de variante patogene care au fost CNVs în diferite gene. Primele cinci gene cu cele mai patogene variante de orice tip sunt prezentate în fiecare specialitate clinică

genele pentru sindroamele de cancer ereditar au arătat o prevalență ridicată (8,3% în total; 0-50% în rândul panourilor) a cnv în rândul variantelor patogene (Fig. 2a; tabelele suplimentare 3 și 4). Dintre cele 1059 cnv patogene observate la aceste gene, 219 au fost observate o singură dată și 174 au fost recurente. BRCA1 și BRCA2 au avut o prevalență combinată a VNC de 6,1% (interval de încredere : 5,4–6,9%) în rândul variantelor patogene, în concordanță cu studiile anterioare (individual, BRCA1 11.4%, BRCA2 1,7%).15,19,20 cnv – uri au fost, de asemenea, îmbogățite în alte gene, cum ar fi EPCAM, STK11 și VHL, și în gene pe diferite panouri cu randamente generale de diagnostic scăzute. Folosind metoda noastră NGS, am observat, de asemenea, 90 CNVs în exonii duplicați segmental 12-15 ai copiei genei funcționale a PMS2 (tabelul suplimentar 1). În cele din urmă, 25 de cnv-uri au fost observate în regiunile promotor GREM1, TP53 și APC.

cnv-urile în genele asociate tulburărilor pediatrice și rare au reprezentat 7,7% din variantele patogene (intervalul 0-82% dintre panouri; Fig. 2c). S-au constatat cele mai mari frecvențe ale SNC în paneluri pentru encefalopatia epileptică infantilă timpurie, sindromul Joubert, scleroza tuberoasă și malformațiile cavernoase cerebrale (tabelul suplimentar 4). Genele cel mai frecvent afectate de cnv patogene au fost NF1, NPHP1 și TSC2 (tabelul suplimentar 3). Dintre genele epilepsiei, am observat cnv care implică UBE3A în 15q13.1 și PRRT2 în 16p11.2, care au fost probabil rearanjări citogenetice recurente. Am observat frecvențe CNV mai mici în panourile genetice pentru ciliopatii, Rasopatii, osteogeneză imperfectă și fibroză chistică (tabelul suplimentar 4). Panelurile de sindrom Noonan și pancreatită cronică au identificat foarte puține sau deloc cnv patogene, deși au fost testate cel puțin 270 de persoane și au fost raportate mai mult de 60 de variante patogene în fiecare panel.

genele pentru afecțiuni cardiovasculare au arătat o prevalență relativ mai scăzută a cnv în rândul variantelor patogene (4,7% în total; 0-16, 7% în rândul Panel-urilor). Cele mai mari frecvențe ale CNVs au apărut în paneluri pentru cardiomiopatie și boli ale mușchilor scheletici (un subset al panelului cardiomiopatie cuprinzătoare), hipercolesterolemie familială și sindrom Brugada (tabelul suplimentar 4). În schimb, foarte puține cnv-uri au fost găsite în panouri pentru aritmii (altele decât Brugada) și aortopatii, în timp ce panoul cardiomiopatii a avut cea mai mică prevalență a cnv-urilor patogene. Genele cu cel mai mare număr de cnv patogene au fost LDLR, FBN1, PKP2, MYBPC3 și RYR2 (tabelul suplimentar 3). În unele panouri cu o prevalență aparent ridicată a CNV, majoritatea, dacă nu toate cnv-urile au fost în doar una sau două gene (de exemplu, ENG și LDLR). Panourile pentru tulburările cardiovasculare cu cel mai mare randament global de diagnostic au avut, de asemenea, genele cu cea mai mare prevalență a cnv-urilor, cu excepția celor pentru aritmii și cardiomiopatii, care au fost epuizate de cnv-uri și în care cele mai multe diagnostice pozitive au fost explicate în schimb de SNV-uri.

panourile genetice pentru tulburări neurologice (în special tulburări neuromusculare în panourile noastre) au prezentat cea mai mare prevalență a cnv-urilor intragenice în rândul variantelor patogene (35% în total, 0-100% interval între panouri; Fig. 2a,c; tabelul suplimentar 4). Acest rezultat a fost explicat în mare măsură prin duplicarea genică recurentă și ștergerea reciprocă în PMP22, ștergerile în SMN1 și diverse cnv-uri în DMD (tabelul suplimentar 3; Fig. 2c, d; figura suplimentară 2). Folosind o metodă personalizată NGS, am găsit 135 de cazuri de ștergere SMN1 la 819 persoane cu suspiciune de atrofie musculară spinală, iar gama de copii SMN2 a variat de la 0 la 5. Chiar și atunci când PMP22, SMN1 și DMD au fost excluse, cnv-urile intragenice din genele legate de tulburările neurologice au reprezentat încă 6% din toate variantele patogene din cohorta noastră. Alte gene pentru tulburările neurologice frecvent afectate de cnv au inclus PARK2, LAMA2 și SPG11.

analiza cnv-urilor inițiale

testarea noastră diagnostică a fost limitată la genele bolii rechiziționate de medici, dar multe gene care nu au legătură cu fenotipul clinic prezent au fost, de asemenea, secvențiate pe testele NGS. Am dezidentificat datele pentru toate cele 1507 gene secvențiate la 143.142 de indivizi și am investigat apariția cnv-urilor intragenice la genele ne-rechiziționate pentru a estima prevalența inițială a acestor evenimente. Aceste cnv independente de fenotip sunt denumite în continuare ” cnv de bază.”O căutare a cnv-urilor de bază a fost efectuată în 7-616 gene pe individ pentru un total de 16 milioane de analize cu o singură genă. Această căutare a dat 4054 cnv-uri intragenice (1465 evenimente distincte) la 3772 de indivizi din 599 de gene (tabelul suplimentar 5). Majoritatea acestor cnv – uri au fost prezente o singură dată, dar câteva au fost văzute de 2 până la mai mult de 15 ori (Fig. 3a; tabelul suplimentar 6). Cu toate acestea, evenimentele recurente în ansamblu au reprezentat majoritatea observațiilor privind VNC de bază. Marea majoritate a genelor cu cnv-uri inițiale au avut cinci sau mai puține evenimente (Fig. 3b). Doar 47 de gene conțineau mai mult de jumătate din toate cnv-urile inițiale observate, incluzând atât genele cu evenimente recurente identice, cât și cele cu o multitudine de evenimente unice. Majoritatea persoanelor cu un CNV inițial intragenic au avut doar un singur eveniment, dar 146 de persoane au avut cnv-uri suplimentare în gene pe cromozomi diferiți. În medie, am detectat un CNV de bază la o rată de 1 din fiecare 3979 de gene secvențiate cu testele noastre.

Fig. 3: Variante de număr de copii la momentul inițial (cnv) care nu au legătură cu fenotipul clinic într-o cohortă mare.

semnificația clinică a acestor cnv nu a fost evaluată dincolo de ștergerea lor în genele listate de Colegiul American de Genetică Medicală și genomică cu mecanisme mutaționale cunoscute de pierdere a funcției (LOF). Cnv-urile din genele care aparțineau aceleiași specialități clinice ca cele comandate pentru testarea clinică au fost eliminate din analiză. Apelurile de calitate scăzută cu un singur exon au fost eliminate pentru a reduce potențialele apeluri fals pozitive. o histogramă care arată numărul de cnv-uri distincte observate în genele analizate pentru cnv-urile inițiale. Coloanele din grafic arată de câte ori au fost observate cnv-urile. Graficul liniar arată proporția cnv-urilor totale observate în fiecare coș de frecvență. De exemplu, prima coloană arată că peste 1100 de cnv-uri au apărut o singură dată și, în total, au reprezentat aproximativ 25% din totalul cnv-urilor. În schimb, ultima coloană indică faptul că 36 de VNC au fost depistate de peste 15 ori și au reprezentat peste 40% din toate VNC-urile inițiale. B histograma care arată numărul de gene care conțineau cnv-uri inițiale. Coloanele din diagramă arată creșteri incrementale ale numărului de cnv-uri observate într-o genă. Graficul liniar arată proporția cnv – urilor la creșteri arbitrare ale apariției CNV pe genă. De exemplu, aproape 240 de gene au avut doar un singur CNV și împreună aceste cnv au reprezentat aproximativ 6% din toate evenimentele. În schimb, aproximativ 45 de gene aveau mai mult de 15 cnv-uri Fiecare, ceea ce reprezenta puțin mai mult de 60% din toate cnv-urile. c distribuția cnv-urilor inițiale este prezentată în funcție de numărul de exoni afectați. Cnv-urile Multiexon includ trei clase de exoni terminali 5′, exoni interni și exoni terminali 3′. (D și E) sarcina cnv-urilor inițiale în gene în funcție de modul de moștenire și zigozitate. Cnv-urile în genele cu mecanisme mutaționale LOF sunt prezentate în partea (d), iar cele din genele fără mecanisme LOF sunt prezentate în partea (e). CNVs în genele legate de X (XL) au fost clasificate ca cele observate ca evenimente heterozigote la femei și evenimente hemizigote la bărbați. AD autozomal dominant, ar autozomal recesiv, F femeie, m bărbat, het heterozigot, hom homozigot

spre deosebire de VNC identificate în genele testate clinic din această cohortă, majoritatea VNC intragenice inițiale au fost duplicări (Fig. 1c, d și 3c). Majoritatea au fost, de asemenea, variante heterozigote în genele AR sau gene care nu aveau mecanisme LOF stabilite (Fig. 3d, e). O minoritate a cnv-urilor inițiale a apărut la genele asociate cu moștenirea AD sau mecanismele LOF (Fig. 1e, f și 3d, e). Cele mai frecvente cnv de bază au inclus evenimente genice întregi în NPHP1, NIPA1, MYH11, DNAI2, HFE2, SMN1 și PMP22 și evenimente genice parțiale în TFG, BBS9, CTNNA3, PARK2, KCTD7, DNAJC6, GLIS2 și TUBB4A (tabelul suplimentar 6). În ceea ce privește caracteristicile care pot explica existența cnv-urilor de bază în genele bolii, am observat că aproape 40% din aceste cnv-uri au cuprins o genă întreagă și, prin urmare, nu au perturbat direct cadrele de citire a transcrierii (Fig. 3c). Mai mult, aproximativ 90% din duplicările genelor cu mecanisme LOF au fost evenimente genice întregi sau evenimente genice parțiale, inclusiv un Exon terminal, în timp ce doar jumătate din ștergerile din aceste gene au prezentat aceleași tipare (tabelul suplimentar 5).

în plus față de evaluarea prevalenței globale și a proprietăților cnv-urilor inițiale, am luat în considerare implicațiile clinice prezise. Am observat 237 de deleții heterozigote în 97 de gene cu moștenire AD sau XL și mecanisme LOF; cele mai multe au fost în PMP22, DMD, AAR, KCNQ1, FIG4, CHEK2 și LRSAM1 (tabelele suplimentare 5 și 7). Am găsit doar două ștergeri homozigote în genele cu moștenire AR (NPHP1 și SPG7) și doar două ștergeri hemizigote într-o singură genă cu moștenire XL (DMD) la bărbați. Toate celelalte cnv-uri homozigote din genele cu moștenire AR sau cnv-uri hemizigote din genele cu moștenire XL la bărbați au fost duplicări. Mai mult, am observat cnv-uri în mod specific în gene cu considerente de acționabilitate medicală în conformitate cu ACMG.21,22 am evaluat CNVs la 58 din cele 59 de gene listate ACMG (excluzând PMS2) la 5.300-69.000 de indivizi, în funcție de testele utilizate pentru testare. Au fost detectate un total de 46 de ștergeri și 110 duplicări, sugerând o frecvență de până la 0,8% (CI: 0,58–1,11%) în rândul persoanelor testate pentru aceste gene. MYH11, MYH7, KCNQ1 și RYR2 conțineau majoritatea cnv-urilor. Mai exact, au existat ștergeri în 16 gene—KCNQ1, MYH11, MYH7, MYBPC3, PCSK9, BRCA1, RYR2, PKP2, TGFBR2, SMAD3, OTC, NF2, FBN1, DSP, DSC2 și APC—mai mult de jumătate dintre acestea au mecanisme LOF (tabelul suplimentar 7).

Lasă un răspuns

Adresa ta de email nu va fi publicată.

Previous post Cum se instalează NetBeans IDE 12 în Debian, Ubuntu și Linux Mint
Next post la 83 acest om rămâne pe marginea de taiere de fitness