prevalentie van intragenic CNV ‘ s in een groot klinisch cohort
we hebben verschillende subgroepen van 1507 genen getest bij 143.515 niet-verwante personen die voor diagnostische NGS gen panel testing waren bedoeld. Een totaal van ~ 4,8 miljoen single-gen analyses werden voltooid. Onder bijna 8,1 miljoen varianten van alle soorten, identificeerden we 2844 intragenic CNV ’s (1237 verschillende gebeurtenissen). Deze CNV ‘ s waren goed voor 0,03% van alle varianten, 3,1% van de gerapporteerde varianten, en met name 9,1% van de varianten geclassificeerd als LP/P (aanvullende tabel 1 en aanvullende figuur 1). Deze varianten werden gevonden over 384 genen en omvatten 1810 deleties en 1034 duplicaties, die samen een prevalentie van 1,9% in dit cohort vertegenwoordigden, 4,4% onder individuen met ten minste één gemelde variant, en belangrijker nog, 9,8% onder individuen die een rapport met een LP/P variant van om het even welk type ontvingen.
patronen van intragenic CNV voorkomen
CNV ‘ s vielen in een van de drie categorieën—enkele zeldzame voorvallen, vaak terugkerende voorvallen en laagfrequente terugkerende voorvallen (Fig. 1 bis). Elke categorie vertegenwoordigde ongeveer een derde van alle waargenomen CNV ‘ s. De overgrote meerderheid van de 384 genen met CNV ’s had slechts één CNV elk, maar deze afzonderlijke CNV’ s samen verantwoordelijk voor minder dan 10% van alle gebeurtenissen (Fig. 1 ter). 31 van de 384 genen daarentegen hadden 15 of meer CNV ‘s, maar deze vertegenwoordigden bijna 70% van alle CNV’ s. Afgezien van frequenties werden de intragene locaties en groottes van CNV ‘ s onderzocht, omdat deze eigenschappen de klinische impact kunnen bepalen. Een vierde van de CNV ‘ s bevatte slechts één exon. Een meerderheid van intragenic CNVs waren multi-exonic partial-gen gebeurtenissen, en de meeste omvatte alleen interne exonen zonder de terminale (eerste of laatste) codering exonen (Fig. 1c, d). Onder partieel-gen CNV ‘ s waarbij terminale exonen betrokken waren, omvatten meer verwijderingen dan duplicaties de eerste exonen, terwijl een vergelijkbaar aantal verwijderingen en duplicaties de laatste exonen omvatte. Tot slot, een groter deel van duplicaties dan schrappingen opgenomen het volledige gen. Bijna een vijfde van alle verschillende (niet-redundante) CNV ’s bevatte een volledig gen, en in 40 gevallen omvatte de CNV’ s verscheidene naburige genen en waren aanwezig op ten minste 10 chromosomen (aanvullende tabellen 1 en 2).
klinische classificatie van CNVs
deleties kwamen vaker voor in dit klinische cohort, en de meeste werden gerapporteerd als LP/P-varianten (Fig. 1c). Echter, een paar schrappingen werden geclassificeerd als VU ‘ s, vooral omdat ze in-frame varianten in genen zonder verlies-van-functie (LOF) mutationele mechanismen. Daarentegen werd meer dan de helft van de duplicaties geclassificeerd als VU ‘ s. Onder partiële-gen duplicaties, 359 betrokken terminale exonen en 225 betrokken alleen interne exonen (Fig. 1d). Ten minste 166 duplicaties die alleen interne exons omvatten, zouden een negatief effect hebben op het transcript-leesframe en daarom geclassificeerd als LP/P (aanvullende tabel 2). Voor ten minste 30 duplicaties, we waargenomen vermeende breekpunten op basis van split-read sequence data en voorspelde een tandem regeling die het transcript leesframe zou verstoren. Dit ondersteunt eerdere beweringen dat intragenic duplicaties zijn meestal gelokaliseerde tandem herschikkingen versus meer gecompliceerde gebeurtenissen zoals insertionele translocaties.18
we hebben ook gekeken naar de distributie en zygositeit van CNV ‘ s in genen geassocieerd met autosomaal dominante (AD), autosomaal recessieve (AR) en X-gebonden (XL) stoornissen (Fig. 1e, f). De overgrote meerderheid van CNVs was in genen verbonden aan AD of XL overerving, hoewel dit resultaat een vooroordeel weerspiegelt omdat de meeste geteste genen deze overerving patronen hadden. Van de 2096 CNV ‘ s geclassificeerd als LP/P, was 85% in genen geassocieerd met AD of XL-overerving en 15% in genen geassocieerd met AR-overerving. Van de laatste waren 6,7% homozygote deleties, 2,8% waren samengestelde heterozygote veranderingen die gepaard gaan met een pathogene SNV op het andere allel (die een positieve moleculaire diagnose voor een AR-stoornis vormen; aanvullende tabel 1), en 5,5% waren enkelvoudige heterozygote gebeurtenissen.
bijna alle CNV ‘ s in dit cohort werden gevonden in genen met LOF-mechanismen (Fig. 1e). De meeste CNVs in deze genen waren schrappingen geclassificeerd als pathogeen, terwijl meer dan de helft van de duplicaties werden geclassificeerd als VUS. Relatief, de 304 genen zonder LOF mechanismen hadden weinig CNV ‘ s, meestal geclassificeerd als VUS of goedaardig (Fig. 1f), en aanzienlijk meer duplicaties dan verwijderingen (p = 1,8×10-9).
CNV ‘ s en morbiditeit
analyse van een groot aantal multigeenpanelen toonde verschillende CNV-prevalentie in de verschillende ziektegroepen aan (Fig. 2a, b; aanvullende tabel 4). Genen met CNVs hadden ofwel meestal terugkerende gebeurtenissen, meestal unieke gebeurtenissen, of een mix van beide (Fig. 2c). Van panelen die ten minste 10 pathogene varianten van welke aard dan ook hadden opgeleverd, had meer dan een derde CNV ‘ s die meer dan 10% van de pathogene varianten voor hun rekening namen. Genpanelen die het hoogste aantal CNV ‘ s opleverden, waren die voor spinale spieratrofie, ziekte van Charcot–Marie–Tooth en dystrofinopathieën, zoals verwacht. Panels voor aangeboren hartafwijkingen en heterotaxie, Lynchsyndroom, sarcoom, spierdystrofie en dystonie identificeerden echter ook veel CNV ‘ s. Daarentegen omvatten de genpanelen met de laagste CNV-frequenties die voor chronische pancreatitis, Rasopathieën, cardiomyopathieën en erfelijke trombofilie.
genen voor erfelijke kankersyndromen vertoonden een hoge prevalentie van CNV ‘ s Onder pathogene varianten (Fig. 2a; aanvullende tabellen 3 en 4). Van de 1059 pathogene CNV ‘ s die in deze genen werden waargenomen, werden er 219 slechts één keer waargenomen en waren er 174 recidiverend. BRCA1 en BRCA2 hadden een gecombineerde CNV–prevalentie van 6,1% (betrouwbaarheidsinterval : 5,4-6,9%) onder pathogene varianten, in overeenstemming met eerdere studies (individueel, BRCA1 11.4%, BRCA2 1,7%).15,19,20 CNV ‘ s werden ook verrijkt in andere genen, zoals EPCAM, STK11 en VHL, en in genen op verschillende panelen met lage algemene diagnostische opbrengsten. Met behulp van onze NGS-methode hebben we ook 90 CNVs waargenomen in de gesegmenteerd gedupliceerde exons 12-15 van de functionele genkopie van PMS2 (aanvullende tabel 1). Als laatste werden 25 CNV ’s waargenomen in promotorregio’ s van GREM1, TP53 en APC.
CNV ‘ s in genen geassocieerd met pediatrische en zeldzame aandoeningen waren verantwoordelijk voor 7,7% van de pathogene varianten (0-82% range onder panels; Fig. 2c). We vonden de hoogste frequenties van CNVs in panelen voor vroege infantiele epileptische encefalopathie, Joubert syndroom, tubereuze sclerose, en cerebrale caverneuze misvormingen (aanvullende tabel 4). De genen die het vaakst werden beïnvloed door pathogene CNV ‘ s waren NF1, NPHP1 en TSC2 (aanvullende tabel 3). Onder epilepsiegenen zagen we CNV ‘ s met UBE3A in 15q13.1 en PRRT2 in 16p11.2, die waarschijnlijk terugkerende cytogenetische herschikkingen waren. We hebben lagere CNV frequenties waargenomen in genpanelen voor ciliopathieën, Rasopathieën, osteogenesis imperfecta en cystische fibrose (aanvullende tabel 4). Noonan syndroom en chronische pancreatitis panels identificeerden zeer weinig of geen pathogene CNV ‘ s, hoewel ten minste 270 individuen werden getest en meer dan 60 pathogene varianten werden gemeld in elk paneel.
genen voor cardiovasculaire aandoeningen vertoonden een relatief lagere prevalentie van CNV ‘ s Onder pathogene varianten (4,7% in totaal; 0-16, 7% bereik onder panels). De hoogste frequenties van CNV ‘ s traden op in panelen voor cardiomyopathie en skeletspierziekte (een subset van het uitgebreide cardiomyopathie-panel), familiaire hypercholesterolemie en het Brugada-syndroom (aanvullende tabel 4). Daarentegen werden zeer weinig CNV ’s gevonden in panels voor aritmieën (anders dan Brugada) en aortopathieën, terwijl het cardiomyopathiepanel de laagste prevalentie van pathogene CNV’ s had. De genen met het hoogste aantal pathogene CNV ‘ s waren LDLR, FBN1, PKP2, MYBPC3 en RYR2 (aanvullende tabel 3). In sommige panels met een blijkbaar hoge CNV-prevalentie, waren de meeste, zo niet alle CNV ‘ s in slechts één of twee genen (bijv. ENG en LDLR). Panels voor cardiovasculaire aandoeningen met de hoogste algemene diagnostische opbrengst hadden ook de genen met de hoogste prevalentie van CNV ‘s, behalve die voor aritmieën en cardiomyopathieën, die waren uitgeput van CNV’ s en waarbij de meeste positieve diagnoses werden verklaard door SNV ‘ s.
Genpanelen voor neurologische aandoeningen (meestal neuromusculaire aandoeningen in onze panelen) vertoonden de hoogste prevalentie van intragene CNV ‘ s Onder pathogene varianten (35% in totaal, 0-100% range onder panelen; Fig. 2a, c; aanvullende tabel 4). Dit resultaat werd grotendeels verklaard door recidiverende genduplicatie en wederzijdse deletie in PMP22, deleties in SMN1, en diverse CNVs in DMD (aanvullende tabel 3; Fig. 2c, d; aanvullend Figuur 2). Met behulp van een aangepaste NGS methode, vonden we 135 gevallen van SMN1 verwijdering onder 819 personen met vermoedelijke spinale spieratrofie, en het bereik van SMN2 kopieën varieerde van 0 tot 5. Zelfs wanneer PMP22, SMN1 en DMD werden uitgesloten, vertegenwoordigden intragenic CNVs in genen verbonden aan neurologische aandoeningen nog steeds 6% van alle pathogene varianten in onze cohort. Andere genen voor neurologische aandoeningen die vaak worden beïnvloed door CNV ‘ s waren PARK2, LAMA2 en SPG11.
analyse van uitgangswaarde CNVs
onze diagnostische tests waren beperkt tot ziektegenen die door artsen werden aangevraagd, maar veel genen die geen verband hielden met het presenterende klinische fenotype werden ook gesequenced op onze NGS-tests. We de-identificeerden gegevens voor alle 1507 genen sequenced in 143.142 individuen en onderzochten het voorkomen van intragenic CNVs in niet-gevraagde genen om de uitgangswaarde prevalentie van deze gebeurtenissen te schatten. Deze fenotype-onafhankelijke CNV ‘ s worden hierna “CNV’ s bij aanvang ” genoemd.”Een zoektocht naar basislijn CNVs werd uitgevoerd in 7-616 genen per individu voor een totaal van 16 miljoen single-gen analyses. Deze zoektocht leverde 4054 intragenic CNVs (1465 verschillende gebeurtenissen) op in 3772 individuen over 599 genen (aanvullende tabel 5). De meeste van deze CNV ‘ s waren slechts één keer aanwezig, maar een paar werden 2 tot meer dan 15 keer gezien (Fig. 3a; aanvullende tabel 6). De recurrente gebeurtenissen in totaal waren echter verantwoordelijk voor het merendeel van de CNV-waarnemingen in de uitgangssituatie. De overgrote meerderheid van de genen met CNV ‘ s bij aanvang had vijf of minder voorvallen (Fig. 3b). Slechts 47 genen bevatten meer dan de helft van alle waargenomen uitgangswaarden voor CNV ‘ s, inclusief beide genen met identieke terugkerende gebeurtenissen en genen met een veelheid aan unieke gebeurtenissen. De meeste individuen met een intragene uitgangswaarde CNV hadden slechts één enkele gebeurtenis, maar 146 individuen hadden extra CNV ‘ s in genen op verschillende chromosomen. Gemiddeld detecteerden we een uitgangswaarde CNV met een snelheid van 1 op elke 3979 genen die met onze tests werden gesequenced.
in tegenstelling tot CNV ’s geïdentificeerd in de klinisch geteste genen in dit cohort, waren de meeste intragene CNV’ s bij aanvang duplicaties (Fig ‘ s. 1c, d en 3c). De meeste waren ook heterozygote varianten in AR genen of genen die gevestigde LOF mechanismen ontbraken (Fig. 3d, e). Een minderheid van de uitgangswaarde CNVs kwam voor in genen geassocieerd met AD-overerving of LOF-mechanismen (Fig ‘ s. 1e, f en 3d, e). De meest voorkomende baseline CNVs opgenomen hele-gen gebeurtenissen in NPHP1, NIPA1, MYH11, DNAI2, HFE2, SMN1, en PMP22-en gedeeltelijk-gen gebeurtenissen in de TFG, BBS9, CTNNA3, PARK2, KCTD7, DNAJC6, GLIS2, en TUBB4A (Aanvullende Tabel 6). In termen van kenmerken die het bestaan van uitgangswaarde CNV ’s in ziektegenen kunnen verklaren, merkten we op dat bijna 40% van deze CNV’ s een heel gen omvatte en daarom niet direct transcript leesframes verstoorde (Fig. 3c). Bovendien waren ongeveer 90% van de duplicaties in genen met LOF-mechanismen hele-gen gebeurtenissen of partiële-gen gebeurtenissen met inbegrip van een terminale exon, terwijl slechts de helft van de deleties in deze genen dezelfde patronen vertoonde (aanvullende tabel 5).
naast het beoordelen van de totale prevalentie en eigenschappen van CNV ‘ s bij aanvang, hebben we ook de voorspelde klinische implicaties in aanmerking genomen. We observeerden 237 heterozygote deleties in 97 genen met AD-of XL-overerving en LOF-mechanismen; de meeste waren in PMP22, DMD, AARS, KCNQ1, FIG4, CHEK2 en LRSAM1 (aanvullende tabellen 5 en 7). We vonden slechts twee homozygote deleties in genen met AR-overerving (NPHP1 en SPG7) en slechts twee hemizygote deleties in een enkel gen met XL-overerving (DMD) bij mannen. Alle andere homozygote CNV ’s in genen met AR-overerving, of hemizygote CNV’ s in genen met XL-overerving bij mannen, waren duplicaties. Verder zagen we CNV ‘ s specifiek in genen met medische activeringsoverwegingen volgens de ACMG.21,22 we evalueerden CNVs in 58 van de 59 ACMG-genenlijst (exclusief PMS2) in 5.300–69.000 individuen, afhankelijk van de tests die worden gebruikt voor het testen. In totaal werden 46 deleties en 110 duplicaties gedetecteerd, wat wijst op een frequentie van maximaal 0,8% (BI: 0,58–1,11%) bij personen die op deze genen werden getest. MYH11, MYH7, KCNQ1 en RYR2 bevatten de meeste CNV ‘ s. Specifiek, er waren verwijderingen in 16 genen-KCNQ1, MYH11, MYH7, MYBPC3, PCSK9, BRCA1, RYR2, PKP2, TGFBR2, SMAD3, OTC, NF2, FBN1, DSP, DSC2, en APC—waarvan meer dan de helft LOF mechanismen (aanvullende tabel 7).