prævalens af intrageniske CNV ‘ er i en stor klinisk kohorte
vi testede forskellige undergrupper af 1507 gener hos 143.515 ikke-relaterede individer henvist til diagnostisk NGS-genpaneltest. I alt ~4,8 millioner enkeltgenanalyser blev afsluttet. Blandt næsten 8,1 millioner varianter af alle typer identificerede vi 2844 intragene CNV ‘ er (1237 forskellige begivenheder). Disse CNV ‘ er tegnede sig for 0,03% af alle varianter, 3,1% af de rapporterede varianter, og især 9,1% af varianterne klassificeret som LP/P (supplerende tabel 1 og supplerende Figur 1). Disse varianter blev fundet på tværs af 384 gener og omfattede 1810 sletninger og 1034 duplikationer, som tilsammen repræsenterede en prævalens på 1,9% i denne kohorte, 4,4% blandt individer med mindst en rapporteret variant og mere signifikant 9,8% blandt individer, der modtog en rapport med en LP/P-variant af enhver type.
mønstre af intragenisk CNV—forekomst
CNV ‘ er faldt i en af tre kategorier-enkelte sjældne begivenheder, almindelige tilbagevendende begivenheder og lavfrekvente tilbagevendende begivenheder (Fig. 1a). Hver kategori repræsenterede ca.en tredjedel af alle observerede CNV ‘ er. Langt størstedelen af de 384 gener med CNV ‘er havde kun en CNV hver, men disse enkelte CNV’ er udgjorde tilsammen mindre end 10% af alle hændelser (Fig. 1b). I modsætning hertil havde 31 af de 384 gener 15 eller flere CNV ‘er, men disse repræsenterede næsten 70% af alle CNV’ er. Bortset fra frekvenser blev de intragene placeringer og størrelser af CNV ‘ er undersøgt, fordi disse egenskaber kan bestemme klinisk virkning. En fjerdedel af CNV ‘ erne omfattede kun en ekson. Et flertal af intragene CNV ‘ er var multi-eksoniske partielle genhændelser og omfattede mest kun interne eksoner uden at involvere de terminale (første eller sidste) kodende eksoner (Fig. 1c, d). Blandt partielle gen-CNV ‘ er, der involverede terminale eksoner, omfattede flere sletninger end duplikationer de første eksoner, mens et lignende antal sletninger og duplikationer omfattede de sidste eksoner. Endelig omfattede en større andel af duplikationer end sletninger det fulde gen. Næsten en femtedel af alle forskellige (ikke-overflødige) CNV ‘er omfattede et fuldt gen, og i 40 tilfælde omfattede CNV’ erne flere nabogener og var til stede på mindst 10 kromosomer (supplerende tabel 1, 2).
klinisk klassificering af CNV ‘ er
sletninger var hyppigere i denne kliniske kohorte, og de fleste blev rapporteret som LP/P-varianter (Fig. 1c). Imidlertid blev et par sletninger klassificeret som Vu ‘ er, primært fordi de var in-frame varianter i gener uden tab af funktion (LOF) mutationsmekanismer. I modsætning hertil blev mere end halvdelen af duplikationerne klassificeret som Vu ‘ er. Blandt partielle genduplikationer involverede 359 terminale eksoner og 225 involverede kun interne eksoner (Fig. 1d). Mindst 166 duplikationer, der kun omfattede interne eksoner, blev forudsagt at have en negativ indvirkning på udskriftslæsningsrammen og blev derfor klassificeret som LP/P (supplerende tabel 2). I det mindste 30 duplikationer, vi observerede formodede breakpoints baseret på split-read sekvensdata og forudsagde et tandemarrangement, der ville forstyrre udskriftslæsningsrammen. Dette understøtter tidligere påstande om, at intragene duplikationer typisk er lokaliserede tandem-omlejringer versus mere komplicerede begivenheder såsom insertionelle translokationer.18
vi overvejede også fordelingen og kindositeten af CNV ‘ er i gener forbundet med autosomal dominant (AD), autosomal recessiv (AR) og K-linkede (HL) lidelser (Fig. 1e, f). Langt størstedelen af CNV ‘ er var i gener forbundet med AD-eller HL-arv, skønt dette resultat afspejler en bias, fordi de fleste af de testede gener havde disse arvemønstre. Af 2096 CNV ‘ er klassificeret som LP/P Var 85% i gener forbundet med AD eller HL arv og 15% var i gener forbundet med AR arv. Af sidstnævnte var 6,7% homosygøse sletninger, 2,8% var sammensatte heterosygøse ændringer, der ledsagede en patogen SNV på den anden allel (udgør en positiv molekylær diagnose for en AR-lidelse; supplerende tabel 1), og 5,5% var enkelt heterosygøse hændelser.
næsten alle CNV ‘ er i denne kohorte blev fundet i gener med LOF-mekanismer (Fig. 1e). De fleste CNV ‘er i disse gener var sletninger klassificeret som patogene, mens mere end halvdelen af duplikationerne blev klassificeret som Vu’ er. Til sammenligning havde de 304 gener uden LOF-mekanismer få CNV ‘er, for det meste klassificeret som Vu’ er eller godartede (Fig. 1f), og betydeligt flere duplikationer end sletninger (p = 1,8 til 10-9).
CNVs og morbiditet
analyse af et stort antal multigenpaneler viste varierende CNV-prævalens på tværs af sygdomsgrupper (Fig. 2A, b; supplerende Tabel 4). Gener med CNV ‘ er havde enten for det meste tilbagevendende begivenheder, for det meste unikke begivenheder eller en blanding af begge (Fig. 2c). Blandt paneler, der havde givet mindst 10 patogene varianter af enhver type, havde mere end en tredjedel CNV ‘ er, der tegner sig for mere end 10% af patogene varianter. Genpaneler, der gav det højeste antal CNV ‘ er, var dem til spinal muskelatrofi, Charcot–Marie–Tooth sygdom og dystrofinopatier, som forventet. Imidlertid identificerede paneler til medfødte hjertefejl og heterotaksi, Lynch-syndrom, sarkom, muskeldystrofi og dystoni også mange CNV ‘ er. I modsætning hertil inkluderede genpaneler med de laveste CNV-frekvenser dem til kronisk pancreatitis, Rasopatier, kardiomyopatier og arvelig trombofili.
gener for arvelige kræftsyndromer viste et højt (8,3% samlet; 0-50% interval blandt paneler) prævalens af CNV ‘ er blandt patogene varianter (Fig. 2a; supplerende tabel 3 og 4). Blandt 1059 patogene CNV ‘ er observeret i disse gener blev 219 kun observeret en gang, og 174 var tilbagevendende. BRCA1 og BRCA2 havde en kombineret CNV-prævalens på 6,1% (konfidensinterval : 5,4–6,9%) blandt patogene varianter i overensstemmelse med tidligere undersøgelser (individuelt, BRCA1 11.4%, BRCA2 1, 7%).15,19,20 CNV ‘ er blev også beriget i andre gener, såsom EPCAM, STK11 og VHL, og i gener på forskellige paneler med lave samlede diagnostiske udbytter. Ved hjælp af vores NGS-metode observerede vi også 90 CNV ‘ er i de segmentalt duplikerede eksoner 12-15 af den funktionelle genkopi af PMS2 (supplerende tabel 1). Sidst blev der observeret 25 CNV ‘ er i promotorregioner i GREM1, TP53 og APC.
CNV ‘ er i gener forbundet med pædiatriske og sjældne lidelser tegnede sig for 7,7% af patogene varianter (0-82% interval blandt paneler; Fig. 2c). Vi fandt de højeste frekvenser af CNV ‘ er i paneler til tidlig infantil epileptisk encephalopati, Joubert syndrom, tuberøs sklerose og cerebrale kavernøse misdannelser (supplerende Tabel 4). De gener, der hyppigst blev påvirket af patogene CNV ‘ er, var NF1, NPHP1 og TSC2 (supplerende tabel 3). Blandt epilepsigener observerede vi CNV ‘ er, der involverede UBE3A i 15k13.1 og PRRT2 i 16p11.2, som sandsynligvis var tilbagevendende cytogenetiske omlejringer. Vi observerede lavere CNV-frekvenser i genpaneler for ciliopatier, Rasopatier, osteogenesis imperfecta og cystisk fibrose (supplerende Tabel 4). Noonan syndrom og kronisk pankreatitis paneler identificerede meget få eller ingen patogene CNV ‘ er, selvom mindst 270 individer blev testet, og mere end 60 patogene varianter blev rapporteret i hvert panel.
gener for hjerte-kar-sygdomme viste en forholdsvis lavere forekomst af CNV ‘ er blandt patogene varianter (4,7% samlet; 0-16, 7% interval blandt paneler). De højeste frekvenser af CNV ‘ er forekom i paneler til kardiomyopati og skeletmuskelsygdom (en delmængde af det omfattende kardiomyopati-panel), familiær hypercholesterolæmi og Brugada-syndrom (supplerende Tabel 4). I modsætning hertil blev der fundet meget få CNV ‘er i paneler til arytmier (bortset fra Brugada) og aortopatier, mens kardiomyopatierpanelet havde den laveste forekomst af patogene CNV’ er. Generne med det højeste antal patogene CNV ‘ er var LDLR, FBN1, PKP2, MYBPC3 og RYR2 (supplerende tabel 3). I nogle paneler, der tilsyneladende gav høj CNV-prævalens, var de fleste, hvis ikke alle CNV ‘ er, kun i et eller to gener (f.eks. Paneler til hjerte-kar-sygdomme med det højeste samlede diagnostiske udbytte havde også generne med den højeste forekomst af CNV ‘er, undtagen dem for arytmier og kardiomyopatier, som var udtømt af CNV’ er, og hvor de fleste positive diagnoser i stedet blev forklaret af SNV ‘ er.
Genpaneler til neurologiske lidelser (for det meste neuromuskulære lidelser i vores paneler) viste den højeste forekomst af intragene CNV ‘ er blandt patogene varianter (35% samlet, 0-100% interval blandt paneler; Fig. 2A, c; supplerende Tabel 4). Dette resultat blev i vid udstrækning forklaret ved tilbagevendende genduplikation og gensidig sletning i PMP22, sletninger i SMN1 og forskellige CNV ‘ er i DMD (supplerende tabel 3; Fig. 2C, d; supplerende figur 2). Ved hjælp af en brugerdefineret NGS-metode fandt vi 135 tilfælde af smn1-sletning blandt 819 personer med mistanke om spinal muskelatrofi, og udvalget af SMN2-kopier varierede fra 0 til 5. Selv når PMP22, SMN1 og DMD blev udelukket, repræsenterede intragene CNV ‘ er i gener forbundet med neurologiske lidelser stadig 6% af alle patogene varianter i vores kohorte. Andre gener for neurologiske lidelser, der ofte er påvirket af CNV ‘ er, omfattede PARK2, LAMA2 og SPG11.
analyse af CNV ‘ er ved baseline
vores diagnostiske test var begrænset til sygdomsgener, der blev rekvireret af læger, men mange gener, der ikke var relateret til den præsenterede kliniske fænotype, blev også sekventeret på vores NGS-analyser. Vi identificerede data for alle 1507 gener sekventeret hos 143.142 individer og undersøgte forekomsten af intragene CNV ‘ er i ikke-rekvirerede gener for at estimere baseline-prævalensen af disse hændelser. Disse fænotype-uafhængige CNV ‘ er betegnes i det følgende som “baseline CNV’ er.”En søgning efter baseline CNV’ er blev udført i 7-616 gener pr.individ for i alt 16 millioner enkeltgenanalyser. Denne søgning gav 4054 intragene CNV ‘ er (1465 forskellige hændelser) hos 3772 individer på tværs af 599 gener (supplerende tabel 5). De fleste af disse CNV ‘ er var kun til stede en gang, men nogle få blev set 2 til mere end 15 gange (Fig. 3a; supplerende Tabel 6). De tilbagevendende hændelser i aggregat tegnede sig imidlertid for de fleste af CNV-observationerne ved baseline. Langt størstedelen af gener med CNV ‘ er ved baseline havde fem eller færre hændelser (Fig. 3b). Kun 47 gener indeholdt mere end halvdelen af alle observerede CNV ‘ er ved baseline, inklusive begge gener med identiske tilbagevendende begivenheder og dem med en lang række unikke begivenheder. De fleste individer med en intragenisk baseline CNV havde kun en enkelt begivenhed, men 146 individer havde yderligere CNV ‘ er i gener på forskellige kromosomer. I gennemsnit opdagede vi en baseline CNV med en hastighed på 1 ud af hver 3979 gener sekventeret med vores analyser.
i modsætning til CNV ‘er identificeret i de klinisk testede gener i denne kohorte var de fleste intragene CNV’ er ved baseline duplikationer (Fig. 1c, d og 3c). De fleste var også heterosygøse varianter i AR-gener eller gener, der manglede etablerede LOF-mekanismer (Fig. 3d, e). Et mindretal af baseline CNV ‘ er forekom i gener forbundet med AD-arv eller LOF-mekanismer (Fig. 1e, f og 3d, e). De mest almindelige CNV ‘ er ved baseline omfattede helgenhændelser i NPHP1, NIPA1, MYH11, DNAI2, HFE2, SMN1 og PMP22 og partielle genhændelser i TFG, BBS9, ctnna3, PARK2, KCTD7, DNAJC6, GLIS2 og TUBB4A (supplerende Tabel 6). Med hensyn til egenskaber, der kan forklare eksistensen af baseline CNV ‘er i sygdomsgener, bemærkede vi, at næsten 40% af disse CNV’ er omfattede et helt gen og derfor ikke direkte forstyrrede transkriptlæsningsrammer (Fig. 3c). 90% af duplikationerne i gener med LOF-mekanismer helgenhændelser eller partielle genhændelser inklusive en terminal ekson, hvorimod kun halvdelen af sletningerne i disse gener viste de samme mønstre (supplerende tabel 5).
ud over at vurdere den samlede prævalens og egenskaber ved CNV ‘ er ved baseline overvejede vi forudsagte kliniske implikationer. Vi observerede 237 heterosygøse sletninger i 97 gener med AD-eller LOF-mekanismer; de fleste var i PMP22, DMD, AARS, KCNK1, FIG4, CHEK2 og LRSAM1 (supplerende tabel 5 og 7). Vi fandt kun to homosygøse sletninger i gener med ar-arv (NPHP1 og SPG7) og kun to hemisygøse sletninger i et enkelt gen med HL-arv (DMD) hos mænd. Alle andre Homosygøse CNV ‘er i gener med ar-arv eller hemisygøse CNV’ er i gener med HL-arv hos mænd var duplikationer. Desuden observerede vi CNV ‘ er specifikt i gener med medicinske handlingsovervejelser i henhold til ACMG.21,22 vi evaluerede CNV ‘ er i 58 af de 59 ACMG-listede gener (eksklusive PMS2) hos 5.300–69.000 individer afhængigt af de analyser, der blev brugt til test. I alt 46 sletninger og 110 duplikationer blev påvist, hvilket tyder på en frekvens på op til 0,8% (CI: 0,58–1,11%) blandt individer testet for disse gener. MYH11, MYH7, KCNK1 og RYR2 indeholdt de fleste CNV ‘ er. Specifikt var der sletninger i 16 gener-KCNK1, MYH11, MYH7, MYBPC3, PCSK9, BRCA1, RYR2, PKP2, TGFBR2, SMAD3, OTC, NF2, FBN1, DSP, DSC2 og APC—hvoraf mere end halvdelen har LOF-mekanismer (supplerende Tabel 7).