prævalens og egenskaber ved intragenisk kopi-nummervariation i Mendelske sygdomsgener

prævalens af intrageniske CNV ‘ er i en stor klinisk kohorte

vi testede forskellige undergrupper af 1507 gener hos 143.515 ikke-relaterede individer henvist til diagnostisk NGS-genpaneltest. I alt ~4,8 millioner enkeltgenanalyser blev afsluttet. Blandt næsten 8,1 millioner varianter af alle typer identificerede vi 2844 intragene CNV ‘ er (1237 forskellige begivenheder). Disse CNV ‘ er tegnede sig for 0,03% af alle varianter, 3,1% af de rapporterede varianter, og især 9,1% af varianterne klassificeret som LP/P (supplerende tabel 1 og supplerende Figur 1). Disse varianter blev fundet på tværs af 384 gener og omfattede 1810 sletninger og 1034 duplikationer, som tilsammen repræsenterede en prævalens på 1,9% i denne kohorte, 4,4% blandt individer med mindst en rapporteret variant og mere signifikant 9,8% blandt individer, der modtog en rapport med en LP/P-variant af enhver type.

mønstre af intragenisk CNV—forekomst

CNV ‘ er faldt i en af tre kategorier-enkelte sjældne begivenheder, almindelige tilbagevendende begivenheder og lavfrekvente tilbagevendende begivenheder (Fig. 1a). Hver kategori repræsenterede ca.en tredjedel af alle observerede CNV ‘ er. Langt størstedelen af de 384 gener med CNV ‘er havde kun en CNV hver, men disse enkelte CNV’ er udgjorde tilsammen mindre end 10% af alle hændelser (Fig. 1b). I modsætning hertil havde 31 af de 384 gener 15 eller flere CNV ‘er, men disse repræsenterede næsten 70% af alle CNV’ er. Bortset fra frekvenser blev de intragene placeringer og størrelser af CNV ‘ er undersøgt, fordi disse egenskaber kan bestemme klinisk virkning. En fjerdedel af CNV ‘ erne omfattede kun en ekson. Et flertal af intragene CNV ‘ er var multi-eksoniske partielle genhændelser og omfattede mest kun interne eksoner uden at involvere de terminale (første eller sidste) kodende eksoner (Fig. 1c, d). Blandt partielle gen-CNV ‘ er, der involverede terminale eksoner, omfattede flere sletninger end duplikationer de første eksoner, mens et lignende antal sletninger og duplikationer omfattede de sidste eksoner. Endelig omfattede en større andel af duplikationer end sletninger det fulde gen. Næsten en femtedel af alle forskellige (ikke-overflødige) CNV ‘er omfattede et fuldt gen, og i 40 tilfælde omfattede CNV’ erne flere nabogener og var til stede på mindst 10 kromosomer (supplerende tabel 1, 2).

Fig. 1: Frekvens, størrelse, fortolkning og distribution af kopi-nummervarianter (CNV ‘ er) observeret i klinisk testede gener.

et Histogram, der viser antallet af forskellige CNV ‘ er observeret i de testede gener. Kolonnerne i diagrammet angiver antallet af gange CNV ‘ erne blev observeret. Linjegrafen viser andelen af de samlede observerede CNV ‘ er i hver frekvensbakke. For eksempel viser den første kolonne, at næsten 900 CNV ‘er forekom kun en gang og samlet set tegnede sig for omkring 30% af alle CNV’ er. B Histogram, der viser antallet af gener, der indeholdt CNV ‘ er i vores kliniske kohorte. Kolonnerne i diagrammet viser trinvise stigninger i antallet af CNV ‘ er observeret i et gen. Linjegrafen viser andelen af CNV ‘ er ved vilkårlige trin af CNV-forekomst pr. For eksempel havde næsten 200 gener kun 1 CNV, som tilsammen tegnede sig for mindre end 10% af alle hændelser. 30 gener mere end 15 CNV ‘er hver, hvilket repræsenterede næsten 70% af alle CNV’ er. C fordeling af sletninger og duplikationer efter antal berørte eksoner og ved klinisk fortolkning. Cytogenetiske hændelser defineres som sammenhængende CNV ‘ er med samme kindtand, der påvirker nabogener på et enkelt kromosom. Nogle helgenhændelser kan faktisk være en del af større cytogenetiske hændelser, men er ikke opført som sådan, fordi andre gener inden for den forudsagte cytogenetiske begivenhed var fraværende i vores assay og derfor ikke tilgængelige til analyse. D antal CNV-duplikationer og sletninger påvist i kliniske og baseline-CNV-data. CNV ‘ er er opdelt i dem, der inkluderer et helt gen (klasse i, V), i det mindste den sidste ekson (klasse II, VI), i det mindste den første ekson (klasse III, VII) eller kun en intern ekson(er) (klasse IV, VIII). En generisk genstruktur vises øverst. Grønne og lilla kasser betegner “terminale eksoner”, og alle andre er “interne eksoner”, som beskrevet i teksten. Tomme felter angiver slettede eksoner. Denne figur antager, at intragene duplikationer forekommer i tandem, hvilket ofte er tilfældet med sådanne begivenheder. CNV ‘ er, der kun involverer promotorregioner, er ikke repræsenteret i dette tal. En Pearsons chi-kvadreret beredskabstabel giver en p-værdi på p < 1 til 10-5 for duplikationer og p = 1.5, 10-5 for sletninger, hvilket indikerer, at forskellen i fordelingen af CNV ‘er på tværs af genet ikke kun skyldes prøveudtagningsforskelle mellem kliniske og baseline CNV’ er. E-og f-deletioner og duplikationer i klinisk testede gener og deres fortolkninger. Diagrammet i (e) viser gener med tab af funktion (LOF) mutationsmekanismer, og det i (f) viser gener uden tab af funktion (LOF) mekanismer. De fleste gener inkluderet i vores paneler blev kurateret som at have LOF-mekanismer. Den kliniske klassificering af hver CNV, arvemønster af genet med CNV, og kindositet af varianterne sammenlignes. HNV ‘er hos kvinder er vist separat fra CNV’ er hos mænd. AD autosomal dominant, AR autosomal recessiv, f kvinde, het heterosygøs, hom homosygøs, M mand, lp sandsynlig patogen variant, p patogen variant, VUS varianter af usikker betydning. Den” patogene “etiket i c, e og f omfatter CNV’ er klassificeret som patogene og sandsynlige patogene

klinisk klassificering af CNV ‘ er

sletninger var hyppigere i denne kliniske kohorte, og de fleste blev rapporteret som LP/P-varianter (Fig. 1c). Imidlertid blev et par sletninger klassificeret som Vu ‘ er, primært fordi de var in-frame varianter i gener uden tab af funktion (LOF) mutationsmekanismer. I modsætning hertil blev mere end halvdelen af duplikationerne klassificeret som Vu ‘ er. Blandt partielle genduplikationer involverede 359 terminale eksoner og 225 involverede kun interne eksoner (Fig. 1d). Mindst 166 duplikationer, der kun omfattede interne eksoner, blev forudsagt at have en negativ indvirkning på udskriftslæsningsrammen og blev derfor klassificeret som LP/P (supplerende tabel 2). I det mindste 30 duplikationer, vi observerede formodede breakpoints baseret på split-read sekvensdata og forudsagde et tandemarrangement, der ville forstyrre udskriftslæsningsrammen. Dette understøtter tidligere påstande om, at intragene duplikationer typisk er lokaliserede tandem-omlejringer versus mere komplicerede begivenheder såsom insertionelle translokationer.18

vi overvejede også fordelingen og kindositeten af CNV ‘ er i gener forbundet med autosomal dominant (AD), autosomal recessiv (AR) og K-linkede (HL) lidelser (Fig. 1e, f). Langt størstedelen af CNV ‘ er var i gener forbundet med AD-eller HL-arv, skønt dette resultat afspejler en bias, fordi de fleste af de testede gener havde disse arvemønstre. Af 2096 CNV ‘ er klassificeret som LP/P Var 85% i gener forbundet med AD eller HL arv og 15% var i gener forbundet med AR arv. Af sidstnævnte var 6,7% homosygøse sletninger, 2,8% var sammensatte heterosygøse ændringer, der ledsagede en patogen SNV på den anden allel (udgør en positiv molekylær diagnose for en AR-lidelse; supplerende tabel 1), og 5,5% var enkelt heterosygøse hændelser.

næsten alle CNV ‘ er i denne kohorte blev fundet i gener med LOF-mekanismer (Fig. 1e). De fleste CNV ‘er i disse gener var sletninger klassificeret som patogene, mens mere end halvdelen af duplikationerne blev klassificeret som Vu’ er. Til sammenligning havde de 304 gener uden LOF-mekanismer få CNV ‘er, for det meste klassificeret som Vu’ er eller godartede (Fig. 1f), og betydeligt flere duplikationer end sletninger (p = 1,8 til 10-9).

CNVs og morbiditet

analyse af et stort antal multigenpaneler viste varierende CNV-prævalens på tværs af sygdomsgrupper (Fig. 2A, b; supplerende Tabel 4). Gener med CNV ‘ er havde enten for det meste tilbagevendende begivenheder, for det meste unikke begivenheder eller en blanding af begge (Fig. 2c). Blandt paneler, der havde givet mindst 10 patogene varianter af enhver type, havde mere end en tredjedel CNV ‘ er, der tegner sig for mere end 10% af patogene varianter. Genpaneler, der gav det højeste antal CNV ‘ er, var dem til spinal muskelatrofi, Charcot–Marie–Tooth sygdom og dystrofinopatier, som forventet. Imidlertid identificerede paneler til medfødte hjertefejl og heterotaksi, Lynch-syndrom, sarkom, muskeldystrofi og dystoni også mange CNV ‘ er. I modsætning hertil inkluderede genpaneler med de laveste CNV-frekvenser dem til kronisk pancreatitis, Rasopatier, kardiomyopatier og arvelig trombofili.

Fig. 2: patogene kopi – nummervarianter (CNV ‘ er) efter gen og panel.

et panel i hver klinisk specialitet vises med procentdelen af positive rapporter, der omfattede en eller flere patogene CNV ‘ er. Kun paneler, der blev klinisk testet mindst 100 gange og havde mindst 10 patogene varianter af enhver type, er inkluderet. Hvert panel er repræsenteret af en cirkel. B andel af positive rapporter, der omfattede patogene CNV ‘ er i forskellige paneler. Disse paneler var de fem bedste med de mest patogene varianter i hver klinisk specialitet. c tre mønstre af CNV-forekomst kunne ses: tilbagevendende hændelser (f.eks. i PMP22 og SMN1), overvejende sjældne unikke hændelser (f. eks. i DMD og BRCA2) og en blanding af begge (f. eks. i BRCA1 og MSH2). Antallet af forskellige varianter er vist i blåt, og yderligere/tilbagevendende observationer af disse varianter er vist i grønt. D fraktion af patogene varianter, der var CNV ‘ er i forskellige gener. De fem bedste gener med de mest patogene varianter af enhver type er vist i hver klinisk specialitet

gener for arvelige kræftsyndromer viste et højt (8,3% samlet; 0-50% interval blandt paneler) prævalens af CNV ‘ er blandt patogene varianter (Fig. 2a; supplerende tabel 3 og 4). Blandt 1059 patogene CNV ‘ er observeret i disse gener blev 219 kun observeret en gang, og 174 var tilbagevendende. BRCA1 og BRCA2 havde en kombineret CNV-prævalens på 6,1% (konfidensinterval : 5,4–6,9%) blandt patogene varianter i overensstemmelse med tidligere undersøgelser (individuelt, BRCA1 11.4%, BRCA2 1, 7%).15,19,20 CNV ‘ er blev også beriget i andre gener, såsom EPCAM, STK11 og VHL, og i gener på forskellige paneler med lave samlede diagnostiske udbytter. Ved hjælp af vores NGS-metode observerede vi også 90 CNV ‘ er i de segmentalt duplikerede eksoner 12-15 af den funktionelle genkopi af PMS2 (supplerende tabel 1). Sidst blev der observeret 25 CNV ‘ er i promotorregioner i GREM1, TP53 og APC.

CNV ‘ er i gener forbundet med pædiatriske og sjældne lidelser tegnede sig for 7,7% af patogene varianter (0-82% interval blandt paneler; Fig. 2c). Vi fandt de højeste frekvenser af CNV ‘ er i paneler til tidlig infantil epileptisk encephalopati, Joubert syndrom, tuberøs sklerose og cerebrale kavernøse misdannelser (supplerende Tabel 4). De gener, der hyppigst blev påvirket af patogene CNV ‘ er, var NF1, NPHP1 og TSC2 (supplerende tabel 3). Blandt epilepsigener observerede vi CNV ‘ er, der involverede UBE3A i 15k13.1 og PRRT2 i 16p11.2, som sandsynligvis var tilbagevendende cytogenetiske omlejringer. Vi observerede lavere CNV-frekvenser i genpaneler for ciliopatier, Rasopatier, osteogenesis imperfecta og cystisk fibrose (supplerende Tabel 4). Noonan syndrom og kronisk pankreatitis paneler identificerede meget få eller ingen patogene CNV ‘ er, selvom mindst 270 individer blev testet, og mere end 60 patogene varianter blev rapporteret i hvert panel.

gener for hjerte-kar-sygdomme viste en forholdsvis lavere forekomst af CNV ‘ er blandt patogene varianter (4,7% samlet; 0-16, 7% interval blandt paneler). De højeste frekvenser af CNV ‘ er forekom i paneler til kardiomyopati og skeletmuskelsygdom (en delmængde af det omfattende kardiomyopati-panel), familiær hypercholesterolæmi og Brugada-syndrom (supplerende Tabel 4). I modsætning hertil blev der fundet meget få CNV ‘er i paneler til arytmier (bortset fra Brugada) og aortopatier, mens kardiomyopatierpanelet havde den laveste forekomst af patogene CNV’ er. Generne med det højeste antal patogene CNV ‘ er var LDLR, FBN1, PKP2, MYBPC3 og RYR2 (supplerende tabel 3). I nogle paneler, der tilsyneladende gav høj CNV-prævalens, var de fleste, hvis ikke alle CNV ‘ er, kun i et eller to gener (f.eks. Paneler til hjerte-kar-sygdomme med det højeste samlede diagnostiske udbytte havde også generne med den højeste forekomst af CNV ‘er, undtagen dem for arytmier og kardiomyopatier, som var udtømt af CNV’ er, og hvor de fleste positive diagnoser i stedet blev forklaret af SNV ‘ er.

Genpaneler til neurologiske lidelser (for det meste neuromuskulære lidelser i vores paneler) viste den højeste forekomst af intragene CNV ‘ er blandt patogene varianter (35% samlet, 0-100% interval blandt paneler; Fig. 2A, c; supplerende Tabel 4). Dette resultat blev i vid udstrækning forklaret ved tilbagevendende genduplikation og gensidig sletning i PMP22, sletninger i SMN1 og forskellige CNV ‘ er i DMD (supplerende tabel 3; Fig. 2C, d; supplerende figur 2). Ved hjælp af en brugerdefineret NGS-metode fandt vi 135 tilfælde af smn1-sletning blandt 819 personer med mistanke om spinal muskelatrofi, og udvalget af SMN2-kopier varierede fra 0 til 5. Selv når PMP22, SMN1 og DMD blev udelukket, repræsenterede intragene CNV ‘ er i gener forbundet med neurologiske lidelser stadig 6% af alle patogene varianter i vores kohorte. Andre gener for neurologiske lidelser, der ofte er påvirket af CNV ‘ er, omfattede PARK2, LAMA2 og SPG11.

analyse af CNV ‘ er ved baseline

vores diagnostiske test var begrænset til sygdomsgener, der blev rekvireret af læger, men mange gener, der ikke var relateret til den præsenterede kliniske fænotype, blev også sekventeret på vores NGS-analyser. Vi identificerede data for alle 1507 gener sekventeret hos 143.142 individer og undersøgte forekomsten af intragene CNV ‘ er i ikke-rekvirerede gener for at estimere baseline-prævalensen af disse hændelser. Disse fænotype-uafhængige CNV ‘ er betegnes i det følgende som “baseline CNV’ er.”En søgning efter baseline CNV’ er blev udført i 7-616 gener pr.individ for i alt 16 millioner enkeltgenanalyser. Denne søgning gav 4054 intragene CNV ‘ er (1465 forskellige hændelser) hos 3772 individer på tværs af 599 gener (supplerende tabel 5). De fleste af disse CNV ‘ er var kun til stede en gang, men nogle få blev set 2 til mere end 15 gange (Fig. 3a; supplerende Tabel 6). De tilbagevendende hændelser i aggregat tegnede sig imidlertid for de fleste af CNV-observationerne ved baseline. Langt størstedelen af gener med CNV ‘ er ved baseline havde fem eller færre hændelser (Fig. 3b). Kun 47 gener indeholdt mere end halvdelen af alle observerede CNV ‘ er ved baseline, inklusive begge gener med identiske tilbagevendende begivenheder og dem med en lang række unikke begivenheder. De fleste individer med en intragenisk baseline CNV havde kun en enkelt begivenhed, men 146 individer havde yderligere CNV ‘ er i gener på forskellige kromosomer. I gennemsnit opdagede vi en baseline CNV med en hastighed på 1 ud af hver 3979 gener sekventeret med vores analyser.

Fig. 3: Baseline copy-number variants (CNV ‘ er), der ikke er relateret til klinisk fænotype i en stor kohorte.

den kliniske betydning af disse CNV ‘ er blev ikke evalueret ud over, at de var sletninger i American College of Medical Genetics og Genomics–listede gener med kendt tab af funktion (LOF) mutationsmekanismer. CNV ‘ er i gener, der tilhørte den samme kliniske specialitet som dem, der blev bestilt til klinisk test, blev fjernet fra analysen. Opkald af lav kvalitet blev fjernet for at reducere potentielle falske positive opkald. et Histogram, der viser antallet af forskellige CNV ‘er observeret i gener analyseret for CNV’ er ved baseline. Kolonnerne i diagrammet viser antallet af gange CNV ‘ erne blev observeret. Linjegrafen viser andelen af de samlede observerede CNV ‘ er i hver frekvensbakke. For eksempel viser den første kolonne, at mere end 1100 CNV ‘er forekom kun en gang og samlet set tegnede sig for ca.25% af alle CNV’ er. I modsætning hertil angiver den sidste kolonne, at 36 CNV ‘er blev fundet mere end 15 gange og repræsenterede mere end 40% af alle CNV’ er ved baseline. B-Histogram, der viser antallet af gener, der indeholdt CNV ‘ er ved baseline. Kolonnerne i diagrammet viser trinvise stigninger i antallet af CNV ‘ er observeret i et gen. Linjegrafen viser andelen af CNV ‘ er ved vilkårlige trin af CNV-forekomst pr. For eksempel havde næsten 240 gener kun en CNV, og sammen tegnede disse CNV ‘ er sig for omkring 6% af alle hændelser. 45 gener mere end 15 CNV ‘er hver, hvilket repræsenterede lidt mere end 60% af alle CNV’ er. C fordeling af baseline CNV ‘ er vises i henhold til antallet af berørte eksoner. CNV’ er omfatter tre klasser af 5′ terminale eksoner, interne eksoner og 3 ‘ terminale eksoner. D og E) belastning af baseline CNV ‘ er i gener i henhold til Arv og kindositet. CNV ‘ er i gener med LOF-mutationsmekanismer er vist i Del (d), og dem i gener uden LOF-mekanismer er vist i Del (e). CNV ‘ er blev kategoriseret som dem, der blev observeret som heterosygøse hændelser hos kvinder og hemisygøse hændelser hos mænd. AD autosomal dominant, AR autosomal recessiv, F kvinde, m mand, het heterosygøs, hom homosygøs

i modsætning til CNV ‘er identificeret i de klinisk testede gener i denne kohorte var de fleste intragene CNV’ er ved baseline duplikationer (Fig. 1c, d og 3c). De fleste var også heterosygøse varianter i AR-gener eller gener, der manglede etablerede LOF-mekanismer (Fig. 3d, e). Et mindretal af baseline CNV ‘ er forekom i gener forbundet med AD-arv eller LOF-mekanismer (Fig. 1e, f og 3d, e). De mest almindelige CNV ‘ er ved baseline omfattede helgenhændelser i NPHP1, NIPA1, MYH11, DNAI2, HFE2, SMN1 og PMP22 og partielle genhændelser i TFG, BBS9, ctnna3, PARK2, KCTD7, DNAJC6, GLIS2 og TUBB4A (supplerende Tabel 6). Med hensyn til egenskaber, der kan forklare eksistensen af baseline CNV ‘er i sygdomsgener, bemærkede vi, at næsten 40% af disse CNV’ er omfattede et helt gen og derfor ikke direkte forstyrrede transkriptlæsningsrammer (Fig. 3c). 90% af duplikationerne i gener med LOF-mekanismer helgenhændelser eller partielle genhændelser inklusive en terminal ekson, hvorimod kun halvdelen af sletningerne i disse gener viste de samme mønstre (supplerende tabel 5).

ud over at vurdere den samlede prævalens og egenskaber ved CNV ‘ er ved baseline overvejede vi forudsagte kliniske implikationer. Vi observerede 237 heterosygøse sletninger i 97 gener med AD-eller LOF-mekanismer; de fleste var i PMP22, DMD, AARS, KCNK1, FIG4, CHEK2 og LRSAM1 (supplerende tabel 5 og 7). Vi fandt kun to homosygøse sletninger i gener med ar-arv (NPHP1 og SPG7) og kun to hemisygøse sletninger i et enkelt gen med HL-arv (DMD) hos mænd. Alle andre Homosygøse CNV ‘er i gener med ar-arv eller hemisygøse CNV’ er i gener med HL-arv hos mænd var duplikationer. Desuden observerede vi CNV ‘ er specifikt i gener med medicinske handlingsovervejelser i henhold til ACMG.21,22 vi evaluerede CNV ‘ er i 58 af de 59 ACMG-listede gener (eksklusive PMS2) hos 5.300–69.000 individer afhængigt af de analyser, der blev brugt til test. I alt 46 sletninger og 110 duplikationer blev påvist, hvilket tyder på en frekvens på op til 0,8% (CI: 0,58–1,11%) blandt individer testet for disse gener. MYH11, MYH7, KCNK1 og RYR2 indeholdt de fleste CNV ‘ er. Specifikt var der sletninger i 16 gener-KCNK1, MYH11, MYH7, MYBPC3, PCSK9, BRCA1, RYR2, PKP2, TGFBR2, SMAD3, OTC, NF2, FBN1, DSP, DSC2 og APC—hvoraf mere end halvdelen har LOF-mekanismer (supplerende Tabel 7).

Skriv et svar

Din e-mailadresse vil ikke blive publiceret.

Previous post Sådan installeres NetBeans IDE 12 i Debian, Ubuntu og Mint
Next post på 83 denne mand forbliver på forkant med fitness