Prevalens og egenskaper av intragenisk kopi-nummer variasjon I Mendelian sykdom gener

Prevalens av intragenisk CNVs i en stor klinisk kohort

vi testet ulike undergrupper av 1507 gener i 143,515 urelaterte individer referert for diagnostisk ngs gen panel testing. Totalt ~4,8 millioner enkeltgenanalyser ble fullført. Blant nesten 8,1 millioner varianter av alle typer, identifiserte vi 2844 intrageniske Cnver (1237 forskjellige hendelser). Disse Cnvene utgjorde 0,03% av alle varianter, 3,1% av rapporterte varianter, og spesielt 9,1% av varianter klassifisert SOM LP / P (Supplerende Tabell 1 Og Supplerende Figur 1). Disse variantene ble funnet på tvers av 384 gener og inkluderte 1810 slettinger og 1034 duplikasjoner, som sammen representerte en prevalens på 1,9% i denne kohorten, 4,4% blant individer med minst en rapportert variant, og mer signifikant, 9,8% blant individer som mottok en rapport med EN lp/P-variant av enhver type.

Mønstre av intragen CNV forekomst

CNVs falt inn i en av tre kategorier—enkle sjeldne hendelser, vanlige tilbakevendende hendelser, og lavfrekvente tilbakevendende hendelser (Fig. 1a). Hver kategori representerte omtrent en tredjedel av alle observerte Cnver. De aller fleste av de 384 gener Med Cnv hadde bare EN CNV hver, men disse enkelt Cnv sammen utgjorde mindre enn 10% av alle hendelser (Fig. 1b). I motsetning til dette hadde 31 av de 384 genene 15 Eller flere Cnver, men disse representerte nesten 70% av Alle Cnver. Bortsett fra frekvenser ble Intrageniske steder og størrelser Av Cnver undersøkt, fordi disse egenskapene kan bestemme klinisk innvirkning. En fjerdedel av CNVs inkluderte bare en exon. Et flertall av intrageniske Cnver var multi-eksoniske partielle genhendelser, og de fleste omfattet bare interne eksoner uten å involvere terminale (første eller siste) kodende eksoner (Fig. 1c, d). Blant partielle Gen-Cnver som involverte terminale eksoner, inkluderte flere slettinger enn duplikasjoner de første eksonene, mens et tilsvarende antall slettinger og duplikasjoner inkluderte de siste eksonene. Til slutt inkluderte en større andel av duplikasjoner enn slettinger hele genet. Nesten en femtedel av alle distinkte (ikke-redundante) Cnver inkluderte et fullt gen, og i 40 tilfeller omfattet Cnvene flere nabogener og var tilstede på minst 10 kromosomer (Tilleggstabeller 1, 2).

Fig. 1: Frekvens, størrelse, tolkning og distribusjon av copy-number varianter (CNVs) observert i klinisk testede gener.

Et Histogram som viser antall distinkte Cnver observert i de testede gener. Kolonnene i diagrammet angir antall Ganger Cnvene ble observert. Linjediagrammet viser andelen av totalt observerte Cnver i hver frekvensbøtte. For eksempel viser den første kolonnen at nesten 900 Cnver skjedde bare en gang, og samlet utgjorde omtrent 30% av Alle Cnver. B Histogram som viser antall gener som inneholdt CNVs i vår kliniske kohort. Kolonnene i diagrammet viser inkrementelle økninger i antall Cnver observert i et gen. Linjediagrammet viser andelen CNVs ved vilkårlig økning AV CNV-forekomst per gen. For eksempel hadde nesten 200 gener bare 1 CNV, som sammen utgjorde mindre enn 10% av alle hendelser. 30 gener hadde mer enn 15 Cnver hver, som representerte nesten 70% av Alle Cnver. C Fordeling av slettinger og duplikasjoner etter antall berørte eksoner og ved klinisk tolkning. Cytogenetiske hendelser er definert som sammenhengende Cnver av samme zygositet som påvirker nabogener på et enkelt kromosom. Noen helgenhendelser kan faktisk være en del av større cytogenetiske hendelser, men er ikke oppført som sådan fordi andre gener innenfor den forventede cytogenetiske hendelsen var fraværende fra vår analyse og derfor utilgjengelige for analyse. D-Telling AV CNV-duplikasjoner og-slettinger påvist i kliniske OG baseline CNV-data. CNVs er delt inn i de som inkluderer et helt gen (klasser i, V), minst den siste exon (klasser II, VI), minst den første exon(klasser III, VII), eller bare en intern exon (s) (klasser IV, VIII). En generisk genstruktur er vist øverst. Grønne og lilla bokser betegne «terminal exons» og alle andre er «interne exons,» som beskrevet i teksten. Tomme bokser indikerer slettede eksoner. Denne figuren antar at intrageniske duplikasjoner forekommer i tandem, noe som ofte er tilfelle med slike hendelser. CNVs som involverer bare promotorregioner er ikke representert i denne figuren. En Pearsons kjikvadrerte beredskapstabell gir en p-verdi på p < 1×10-5 for dupliseringer og p = 1.5×10-5 for slettinger, noe som indikerer at forskjellen i fordelingen Av Cnver på tvers av genet ikke bare skyldes prøvetakingsforskjeller mellom kliniske Og baseline Cnver. E Og f Slettinger og duplikasjoner i klinisk testede gener og deres tolkninger. Diagrammet i (e) viser gener med tap av funksjon (LOF) mutasjonsmekanismer, og at i (f) viser gener uten tap av funksjon (LOF) mekanismer. De fleste gener inkludert i våre paneler ble kuratert som å ha LOF mekanismer. Den kliniske klassifiseringen av HVER CNV, arvemønster av genet MED CNV og zygositet av variantene sammenlignes. FOR x-koblede (XL) gener, er heterozygote Cnver hos kvinner vist separat fra Cnver hos menn. AD autosomal dominant, AR autosomal recessiv, f hunn, het heterozygot, hom homozygot, m hann, lp sannsynlig patogen variant, p patogen variant, VUS varianter av usikker betydning. Den» Patogene » etiketten i c, e og f inkluderer Cnver klassifisert som patogen og sannsynlig patogen

Klinisk klassifisering Av CNVs

Slettinger var hyppigere i denne kliniske kohorten, og de fleste ble rapportert SOM lp / P-varianter (Fig. 1c). Noen få slettinger ble imidlertid klassifisert SOM VUS, hovedsakelig fordi de var in-frame varianter i gener uten tap av funksjon (LOF) mutasjonsmekanismer. I motsetning ble mer enn halvparten av duplikatene klassifisert SOM VUS. Blant partielle genduplikasjoner involverte 359 terminale eksoner og 225 involverte bare interne eksoner (Fig. 1d). Minst 166 dupliseringer som omfattet bare interne eksoner ble spådd å ha en negativ effekt på avlesningsrammen og ble derfor klassifisert SOM LP / P (Supplerende Tabell 2). I minst 30 duplikasjoner observerte vi antatte brytepunkter basert på split-read-sekvensdata og spådde et tandemarrangement som ville forstyrre transkripsjonslesningsrammen. Dette støtter tidligere påstander om at intrageniske dupliseringer vanligvis er lokaliserte tandemomarrangementer versus mer kompliserte hendelser som innsettingstranslokasjoner.18

vi vurderte også fordeling og zygositet Av CNVs i gener assosiert med autosomal dominant (AD), autosomal recessiv (AR) og X-bundet (XL) lidelser (Fig. 1e, f). De aller fleste CNVs var i gener assosiert MED AD eller XL arv, selv om dette resultatet gjenspeiler en bias fordi de fleste testede gener hadde disse arvemønstrene. Av 2096 Cnver klassifisert SOM LP / P var 85% i gener assosiert MED AD eller XL arv og 15% var i gener assosiert med AR arv. Av de sistnevnte var 6,7% homozygote slettinger, 2,8% var sammensatte heterozygote endringer som fulgte med en patogen SNV på det andre allelet (utgjør en positiv molekylær diagnose for EN AR-lidelse; Supplerende Tabell 1), og 5,5% var enkle heterozygote hendelser.

Nesten Alle Cnver i denne kohorten ble funnet i gener MED LOF mekanismer (Fig. 1e). De fleste Cnver i disse genene var slettinger klassifisert som patogene, mens mer enn halvparten av duplikasjoner ble klassifisert SOM VUS. Til sammenligning hadde 304-gener uten LOF-mekanismer få Cnver, hovedsakelig klassifisert SOM VUS eller godartet (Fig. 1f), og betydelig flere dupliseringer enn slettinger(p = 1,8×10-9).

CNVs og morbiditet

Analyse av et stort antall multigenpaneler viste varierende CNV-prevalens på tvers av sykdomsgrupper (Fig. 2a, b; Supplerende Tabell 4). Gener med CNVs hadde enten for det meste tilbakevendende hendelser, for det meste unike hendelser, eller en blanding av begge (Fig. 2c). Blant paneler som hadde gitt minst 10 patogene varianter av noe slag, hadde Mer enn en tredjedel Cnver som sto for større enn 10% av patogene varianter. Genpaneler som ga det høyeste antallet Cnver var de for spinal muskelatrofi, Charcot–Marie–Tooth sykdom og dystrofinopatier, som forventet. Imidlertid identifiserte paneler for medfødte hjertefeil og heterotakse, Lynch syndrom, sarkom, muskeldystrofi og dystoni også mange Cnver. I kontrast inkluderte genpaneler med de laveste CNV-frekvensene de for kronisk pankreatitt, Rasopatier, kardiomyopatier og arvelig trombofili.

Fig. 2: Patogene copy-number varianter (CNVs) av gen og panel.

Et Panel i hver klinisk spesialitet er vist med prosentandelen av positive rapporter som inkluderte en eller flere patogene Cnver. Bare paneler som ble klinisk testet minst 100 ganger og hadde minst 10 patogene varianter av noe slag, er inkludert. Hvert panel er representert av en sirkel. B Andel positive rapporter som inkluderte patogene Cnver i ulike paneler. Disse panelene var topp fem med de mest patogene varianter i hver klinisk spesialitet. C Tre MØNSTRE av CNV-forekomst var merkbare: tilbakevendende hendelser (f. eks. i PMP22 OG SMN1), hovedsakelig sjeldne unike hendelser (f. eks. I DMD OG BRCA2), og en blanding av begge (f. eks. I BRCA1 og MSH2). Antallet distinkte varianter er vist i blått, og ytterligere / tilbakevendende observasjoner av disse variantene er vist i grønt. d Fraksjon av patogene varianter som Var Cnver i forskjellige gener. De fem beste gener med de mest patogene varianter av noe slag er vist i hver klinisk spesialitet

Gener for arvelige kreft syndromer viste en høy (8,3% totalt, 0-50% utvalg blant paneler) prevalens av CNVs blant patogene varianter (Fig. 2a; Utfyllende Tabell 3 og 4). Blant 1059 patogene Cnver observert i disse genene, ble 219 observert bare en gang og 174 var tilbakevendende. BRCA1 og BRCA2 hadde en KOMBINERT CNV-prevalens på 6,1% (konfidensintervall : 5,4–6,9%) blant patogene varianter, i samsvar med tidligere studier (individuelt, BRCA1 11.4%, BRCA2 1,7% ).15,19,20 CNVs ble også beriket i andre gener, SOM EPCAM, STK11 og VHL, og i gener på ulike paneler med lave samlede diagnostiske utbytter. Ved hjelp AV VÅR ngs-metode observerte vi også 90 Cnver i segmentalt dupliserte eksoner 12-15 av den funksjonelle genkopien AV PMS2 (Supplerende Tabell 1). Sist ble Det observert 25 Cnver i promotorregioner AV GREM1, TP53 og APC.

CNVs i gener assosiert med pediatriske og sjeldne lidelser utgjorde 7,7% av patogene varianter (0-82% utvalg blant paneler; Fig. 2c). Vi fant de høyeste frekvensene Av Cnver i paneler for tidlig infantil epileptisk encefalopati, Joubert syndrom, tuberøs sklerose og cerebrale kavernøse misdannelser(Supplerende Tabell 4). Genene som oftest påvirkes av patogene Cnver var NF1, NPHP1 og TSC2 (Supplerende Tabell 3). Blant epilepsigener observerte Vi Cnver som involverte UBE3A i 15Q13.1 og PRRT2 i 16p11.2, som sannsynligvis var tilbakevendende cytogenetiske rearrangementer. Vi observerte lavere CNV-frekvenser i genpaneler for ciliopatier, Rasopatier, osteogenesis imperfecta og cystisk fibrose(Supplerende Tabell 4). Noonan syndrom og paneler med kronisk pankreatitt identifiserte svært få eller ingen patogene Cnver, selv om minst 270 individer ble testet og mer enn 60 patogene varianter ble rapportert i hvert panel.

Gener for kardiovaskulære lidelser viste en relativt lavere prevalens av Cnver blant patogene varianter (4,7% totalt; 0-16, 7% rekkevidde blant paneler). De høyeste frekvensene av CNVs forekom i paneler for kardiomyopati og skjelettmuskelsykdom (en undergruppe av comprehensive cardiomyopathy panel), familiær hyperkolesterolemi og Brugada syndrom (Supplerende Tabell 4). Derimot ble det funnet svært få Cnver i paneler for arytmier (annet enn Brugada) og aortopatier, mens kardiomyopatipanelet hadde den laveste forekomsten av patogene Cnver. Genene med høyest antall patogene Cnver var LDLR, FBN1, PKP2, MYBPC3 og RYR2 (Supplerende Tabell 3). I noen paneler ga tilsynelatende høy CNV prevalens, de fleste Om ikke alle CNVs var i bare ett eller to gener(F. EKS ENG OG LDLR). Paneler for kardiovaskulære lidelser med høyest samlet diagnostisk utbytte hadde også gener med høyest forekomst Av CNVs, unntatt de for arytmier og kardiomyopatier, som var utarmet Av CNVs og hvor de fleste positive diagnoser i stedet ble forklart Av SNVs.

Genpaneler for nevrologiske lidelser (for det meste nevromuskulære lidelser i våre paneler) viste den høyeste forekomsten av intragen CNVs blant patogene varianter (35% totalt, 0-100% rekkevidde blant paneler; Fig. 2a, c; Supplerende Tabell 4). Dette utfallet ble i stor grad forklart av tilbakevendende gen duplisering og gjensidig sletting I PMP22, slettinger I SMN1, og ulike Cnver I DMD (Supplerende Tabell 3; Fig. 2c, d; Supplerende Figur 2). Ved hjelp AV en tilpasset NGS-metode fant vi 135 tilfeller AV smn1-sletting blant 819 personer med mistanke om spinal muskelatrofi, og spekteret AV SMN2-kopier varierte fra 0 til 5. Selv når PMP22, SMN1 og DMD ble ekskludert, representerte intrageniske Cnver i gener knyttet til nevrologiske lidelser fortsatt 6% av alle patogene varianter i vår kohort. Andre gener for nevrologiske lidelser som ofte påvirkes Av CNVs, inkluderte PARK2, LAMA2 og SPG11.

Analyse av baseline CNVs

vår diagnostiske testing var begrenset til sykdomsgener rekvirert av leger, men mange gener som ikke var relatert til den presenterende kliniske fenotypen ble også sekvensert på VÅRE ngs-analyser. Vi avidentifiserte data for alle 1507 gener sekvensert hos 143 142 individer og undersøkte forekomsten av Intrageniske Cnver i ikke-rekvirerte gener for å estimere baseline prevalens av disse hendelsene. Disse fenotypeuavhengige Cnv-Ene refereres heretter til som » baseline Cnv-er.»Et søk etter baseline CNVs ble utført i 7-616 gener per individ for totalt 16 millioner enkeltgenanalyser. Dette søket ga 4054 intrageniske Cnver (1465 forskjellige hendelser) hos 3772 individer på tvers av 599 gener(Supplerende Tabell 5). De fleste Av Disse Cnvene var kun til stede en gang, men noen ble sett 2 til mer enn 15 ganger (Fig. 3a; Supplerende Tabell 6). De gjentatte hendelsene samlet utgjorde imidlertid de fleste AV CNV-observasjonene ved BASELINE. De aller fleste gener med Baseline CNVs hadde fem eller færre hendelser (Fig. 3b). Bare 47 gener inneholdt mer enn halvparten av alle observerte CNVs, inkludert begge gener med identiske tilbakevendende hendelser og de med en rekke unike hendelser. De fleste individer med intragen baseline CNV hadde bare en enkelt hendelse, men 146 individer hadde flere Cnver i gener på forskjellige kromosomer. I gjennomsnitt oppdaget vi EN baseline CNV med en hastighet på 1 i hver 3979 gener sekvensert med våre analyser.

Fig. 3: Baseline copy-number varianter (CNVs) som ikke er relatert til klinisk fenotype i en stor kohort.

den kliniske signifikansen av Disse Cnvene ble ikke evaluert utover at de var slettinger i American College Of Medical Genetics og Genomics-listede gener med kjente tap av funksjon (LOF) mutasjonsmekanismer. Cnver i gener som tilhørte samme kliniske spesialitet som de som ble bestilt for klinisk testing, ble fjernet fra analysen. Single-exon lav kvalitet samtaler ble fjernet for å redusere potensielle falske positive samtaler. Et Histogram som viser antall distinkte Cnver observert i gener analysert for baseline Cnver. Kolonnene i diagrammet viser antall Ganger Cnvene ble observert. Linjediagrammet viser andelen av totalt observerte Cnver i hver frekvensbøtte. For eksempel viser den første kolonnen at mer enn 1100 CNVs skjedde bare en gang, og samlet sett utgjorde omtrent 25% av Alle CNVs. I kontrast indikerer den siste kolonnen at 36 Cnver ble funnet mer enn 15 ganger og representerte mer enn 40% av alle baseline Cnver. B Histogram som viser antall gener som inneholdt baseline CNVs. Kolonnene i diagrammet viser inkrementelle økninger i antall Cnver observert i et gen. Linjediagrammet viser andelen CNVs ved vilkårlig økning AV CNV-forekomst per gen. For eksempel hadde nesten 240 gener bare EN CNV, og sammen utgjorde Disse Cnvene omtrent 6% av alle hendelser. Derimot hadde omtrent 45 gener mer enn 15 Cnver hver, noe som representerte litt mer enn 60% av Alle Cnver. C Fordeling av Baseline CNVs er vist i henhold til antall berørte eksoner. Multiexon CNVs inkluderer tre klasser av 5 ‘terminal exons, interne exons og 3’ terminal exons. (D og E) Byrden av baseline CNVs i gener i henhold til arv og zygositet. Cnver i gener med LOF mutasjonsmekanismer er vist i del (d) og de i gener uten LOF mekanismer er vist i del (e). Cnver i X-koblede (XL) gener ble kategorisert som de observert som heterozygote hendelser hos kvinner og hemizygote hendelser hos menn. AD autosomal dominant, AR autosomal recessiv, f kvinne, m mann, het heterozygot, hom homozygot

i motsetning Til Cnver identifisert i de klinisk testede genene i denne kohorten, var de fleste intrageniske Cnver ved baseline duplikasjoner (Fig. 1c, d og 3c). De fleste var også heterozygote varianter I ar-gener eller gener som manglet etablerte lof-mekanismer (Fig. 3d, e). Et mindretall Av Baseline CNVs forekom i gener assosiert MED AD arv eller LOF mekanismer (Figs. 1e, f og 3d, e). De vanligste Baseline CNVs inkluderte helgenhendelser I NPHP1, NIPA1, MYH11, DNAI2, HFE2, SMN1 og PMP22 og partielle genhendelser I TFG, BBS9, CTNNA3, PARK2, KCTD7, DNAJC6, GLIS2 og TUBB4A (Supplerende Tabell 6). Når det gjelder egenskaper som kan forklare eksistensen av baseline CNVs i sykdomsgener, bemerket vi at nesten 40% av Disse Cnvene omfattet et helt gen og derfor ikke direkte forstyrret transkriptavlesningsrammer (Fig. 3c). Videre var omtrent 90% av duplikasjonene i gener med LOF-mekanismer helgenhendelser eller delgenhendelser inkludert en terminal ekson, mens bare halvparten av slettingene i disse genene viste de samme mønstrene (Supplerende Tabell 5).

i tillegg til å vurdere den generelle prevalensen og egenskapene til Baseline CNVs, vurderte vi forventede kliniske implikasjoner. Vi observerte 237 heterozygote slettinger i 97 gener med AD eller XL arv og LOF mekanismer; de fleste var I PMP22, DMD, AARS, KCNQ1, FIG4, CHEK2, OG LRSAM1 (Supplerende Tabeller 5 og 7). Vi fant bare to homozygote slettinger i gener MED AR-arv (NPHP1 OG SPG7) og bare to hemizygote slettinger i et enkelt gen med XL-arv (DMD) hos menn. Alle andre homozygote Cnver i gener MED AR arv, eller hemizygote Cnver i gener MED XL arv hos menn, var duplikasjoner. Videre observerte Vi CNVs spesielt i gener med medisinske handlingshensyn i HENHOLD TIL ACMG.21,22 Vi evaluerte CNVs i 58 av de 59 ACMG-listede genene (unntatt PMS2) hos 5,300-69,000 individer avhengig av analysene som ble brukt til testing. Totalt 46 slettinger og 110 duplikasjoner ble påvist, noe som tyder på en frekvens på opptil 0,8% (KI: 0,58–1,11%) blant individer testet for disse genene. MYH11, MYH7, KCNQ1 og RYR2 inneholdt de fleste CNVs. Spesielt var det slettinger i 16 gener—KCNQ1, MYH11, MYH7, MYBPC3, PCSK9, BRCA1, RYR2, PKP2, TGFBR2, SMAD3, OTC, NF2, FBN1, DSP, DSC2 og APC—mer enn halvparten av dem har lof mekanismer (Supplerende Tabell 7).

Legg igjen en kommentar

Din e-postadresse vil ikke bli publisert.

Previous post Slik Installerer Du NetBeans IDE 12 I Debian, Ubuntu Og Linux Mint
Next post På 83 denne mannen er fortsatt i forkant av fitness