Prevalens av intragenisk CNVs i en stor klinisk kohort
vi testet ulike undergrupper av 1507 gener i 143,515 urelaterte individer referert for diagnostisk ngs gen panel testing. Totalt ~4,8 millioner enkeltgenanalyser ble fullført. Blant nesten 8,1 millioner varianter av alle typer, identifiserte vi 2844 intrageniske Cnver (1237 forskjellige hendelser). Disse Cnvene utgjorde 0,03% av alle varianter, 3,1% av rapporterte varianter, og spesielt 9,1% av varianter klassifisert SOM LP / P (Supplerende Tabell 1 Og Supplerende Figur 1). Disse variantene ble funnet på tvers av 384 gener og inkluderte 1810 slettinger og 1034 duplikasjoner, som sammen representerte en prevalens på 1,9% i denne kohorten, 4,4% blant individer med minst en rapportert variant, og mer signifikant, 9,8% blant individer som mottok en rapport med EN lp/P-variant av enhver type.
Mønstre av intragen CNV forekomst
CNVs falt inn i en av tre kategorier—enkle sjeldne hendelser, vanlige tilbakevendende hendelser, og lavfrekvente tilbakevendende hendelser (Fig. 1a). Hver kategori representerte omtrent en tredjedel av alle observerte Cnver. De aller fleste av de 384 gener Med Cnv hadde bare EN CNV hver, men disse enkelt Cnv sammen utgjorde mindre enn 10% av alle hendelser (Fig. 1b). I motsetning til dette hadde 31 av de 384 genene 15 Eller flere Cnver, men disse representerte nesten 70% av Alle Cnver. Bortsett fra frekvenser ble Intrageniske steder og størrelser Av Cnver undersøkt, fordi disse egenskapene kan bestemme klinisk innvirkning. En fjerdedel av CNVs inkluderte bare en exon. Et flertall av intrageniske Cnver var multi-eksoniske partielle genhendelser, og de fleste omfattet bare interne eksoner uten å involvere terminale (første eller siste) kodende eksoner (Fig. 1c, d). Blant partielle Gen-Cnver som involverte terminale eksoner, inkluderte flere slettinger enn duplikasjoner de første eksonene, mens et tilsvarende antall slettinger og duplikasjoner inkluderte de siste eksonene. Til slutt inkluderte en større andel av duplikasjoner enn slettinger hele genet. Nesten en femtedel av alle distinkte (ikke-redundante) Cnver inkluderte et fullt gen, og i 40 tilfeller omfattet Cnvene flere nabogener og var tilstede på minst 10 kromosomer (Tilleggstabeller 1, 2).
Klinisk klassifisering Av CNVs
Slettinger var hyppigere i denne kliniske kohorten, og de fleste ble rapportert SOM lp / P-varianter (Fig. 1c). Noen få slettinger ble imidlertid klassifisert SOM VUS, hovedsakelig fordi de var in-frame varianter i gener uten tap av funksjon (LOF) mutasjonsmekanismer. I motsetning ble mer enn halvparten av duplikatene klassifisert SOM VUS. Blant partielle genduplikasjoner involverte 359 terminale eksoner og 225 involverte bare interne eksoner (Fig. 1d). Minst 166 dupliseringer som omfattet bare interne eksoner ble spådd å ha en negativ effekt på avlesningsrammen og ble derfor klassifisert SOM LP / P (Supplerende Tabell 2). I minst 30 duplikasjoner observerte vi antatte brytepunkter basert på split-read-sekvensdata og spådde et tandemarrangement som ville forstyrre transkripsjonslesningsrammen. Dette støtter tidligere påstander om at intrageniske dupliseringer vanligvis er lokaliserte tandemomarrangementer versus mer kompliserte hendelser som innsettingstranslokasjoner.18
vi vurderte også fordeling og zygositet Av CNVs i gener assosiert med autosomal dominant (AD), autosomal recessiv (AR) og X-bundet (XL) lidelser (Fig. 1e, f). De aller fleste CNVs var i gener assosiert MED AD eller XL arv, selv om dette resultatet gjenspeiler en bias fordi de fleste testede gener hadde disse arvemønstrene. Av 2096 Cnver klassifisert SOM LP / P var 85% i gener assosiert MED AD eller XL arv og 15% var i gener assosiert med AR arv. Av de sistnevnte var 6,7% homozygote slettinger, 2,8% var sammensatte heterozygote endringer som fulgte med en patogen SNV på det andre allelet (utgjør en positiv molekylær diagnose for EN AR-lidelse; Supplerende Tabell 1), og 5,5% var enkle heterozygote hendelser.
Nesten Alle Cnver i denne kohorten ble funnet i gener MED LOF mekanismer (Fig. 1e). De fleste Cnver i disse genene var slettinger klassifisert som patogene, mens mer enn halvparten av duplikasjoner ble klassifisert SOM VUS. Til sammenligning hadde 304-gener uten LOF-mekanismer få Cnver, hovedsakelig klassifisert SOM VUS eller godartet (Fig. 1f), og betydelig flere dupliseringer enn slettinger(p = 1,8×10-9).
CNVs og morbiditet
Analyse av et stort antall multigenpaneler viste varierende CNV-prevalens på tvers av sykdomsgrupper (Fig. 2a, b; Supplerende Tabell 4). Gener med CNVs hadde enten for det meste tilbakevendende hendelser, for det meste unike hendelser, eller en blanding av begge (Fig. 2c). Blant paneler som hadde gitt minst 10 patogene varianter av noe slag, hadde Mer enn en tredjedel Cnver som sto for større enn 10% av patogene varianter. Genpaneler som ga det høyeste antallet Cnver var de for spinal muskelatrofi, Charcot–Marie–Tooth sykdom og dystrofinopatier, som forventet. Imidlertid identifiserte paneler for medfødte hjertefeil og heterotakse, Lynch syndrom, sarkom, muskeldystrofi og dystoni også mange Cnver. I kontrast inkluderte genpaneler med de laveste CNV-frekvensene de for kronisk pankreatitt, Rasopatier, kardiomyopatier og arvelig trombofili.
Gener for arvelige kreft syndromer viste en høy (8,3% totalt, 0-50% utvalg blant paneler) prevalens av CNVs blant patogene varianter (Fig. 2a; Utfyllende Tabell 3 og 4). Blant 1059 patogene Cnver observert i disse genene, ble 219 observert bare en gang og 174 var tilbakevendende. BRCA1 og BRCA2 hadde en KOMBINERT CNV-prevalens på 6,1% (konfidensintervall : 5,4–6,9%) blant patogene varianter, i samsvar med tidligere studier (individuelt, BRCA1 11.4%, BRCA2 1,7% ).15,19,20 CNVs ble også beriket i andre gener, SOM EPCAM, STK11 og VHL, og i gener på ulike paneler med lave samlede diagnostiske utbytter. Ved hjelp AV VÅR ngs-metode observerte vi også 90 Cnver i segmentalt dupliserte eksoner 12-15 av den funksjonelle genkopien AV PMS2 (Supplerende Tabell 1). Sist ble Det observert 25 Cnver i promotorregioner AV GREM1, TP53 og APC.
CNVs i gener assosiert med pediatriske og sjeldne lidelser utgjorde 7,7% av patogene varianter (0-82% utvalg blant paneler; Fig. 2c). Vi fant de høyeste frekvensene Av Cnver i paneler for tidlig infantil epileptisk encefalopati, Joubert syndrom, tuberøs sklerose og cerebrale kavernøse misdannelser(Supplerende Tabell 4). Genene som oftest påvirkes av patogene Cnver var NF1, NPHP1 og TSC2 (Supplerende Tabell 3). Blant epilepsigener observerte Vi Cnver som involverte UBE3A i 15Q13.1 og PRRT2 i 16p11.2, som sannsynligvis var tilbakevendende cytogenetiske rearrangementer. Vi observerte lavere CNV-frekvenser i genpaneler for ciliopatier, Rasopatier, osteogenesis imperfecta og cystisk fibrose(Supplerende Tabell 4). Noonan syndrom og paneler med kronisk pankreatitt identifiserte svært få eller ingen patogene Cnver, selv om minst 270 individer ble testet og mer enn 60 patogene varianter ble rapportert i hvert panel.
Gener for kardiovaskulære lidelser viste en relativt lavere prevalens av Cnver blant patogene varianter (4,7% totalt; 0-16, 7% rekkevidde blant paneler). De høyeste frekvensene av CNVs forekom i paneler for kardiomyopati og skjelettmuskelsykdom (en undergruppe av comprehensive cardiomyopathy panel), familiær hyperkolesterolemi og Brugada syndrom (Supplerende Tabell 4). Derimot ble det funnet svært få Cnver i paneler for arytmier (annet enn Brugada) og aortopatier, mens kardiomyopatipanelet hadde den laveste forekomsten av patogene Cnver. Genene med høyest antall patogene Cnver var LDLR, FBN1, PKP2, MYBPC3 og RYR2 (Supplerende Tabell 3). I noen paneler ga tilsynelatende høy CNV prevalens, de fleste Om ikke alle CNVs var i bare ett eller to gener(F. EKS ENG OG LDLR). Paneler for kardiovaskulære lidelser med høyest samlet diagnostisk utbytte hadde også gener med høyest forekomst Av CNVs, unntatt de for arytmier og kardiomyopatier, som var utarmet Av CNVs og hvor de fleste positive diagnoser i stedet ble forklart Av SNVs.
Genpaneler for nevrologiske lidelser (for det meste nevromuskulære lidelser i våre paneler) viste den høyeste forekomsten av intragen CNVs blant patogene varianter (35% totalt, 0-100% rekkevidde blant paneler; Fig. 2a, c; Supplerende Tabell 4). Dette utfallet ble i stor grad forklart av tilbakevendende gen duplisering og gjensidig sletting I PMP22, slettinger I SMN1, og ulike Cnver I DMD (Supplerende Tabell 3; Fig. 2c, d; Supplerende Figur 2). Ved hjelp AV en tilpasset NGS-metode fant vi 135 tilfeller AV smn1-sletting blant 819 personer med mistanke om spinal muskelatrofi, og spekteret AV SMN2-kopier varierte fra 0 til 5. Selv når PMP22, SMN1 og DMD ble ekskludert, representerte intrageniske Cnver i gener knyttet til nevrologiske lidelser fortsatt 6% av alle patogene varianter i vår kohort. Andre gener for nevrologiske lidelser som ofte påvirkes Av CNVs, inkluderte PARK2, LAMA2 og SPG11.
Analyse av baseline CNVs
vår diagnostiske testing var begrenset til sykdomsgener rekvirert av leger, men mange gener som ikke var relatert til den presenterende kliniske fenotypen ble også sekvensert på VÅRE ngs-analyser. Vi avidentifiserte data for alle 1507 gener sekvensert hos 143 142 individer og undersøkte forekomsten av Intrageniske Cnver i ikke-rekvirerte gener for å estimere baseline prevalens av disse hendelsene. Disse fenotypeuavhengige Cnv-Ene refereres heretter til som » baseline Cnv-er.»Et søk etter baseline CNVs ble utført i 7-616 gener per individ for totalt 16 millioner enkeltgenanalyser. Dette søket ga 4054 intrageniske Cnver (1465 forskjellige hendelser) hos 3772 individer på tvers av 599 gener(Supplerende Tabell 5). De fleste Av Disse Cnvene var kun til stede en gang, men noen ble sett 2 til mer enn 15 ganger (Fig. 3a; Supplerende Tabell 6). De gjentatte hendelsene samlet utgjorde imidlertid de fleste AV CNV-observasjonene ved BASELINE. De aller fleste gener med Baseline CNVs hadde fem eller færre hendelser (Fig. 3b). Bare 47 gener inneholdt mer enn halvparten av alle observerte CNVs, inkludert begge gener med identiske tilbakevendende hendelser og de med en rekke unike hendelser. De fleste individer med intragen baseline CNV hadde bare en enkelt hendelse, men 146 individer hadde flere Cnver i gener på forskjellige kromosomer. I gjennomsnitt oppdaget vi EN baseline CNV med en hastighet på 1 i hver 3979 gener sekvensert med våre analyser.
i motsetning Til Cnver identifisert i de klinisk testede genene i denne kohorten, var de fleste intrageniske Cnver ved baseline duplikasjoner (Fig. 1c, d og 3c). De fleste var også heterozygote varianter I ar-gener eller gener som manglet etablerte lof-mekanismer (Fig. 3d, e). Et mindretall Av Baseline CNVs forekom i gener assosiert MED AD arv eller LOF mekanismer (Figs. 1e, f og 3d, e). De vanligste Baseline CNVs inkluderte helgenhendelser I NPHP1, NIPA1, MYH11, DNAI2, HFE2, SMN1 og PMP22 og partielle genhendelser I TFG, BBS9, CTNNA3, PARK2, KCTD7, DNAJC6, GLIS2 og TUBB4A (Supplerende Tabell 6). Når det gjelder egenskaper som kan forklare eksistensen av baseline CNVs i sykdomsgener, bemerket vi at nesten 40% av Disse Cnvene omfattet et helt gen og derfor ikke direkte forstyrret transkriptavlesningsrammer (Fig. 3c). Videre var omtrent 90% av duplikasjonene i gener med LOF-mekanismer helgenhendelser eller delgenhendelser inkludert en terminal ekson, mens bare halvparten av slettingene i disse genene viste de samme mønstrene (Supplerende Tabell 5).
i tillegg til å vurdere den generelle prevalensen og egenskapene til Baseline CNVs, vurderte vi forventede kliniske implikasjoner. Vi observerte 237 heterozygote slettinger i 97 gener med AD eller XL arv og LOF mekanismer; de fleste var I PMP22, DMD, AARS, KCNQ1, FIG4, CHEK2, OG LRSAM1 (Supplerende Tabeller 5 og 7). Vi fant bare to homozygote slettinger i gener MED AR-arv (NPHP1 OG SPG7) og bare to hemizygote slettinger i et enkelt gen med XL-arv (DMD) hos menn. Alle andre homozygote Cnver i gener MED AR arv, eller hemizygote Cnver i gener MED XL arv hos menn, var duplikasjoner. Videre observerte Vi CNVs spesielt i gener med medisinske handlingshensyn i HENHOLD TIL ACMG.21,22 Vi evaluerte CNVs i 58 av de 59 ACMG-listede genene (unntatt PMS2) hos 5,300-69,000 individer avhengig av analysene som ble brukt til testing. Totalt 46 slettinger og 110 duplikasjoner ble påvist, noe som tyder på en frekvens på opptil 0,8% (KI: 0,58–1,11%) blant individer testet for disse genene. MYH11, MYH7, KCNQ1 og RYR2 inneholdt de fleste CNVs. Spesielt var det slettinger i 16 gener—KCNQ1, MYH11, MYH7, MYBPC3, PCSK9, BRCA1, RYR2, PKP2, TGFBR2, SMAD3, OTC, NF2, FBN1, DSP, DSC2 og APC—mer enn halvparten av dem har lof mekanismer (Supplerende Tabell 7).