prevalens av intragena CNVs i en stor klinisk kohort
vi testade olika delmängder av 1507 gener i 143,515 orelaterade individer som hänvisas till diagnostisk ngs-genpaneltestning. Totalt ~4,8 miljoner singelgenanalyser slutfördes. Bland nästan 8.1 miljoner varianter av alla typer identifierade vi 2844 intragena CNV (1237 distinkta händelser). Dessa CNV stod för 0,03% av alla varianter, 3,1% av rapporterade varianter, och särskilt 9,1% av varianter klassificerade som LP/P (kompletterande Tabell 1 och kompletterande Figur 1). Dessa varianter hittades över 384 gener och inkluderade 1810-raderingar och 1034-duplikationer, som tillsammans representerade en prevalens av 1.9% i denna kohort, 4.4% bland individer med minst en rapporterad variant och mer signifikant 9.8% bland individer som fick en rapport med en LP/P-variant av vilken typ som helst.
mönster av Intragen CNV—förekomst
CNVs föll i en av tre kategorier-enstaka sällsynta händelser, vanliga återkommande händelser och lågfrekventa återkommande händelser (Fig. 1a). Varje kategori representerade ungefär en tredjedel av alla observerade CNV. Den stora majoriteten av de 384 generna med CNV hade bara en CNV vardera, men dessa enskilda CNV svarade tillsammans för mindre än 10% av alla händelser (Fig. 1b). Däremot hade 31 av de 384 generna 15 eller fler CNV, men dessa representerade nästan 70% av alla CNV. Bortsett från frekvenser undersöktes de intragena platserna och storlekarna av CNVs, eftersom dessa egenskaper kan bestämma klinisk inverkan. En fjärdedel av CNV: erna inkluderade bara en exon. En majoritet av intragena CNV var multi-exoniska partiella genhändelser, och de flesta omfattade endast interna exoner utan att involvera de terminala (första eller sista) kodande exonerna (Fig. 1c, d). Bland partiella Gen-CNV: er som involverar terminala exoner inkluderade fler raderingar än duplikationer de första exonerna, medan ett liknande antal raderingar och duplikationer inkluderade de sista exonerna. Slutligen inkluderade en större andel duplikationer än deletioner hela genen. Nästan en femtedel av alla distinkta (icke-överflödiga) CNV: er inkluderade en full gen, och i 40 fall omfattade CNV: erna flera angränsande gener och var närvarande på minst 10 kromosomer (kompletterande tabeller 1, 2).
klinisk klassificering av CNVs
deletioner var vanligare i denna kliniska kohort, och de flesta rapporterades som LP/P-varianter (Fig. 1c). Några raderingar klassificerades emellertid som VUS, främst för att de var in-frame-varianter i gener utan förlust av funktion (LOF) mutationsmekanismer. Däremot klassificerades mer än hälften av duplikationerna som VUS. Bland partiella genduplikationer involverade 359 terminala exoner och 225 involverade endast interna exoner (Fig. 1d). Minst 166 duplikationer som endast omfattade interna exoner förutspåddes ha en negativ effekt på transkriptets läsram och klassificerades därför som LP/P (kompletterande Tabell 2). För minst 30 duplikationer observerade vi förmodade brytpunkter baserade på split-read sekvensdata och förutspådde ett tandemarrangemang som skulle störa transkriptets läsram. Detta stöder tidigare påståenden om att intragena duplikationer vanligtvis är lokaliserade tandemomläggningar jämfört med mer komplicerade händelser som infogningstranslokationer.18
vi ansåg också fördelningen och zygositeten hos CNVs i gener associerade med autosomal dominant (AD), autosomal recessiv (AR) och X-länkad (XL) störningar (Fig. 1e, f). Den stora majoriteten av CNV var i gener associerade med AD eller XL arv, även om detta resultat återspeglar en bias eftersom de flesta av de testade generna hade dessa arvsmönster. Av 2096 CNV: er klassificerade som LP / P var 85% i gener associerade med AD-eller XL-arv och 15% var i gener associerade med AR-arv. Av de senare var 6,7% homozygota deletioner, 2,8% var sammansatta heterozygota förändringar som åtföljde en patogen SNV på den andra allelen (utgör en positiv molekylär diagnos för en AR-störning; kompletterande Tabell 1) och 5,5% var enstaka heterozygota händelser.
nästan alla CNV i denna kohort hittades i gener med LOF-mekanismer (Fig. 1e). De flesta CNV i dessa gener var deletioner klassificerade som patogena, medan mer än hälften av duplikationerna klassificerades som Vu. Jämförelsevis hade de 304 generna utan LOF-mekanismer få CNVs, mestadels klassificerade som VUS eller godartade (Fig. 1F), och betydligt fler dubbleringar än strykningar (p = 1,8 10-9 10-9).
CNVs och morbiditet
analys av ett stort antal multigenpaneler visade varierande CNV-prevalens över sjukdomsgrupper (Fig. 2a, b; Tilläggstabell 4). Gener med CNV hade antingen mestadels återkommande händelser, mestadels unika händelser eller en blandning av båda (Fig. 2c). Bland paneler som hade gett minst 10 patogena varianter av vilken typ som helst hade mer än en tredjedel CNV: er som stod för mer än 10% av patogena varianter. Genpaneler som gav det högsta antalet CNV var de för spinal muskelatrofi, Charcot-Marie-Tooth sjukdom och dystrofinopatier, som förväntat. Men paneler för medfödda hjärtfel och heterotaxi, Lynch syndrom, sarkom, muskeldystrofi och dystoni identifierade också många CNV. Däremot inkluderade genpaneler med de lägsta CNV-frekvenserna de för kronisk pankreatit, Rasopatier, kardiomyopatier och ärftlig trombofili.
gener för ärftliga cancersyndrom visade en hög (8,3% totalt; 0-50% intervall bland paneler) prevalens av CNV bland patogena varianter (Fig. 2a; Tilläggstabeller 3 och 4). Bland 1059 patogena CNV som observerades i dessa gener observerades 219 endast en gång och 174 var återkommande. BRCA1 och BRCA2 hade en kombinerad CNV-prevalens på 6,1% (konfidensintervall: 5,4-6,9%) bland patogena varianter, i överensstämmelse med tidigare studier (individuellt BRCA1 11.4%, BRCA2 1, 7%).15,19,20 CNV berikades också i andra gener, såsom EPCAM, STK11 och VHL, och i gener på olika paneler med låga totala diagnostiska utbyten. Med hjälp av vår ngs-metod observerade vi också 90 CNVs i de segmentellt duplicerade exonerna 12-15 av den funktionella genkopian av PMS2 (kompletterande Tabell 1). Senast observerades 25 CNV i promotorregioner av GREM1, TP53 och APC.
CNVs i gener associerade med pediatriska och sällsynta störningar stod för 7,7% av patogena varianter (0-82% intervall mellan paneler; Fig. 2c). Vi hittade de högsta frekvenserna av CNVs i paneler för tidig infantil epileptisk encefalopati, Joubert syndrom, tuberös skleros och cerebrala cavernösa missbildningar (kompletterande Tabell 4). De gener som oftast påverkades av patogena CNV var NF1, NPHP1 och TSC2 (kompletterande tabell 3). Bland epilepsigener observerade vi CNV: er som involverade UBE3A i 15q13.1 och PRRT2 i 16p11.2, vilket sannolikt var återkommande cytogenetiska omarrangemang. Vi observerade lägre CNV-frekvenser i genpaneler för ciliopatier, Rasopatier, osteogenesis imperfecta och cystisk fibros (kompletterande Tabell 4). Noonans syndrom och kroniska pankreatitpaneler identifierade mycket få eller inga patogena CNV, även om minst 270 individer testades och mer än 60 patogena varianter rapporterades i varje panel.
gener för kardiovaskulära störningar visade en jämförelsevis lägre prevalens av CNV bland patogena varianter (4, 7% totalt; 0-16, 7% intervall mellan paneler). De högsta frekvenserna av CNVs inträffade i paneler för kardiomyopati och skelettmuskelsjukdom (en delmängd av den omfattande kardiomyopatipanelen), familjär hyperkolesterolemi och Brugadas syndrom (kompletterande Tabell 4). Däremot hittades mycket få CNV i paneler för arytmier (andra än Brugada) och aortopatier, medan kardiomyopatipanelen hade den lägsta förekomsten av patogena CNV. Generna med det högsta antalet patogena CNV var LDLR, FBN1, PKP2, MYBPC3 och RYR2 (kompletterande tabell 3). I vissa paneler som gav uppenbarligen hög CNV-prevalens var de flesta om inte alla CNV i endast en eller två gener (t.ex. ENG och LDLR). Paneler för kardiovaskulära störningar med det högsta totala diagnostiska utbytet hade också generna med den högsta förekomsten av CNV, förutom de för arytmier och kardiomyopatier, som var utarmade av CNV och där de flesta positiva diagnoserna istället förklarades av SNV.
Genpaneler för neurologiska störningar (mestadels neuromuskulära störningar i våra paneler) visade den högsta förekomsten av intragena CNV: er bland patogena varianter (35% totalt, 0-100% intervall mellan paneler; Fig. 2a, c, kompletterande Tabell 4). Detta resultat förklarades till stor del av återkommande genduplikation och ömsesidig deletion i PMP22, deletioner i SMN1 och olika CNV i DMD (kompletterande tabell 3; Fig. 2C, D; kompletterande Figur 2). Med hjälp av en anpassad ngs-metod fann vi 135 fall av SMN1-radering bland 819 individer med misstänkt spinal muskelatrofi, och utbudet av SMN2-kopior varierade från 0 till 5. Även när PMP22, SMN1 och DMD uteslutits representerade intragena CNV i gener kopplade till neurologiska störningar fortfarande 6% av alla patogena varianter i vår kohort. Andra gener för neurologiska störningar som vanligtvis påverkas av CNVs inkluderade PARK2, LAMA2 och SPG11.
analys av baslinje CNVs
vår diagnostiska testning var begränsad till sjukdomsgener som rekvirerades av läkare, men många gener som inte var relaterade till den presenterande kliniska fenotypen sekvenserades också på våra ngs-analyser. Vi avidentifierade data för alla 1507 gener sekvenserade hos 143 142 individer och undersökte förekomsten av intragena CNV i icke-rekvisitionerade gener för att uppskatta baslinjens prevalens av dessa händelser. Dessa fenotypoberoende CNV: er kallas nedan ” Baseline CNV: er.”En sökning efter baslinje-CNVs utfördes i 7-616 gener per individ för totalt 16 miljoner singelgenanalyser. Denna sökning gav 4054 intragena CNV (1465 distinkta händelser) hos 3772 individer över 599 gener (kompletterande Tabell 5). De flesta av dessa CNV var bara närvarande en gång, men några sågs 2 till mer än 15 gånger (Fig. 3a; Tilläggstabell 6). De återkommande händelserna i aggregat stod emellertid för de flesta av CNV-observationerna vid baslinjen. De allra flesta gener med baslinje-CNV hade fem eller färre händelser (Fig. 3b). Bara 47 gener innehöll mer än hälften av alla observerade baslinje-CNV, inklusive båda gener med identiska återkommande händelser och de med en mängd unika händelser. De flesta individer med en Intragen baslinje CNV hade bara en enda händelse, men 146 individer hade ytterligare CNV i gener på olika kromosomer. I genomsnitt upptäckte vi en baslinje CNV med en hastighet av 1 i varje 3979 gener sekvenserade med våra analyser.
till skillnad från CNV: er identifierade i de kliniskt testade generna i denna kohort var de flesta intragena CNV: er vid baslinjen dubbelarbete (Fig. 1c, d och 3c). De flesta var också heterozygota varianter i AR-gener eller gener som saknade etablerade LOF-mekanismer (Fig. 3d, e). En minoritet av baslinjen CNV förekom i gener associerade med AD-arv eller LOF-mekanismer (Fig. 1e, f och 3d, e). De vanligaste baslinje-CNV: erna inkluderade helgenhändelser i NPHP1, NIPA1, MYH11, DNAI2, HFE2, SMN1 och PMP22 och partiella genhändelser i TFG, BBS9, CTNNA3, PARK2, KCTD7, DNAJC6, GLIS2 och TUBB4A (kompletterande Tabell 6). När det gäller egenskaper som kan förklara förekomsten av baslinje-CNV i sjukdomsgener noterade vi att nästan 40% av dessa CNV omfattade en hel gen och därför inte direkt störde transkriptionsläsningsramar (Fig. 3c). Vidare var ungefär 90% av duplikationerna i gener med LOF-mekanismer helgenhändelser eller partiella genhändelser inklusive en terminal exon, medan endast hälften av deletionerna i dessa gener visade samma mönster (kompletterande Tabell 5).
förutom att bedöma den totala prevalensen och egenskaperna hos baslinjen CNVs, ansåg vi förutsagda kliniska konsekvenser. Vi observerade 237 heterozygota deletioner i 97 gener med AD – eller XL-arv och LOF-mekanismer; de flesta var i PMP22, DMD, Aars, KCNQ1, FIG4, CHEK2 och LRSAM1 (kompletterande tabeller 5 och 7). Vi hittade bara två homozygota deletioner i gener med AR-arv (NPHP1 och SPG7) och endast två hemizygota deletioner i en enda gen med XL-arv (DMD) hos män. Alla andra homozygota CNV i gener med AR-arv, eller hemizygota CNV i gener med XL-arv hos män, var duplikationer. Dessutom observerade vi CNVs specifikt i gener med medicinska handlingsbarhetshänsyn enligt ACMG.21,22 vi utvärderade CNVs i 58 av de 59 ACMG-listade generna (exklusive PMS2) hos 5,300–69,000 individer beroende på de analyser som används för testning. Totalt 46 deletioner och 110 duplikationer detekterades, vilket tyder på en frekvens på upp till 0.8% (CI: 0.58–1.11%) bland individer som testats för dessa gener. MYH11, MYH7, KCNQ1 och RYR2 innehöll de flesta CNV: erna. Specifikt fanns deletioner i 16 gener-KCNQ1, MYH11, MYH7, MYBPC3, PCSK9, BRCA1, RYR2, PKP2, TGFBR2, SMAD3, OTC, NF2, FBN1, DSP, DSC2 och APC—mer än hälften har LOF-mekanismer (kompletterande Tabell 7).