prevalens och egenskaper hos Intragen copy-number variation i Mendelian sjukdomsgener

prevalens av intragena CNVs i en stor klinisk kohort

vi testade olika delmängder av 1507 gener i 143,515 orelaterade individer som hänvisas till diagnostisk ngs-genpaneltestning. Totalt ~4,8 miljoner singelgenanalyser slutfördes. Bland nästan 8.1 miljoner varianter av alla typer identifierade vi 2844 intragena CNV (1237 distinkta händelser). Dessa CNV stod för 0,03% av alla varianter, 3,1% av rapporterade varianter, och särskilt 9,1% av varianter klassificerade som LP/P (kompletterande Tabell 1 och kompletterande Figur 1). Dessa varianter hittades över 384 gener och inkluderade 1810-raderingar och 1034-duplikationer, som tillsammans representerade en prevalens av 1.9% i denna kohort, 4.4% bland individer med minst en rapporterad variant och mer signifikant 9.8% bland individer som fick en rapport med en LP/P-variant av vilken typ som helst.

mönster av Intragen CNV—förekomst

CNVs föll i en av tre kategorier-enstaka sällsynta händelser, vanliga återkommande händelser och lågfrekventa återkommande händelser (Fig. 1a). Varje kategori representerade ungefär en tredjedel av alla observerade CNV. Den stora majoriteten av de 384 generna med CNV hade bara en CNV vardera, men dessa enskilda CNV svarade tillsammans för mindre än 10% av alla händelser (Fig. 1b). Däremot hade 31 av de 384 generna 15 eller fler CNV, men dessa representerade nästan 70% av alla CNV. Bortsett från frekvenser undersöktes de intragena platserna och storlekarna av CNVs, eftersom dessa egenskaper kan bestämma klinisk inverkan. En fjärdedel av CNV: erna inkluderade bara en exon. En majoritet av intragena CNV var multi-exoniska partiella genhändelser, och de flesta omfattade endast interna exoner utan att involvera de terminala (första eller sista) kodande exonerna (Fig. 1c, d). Bland partiella Gen-CNV: er som involverar terminala exoner inkluderade fler raderingar än duplikationer de första exonerna, medan ett liknande antal raderingar och duplikationer inkluderade de sista exonerna. Slutligen inkluderade en större andel duplikationer än deletioner hela genen. Nästan en femtedel av alla distinkta (icke-överflödiga) CNV: er inkluderade en full gen, och i 40 fall omfattade CNV: erna flera angränsande gener och var närvarande på minst 10 kromosomer (kompletterande tabeller 1, 2).

Fig. 1: frekvens, storlek, tolkning och distribution av kopianummervarianter (CNV) observerade i kliniskt testade gener.

ett Histogram som visar antalet distinkta CNV som observerats i de testade generna. Kolumnerna i diagrammet anger antalet gånger CNV: erna observerades. Linjediagrammet visar andelen totala observerade CNV i varje frekvensbehållare. Till exempel visar den första kolumnen att nästan 900 CNV inträffade bara en gång och svarade sammanlagt för ungefär 30% av alla CNV. B Histogram som visar antalet gener som innehöll CNVs i vår kliniska kohort. Kolumnerna i diagrammet visar inkrementella ökningar av antalet CNV som observerats i en gen. Linjediagrammet visar andelen CNV vid godtyckliga steg av CNV-förekomst per gen. Till exempel hade nästan 200 gener bara 1 CNV, som tillsammans stod för mindre än 10% av alla händelser. Däremot hade cirka 30 gener mer än 15 CNV vardera, vilket representerade nästan 70% av alla CNV. C fördelning av raderingar och duplikationer efter antal exoner som påverkas och genom klinisk Tolkning. Cytogenetiska händelser definieras som sammanhängande CNV med samma zygositet som påverkar angränsande gener på en enda kromosom. Vissa helgenhändelser kan faktiskt vara en del av större cytogenetiska händelser men är inte listade som sådana eftersom andra gener inom den förutsagda cytogenetiska händelsen var frånvarande från vår analys och därför inte tillgängliga för analys. D antal CNV-duplikationer och deletioner som upptäckts i kliniska och baslinje-CNV-data. CNV: er delas upp i de som inkluderar en hel gen (klasserna i, V), åtminstone den sista exonen (klasserna II, VI), åtminstone den första exonen (klasserna III, VII) eller endast en intern exon(klasserna IV, VIII). En generisk genstruktur visas högst upp. Gröna och lila lådor betecknar ”terminala exoner” och alla andra är ”interna exoner”, som beskrivs i texten. Tomma rutor anger borttagna exoner. Denna siffra förutsätter att intragena duplikationer uppträder i tandem, vilket ofta är fallet med sådana händelser. CNV: er som bara involverar promotorregioner är inte representerade i denna siffra. En Pearsons Chi-squared beredskapstabell ger ett p-värde på p < 1 10-5 för dubbelarbete och p = 1.5. 10-5 för deletioner, vilket indikerar att skillnaden i fördelningen av CNV över genen inte bara beror på provtagningsskillnader mellan kliniska och baslinje-CNV. E och f deletioner och duplikationer i kliniskt testade gener och deras tolkningar. Diagrammet i (e) visar gener med förlust av funktion (LOF) mutationsmekanismer, och att i (f) visar gener utan förlust av funktion (LOF) mekanismer. De flesta gener som ingår i våra paneler kuraterades som LOF-mekanismer. Den kliniska klassificeringen av varje CNV, arvsmönster av genen med CNV och zygositeten hos varianterna jämförs. För X-länkade (XL) gener visas heterozygota CNV hos kvinnor separat från CNV hos män. AD autosomal dominant, AR autosomal recessiv, f kvinna, het heterozygot, Hom homozygot, m hane, lp sannolikt patogen variant, P patogen variant, vus varianter av osäker betydelse. Den” patogena ” etiketten i c, e och f inkluderar CNV: er klassificerade som patogena och sannolikt patogena

klinisk klassificering av CNVs

deletioner var vanligare i denna kliniska kohort, och de flesta rapporterades som LP/P-varianter (Fig. 1c). Några raderingar klassificerades emellertid som VUS, främst för att de var in-frame-varianter i gener utan förlust av funktion (LOF) mutationsmekanismer. Däremot klassificerades mer än hälften av duplikationerna som VUS. Bland partiella genduplikationer involverade 359 terminala exoner och 225 involverade endast interna exoner (Fig. 1d). Minst 166 duplikationer som endast omfattade interna exoner förutspåddes ha en negativ effekt på transkriptets läsram och klassificerades därför som LP/P (kompletterande Tabell 2). För minst 30 duplikationer observerade vi förmodade brytpunkter baserade på split-read sekvensdata och förutspådde ett tandemarrangemang som skulle störa transkriptets läsram. Detta stöder tidigare påståenden om att intragena duplikationer vanligtvis är lokaliserade tandemomläggningar jämfört med mer komplicerade händelser som infogningstranslokationer.18

vi ansåg också fördelningen och zygositeten hos CNVs i gener associerade med autosomal dominant (AD), autosomal recessiv (AR) och X-länkad (XL) störningar (Fig. 1e, f). Den stora majoriteten av CNV var i gener associerade med AD eller XL arv, även om detta resultat återspeglar en bias eftersom de flesta av de testade generna hade dessa arvsmönster. Av 2096 CNV: er klassificerade som LP / P var 85% i gener associerade med AD-eller XL-arv och 15% var i gener associerade med AR-arv. Av de senare var 6,7% homozygota deletioner, 2,8% var sammansatta heterozygota förändringar som åtföljde en patogen SNV på den andra allelen (utgör en positiv molekylär diagnos för en AR-störning; kompletterande Tabell 1) och 5,5% var enstaka heterozygota händelser.

nästan alla CNV i denna kohort hittades i gener med LOF-mekanismer (Fig. 1e). De flesta CNV i dessa gener var deletioner klassificerade som patogena, medan mer än hälften av duplikationerna klassificerades som Vu. Jämförelsevis hade de 304 generna utan LOF-mekanismer få CNVs, mestadels klassificerade som VUS eller godartade (Fig. 1F), och betydligt fler dubbleringar än strykningar (p = 1,8 10-9 10-9).

CNVs och morbiditet

analys av ett stort antal multigenpaneler visade varierande CNV-prevalens över sjukdomsgrupper (Fig. 2a, b; Tilläggstabell 4). Gener med CNV hade antingen mestadels återkommande händelser, mestadels unika händelser eller en blandning av båda (Fig. 2c). Bland paneler som hade gett minst 10 patogena varianter av vilken typ som helst hade mer än en tredjedel CNV: er som stod för mer än 10% av patogena varianter. Genpaneler som gav det högsta antalet CNV var de för spinal muskelatrofi, Charcot-Marie-Tooth sjukdom och dystrofinopatier, som förväntat. Men paneler för medfödda hjärtfel och heterotaxi, Lynch syndrom, sarkom, muskeldystrofi och dystoni identifierade också många CNV. Däremot inkluderade genpaneler med de lägsta CNV-frekvenserna de för kronisk pankreatit, Rasopatier, kardiomyopatier och ärftlig trombofili.

Fig. 2: patogena kopianummervarianter (CNV) av gen och panel.

en panel i varje klinisk specialitet visas med andelen positiva rapporter som inkluderade en eller flera patogena CNV. Endast paneler som kliniskt testades minst 100 gånger och hade minst 10 patogena varianter av vilken typ som helst ingår. Varje panel representeras av en cirkel. B andel positiva rapporter som inkluderade patogena CNV i olika paneler. Dessa paneler var de fem bästa med de mest patogena varianterna i varje klinisk specialitet. C Tre mönster av CNV-förekomst var urskiljbara: återkommande händelser (t.ex. i PMP22 och SMN1), övervägande sällsynta unika händelser (t. ex. i DMD och BRCA2) och en blandning av båda (t. ex. i BRCA1 och MSH2). Antalet distinkta varianter visas i blått och ytterligare/återkommande observationer av dessa varianter visas i grönt. d fraktion av patogena varianter som var CNVs i olika gener. De fem bästa generna med de mest patogena varianterna av vilken typ som helst visas i varje klinisk specialitet

gener för ärftliga cancersyndrom visade en hög (8,3% totalt; 0-50% intervall bland paneler) prevalens av CNV bland patogena varianter (Fig. 2a; Tilläggstabeller 3 och 4). Bland 1059 patogena CNV som observerades i dessa gener observerades 219 endast en gång och 174 var återkommande. BRCA1 och BRCA2 hade en kombinerad CNV-prevalens på 6,1% (konfidensintervall: 5,4-6,9%) bland patogena varianter, i överensstämmelse med tidigare studier (individuellt BRCA1 11.4%, BRCA2 1, 7%).15,19,20 CNV berikades också i andra gener, såsom EPCAM, STK11 och VHL, och i gener på olika paneler med låga totala diagnostiska utbyten. Med hjälp av vår ngs-metod observerade vi också 90 CNVs i de segmentellt duplicerade exonerna 12-15 av den funktionella genkopian av PMS2 (kompletterande Tabell 1). Senast observerades 25 CNV i promotorregioner av GREM1, TP53 och APC.

CNVs i gener associerade med pediatriska och sällsynta störningar stod för 7,7% av patogena varianter (0-82% intervall mellan paneler; Fig. 2c). Vi hittade de högsta frekvenserna av CNVs i paneler för tidig infantil epileptisk encefalopati, Joubert syndrom, tuberös skleros och cerebrala cavernösa missbildningar (kompletterande Tabell 4). De gener som oftast påverkades av patogena CNV var NF1, NPHP1 och TSC2 (kompletterande tabell 3). Bland epilepsigener observerade vi CNV: er som involverade UBE3A i 15q13.1 och PRRT2 i 16p11.2, vilket sannolikt var återkommande cytogenetiska omarrangemang. Vi observerade lägre CNV-frekvenser i genpaneler för ciliopatier, Rasopatier, osteogenesis imperfecta och cystisk fibros (kompletterande Tabell 4). Noonans syndrom och kroniska pankreatitpaneler identifierade mycket få eller inga patogena CNV, även om minst 270 individer testades och mer än 60 patogena varianter rapporterades i varje panel.

gener för kardiovaskulära störningar visade en jämförelsevis lägre prevalens av CNV bland patogena varianter (4, 7% totalt; 0-16, 7% intervall mellan paneler). De högsta frekvenserna av CNVs inträffade i paneler för kardiomyopati och skelettmuskelsjukdom (en delmängd av den omfattande kardiomyopatipanelen), familjär hyperkolesterolemi och Brugadas syndrom (kompletterande Tabell 4). Däremot hittades mycket få CNV i paneler för arytmier (andra än Brugada) och aortopatier, medan kardiomyopatipanelen hade den lägsta förekomsten av patogena CNV. Generna med det högsta antalet patogena CNV var LDLR, FBN1, PKP2, MYBPC3 och RYR2 (kompletterande tabell 3). I vissa paneler som gav uppenbarligen hög CNV-prevalens var de flesta om inte alla CNV i endast en eller två gener (t.ex. ENG och LDLR). Paneler för kardiovaskulära störningar med det högsta totala diagnostiska utbytet hade också generna med den högsta förekomsten av CNV, förutom de för arytmier och kardiomyopatier, som var utarmade av CNV och där de flesta positiva diagnoserna istället förklarades av SNV.

Genpaneler för neurologiska störningar (mestadels neuromuskulära störningar i våra paneler) visade den högsta förekomsten av intragena CNV: er bland patogena varianter (35% totalt, 0-100% intervall mellan paneler; Fig. 2a, c, kompletterande Tabell 4). Detta resultat förklarades till stor del av återkommande genduplikation och ömsesidig deletion i PMP22, deletioner i SMN1 och olika CNV i DMD (kompletterande tabell 3; Fig. 2C, D; kompletterande Figur 2). Med hjälp av en anpassad ngs-metod fann vi 135 fall av SMN1-radering bland 819 individer med misstänkt spinal muskelatrofi, och utbudet av SMN2-kopior varierade från 0 till 5. Även när PMP22, SMN1 och DMD uteslutits representerade intragena CNV i gener kopplade till neurologiska störningar fortfarande 6% av alla patogena varianter i vår kohort. Andra gener för neurologiska störningar som vanligtvis påverkas av CNVs inkluderade PARK2, LAMA2 och SPG11.

analys av baslinje CNVs

vår diagnostiska testning var begränsad till sjukdomsgener som rekvirerades av läkare, men många gener som inte var relaterade till den presenterande kliniska fenotypen sekvenserades också på våra ngs-analyser. Vi avidentifierade data för alla 1507 gener sekvenserade hos 143 142 individer och undersökte förekomsten av intragena CNV i icke-rekvisitionerade gener för att uppskatta baslinjens prevalens av dessa händelser. Dessa fenotypoberoende CNV: er kallas nedan ” Baseline CNV: er.”En sökning efter baslinje-CNVs utfördes i 7-616 gener per individ för totalt 16 miljoner singelgenanalyser. Denna sökning gav 4054 intragena CNV (1465 distinkta händelser) hos 3772 individer över 599 gener (kompletterande Tabell 5). De flesta av dessa CNV var bara närvarande en gång, men några sågs 2 till mer än 15 gånger (Fig. 3a; Tilläggstabell 6). De återkommande händelserna i aggregat stod emellertid för de flesta av CNV-observationerna vid baslinjen. De allra flesta gener med baslinje-CNV hade fem eller färre händelser (Fig. 3b). Bara 47 gener innehöll mer än hälften av alla observerade baslinje-CNV, inklusive båda gener med identiska återkommande händelser och de med en mängd unika händelser. De flesta individer med en Intragen baslinje CNV hade bara en enda händelse, men 146 individer hade ytterligare CNV i gener på olika kromosomer. I genomsnitt upptäckte vi en baslinje CNV med en hastighet av 1 i varje 3979 gener sekvenserade med våra analyser.

Fig. 3: Baseline copy-number variants (CNV) som inte är relaterade till klinisk fenotyp i en stor kohort.

den kliniska betydelsen av dessa CNV utvärderades inte utöver deras borttagningar i American College of Medical Genetics och Genomics-listade gener med kända mutationsmekanismer (lof). CNV i gener som tillhörde samma kliniska specialitet som de som beställdes för klinisk testning togs bort från analysen. Single-exon låg kvalitet samtal togs bort för att minska potentiella falskt positiva samtal. ett Histogram som visar antalet distinkta CNV som observerats i gener analyserade för baslinje CNV. Kolumnerna i diagrammet visar antalet gånger CNV: erna observerades. Linjediagrammet visar andelen totala observerade CNV i varje frekvensbehållare. Till exempel visar den första kolumnen att mer än 1100 CNV inträffade bara en gång och svarade sammanlagt för ungefär 25% av alla CNV. Däremot indikerar den sista kolumnen att 36 CNV hittades mer än 15 gånger och representerade mer än 40% av alla baslinje-CNV. B Histogram som visar antalet gener som innehöll baslinje CNVs. Kolumnerna i diagrammet visar inkrementella ökningar av antalet CNV som observerats i en gen. Linjediagrammet visar andelen CNV vid godtyckliga steg av CNV-förekomst per gen. Till exempel hade nästan 240 gener bara en CNV, och tillsammans stod dessa CNV för ungefär 6% av alla händelser. Däremot hade cirka 45 gener mer än 15 CNV vardera, vilket representerade drygt 60% av alla CNV. C Distribution av Baseline CNVs visas enligt antalet exoner som påverkas. Multiexon CNVs inkluderar tre klasser av 5 ’terminal exons, interna exons och 3’ terminal exons. (D och E) börda för baslinje-CNVs i gener enligt arv och zygositet. CNV i gener med LOF-mutationsmekanismer visas i del (d) och de i gener utan LOF-mekanismer visas i del (e). CNV i X-länkade (XL) gener kategoriserades som de som observerades som heterozygota händelser hos kvinnor och hemizygota händelser hos män. AD autosomal dominant, AR autosomal recessiv, F hona, m hane, het heterozygot, hom homozygot

till skillnad från CNV: er identifierade i de kliniskt testade generna i denna kohort var de flesta intragena CNV: er vid baslinjen dubbelarbete (Fig. 1c, d och 3c). De flesta var också heterozygota varianter i AR-gener eller gener som saknade etablerade LOF-mekanismer (Fig. 3d, e). En minoritet av baslinjen CNV förekom i gener associerade med AD-arv eller LOF-mekanismer (Fig. 1e, f och 3d, e). De vanligaste baslinje-CNV: erna inkluderade helgenhändelser i NPHP1, NIPA1, MYH11, DNAI2, HFE2, SMN1 och PMP22 och partiella genhändelser i TFG, BBS9, CTNNA3, PARK2, KCTD7, DNAJC6, GLIS2 och TUBB4A (kompletterande Tabell 6). När det gäller egenskaper som kan förklara förekomsten av baslinje-CNV i sjukdomsgener noterade vi att nästan 40% av dessa CNV omfattade en hel gen och därför inte direkt störde transkriptionsläsningsramar (Fig. 3c). Vidare var ungefär 90% av duplikationerna i gener med LOF-mekanismer helgenhändelser eller partiella genhändelser inklusive en terminal exon, medan endast hälften av deletionerna i dessa gener visade samma mönster (kompletterande Tabell 5).

förutom att bedöma den totala prevalensen och egenskaperna hos baslinjen CNVs, ansåg vi förutsagda kliniska konsekvenser. Vi observerade 237 heterozygota deletioner i 97 gener med AD – eller XL-arv och LOF-mekanismer; de flesta var i PMP22, DMD, Aars, KCNQ1, FIG4, CHEK2 och LRSAM1 (kompletterande tabeller 5 och 7). Vi hittade bara två homozygota deletioner i gener med AR-arv (NPHP1 och SPG7) och endast två hemizygota deletioner i en enda gen med XL-arv (DMD) hos män. Alla andra homozygota CNV i gener med AR-arv, eller hemizygota CNV i gener med XL-arv hos män, var duplikationer. Dessutom observerade vi CNVs specifikt i gener med medicinska handlingsbarhetshänsyn enligt ACMG.21,22 vi utvärderade CNVs i 58 av de 59 ACMG-listade generna (exklusive PMS2) hos 5,300–69,000 individer beroende på de analyser som används för testning. Totalt 46 deletioner och 110 duplikationer detekterades, vilket tyder på en frekvens på upp till 0.8% (CI: 0.58–1.11%) bland individer som testats för dessa gener. MYH11, MYH7, KCNQ1 och RYR2 innehöll de flesta CNV: erna. Specifikt fanns deletioner i 16 gener-KCNQ1, MYH11, MYH7, MYBPC3, PCSK9, BRCA1, RYR2, PKP2, TGFBR2, SMAD3, OTC, NF2, FBN1, DSP, DSC2 och APC—mer än hälften har LOF-mekanismer (kompletterande Tabell 7).

Lämna ett svar

Din e-postadress kommer inte publiceras.

Previous post Så här installerar du NetBeans IDE 12 i Debian, Ubuntu och Linux Mint
Next post vid 83 är den här mannen kvar på fitnessens framkant