Prevalence intragenic CNVs ve velké klinické kohorty
testovali Jsme různé podmnožiny 1507 geny v 143,515 nesouvisející osoby uvedené pro diagnostické NGS gen panel testování. Celkem bylo dokončeno ~4,8 milionu jednogenových analýz. Z téměř 8,1 milionu variant všech typů jsme identifikovali 2844 intragenních CNV(1237 odlišných událostí). Tyto CNV představovaly 0,03% všech variant, 3,1% hlášených variant a zejména 9,1% variant klasifikovaných jako LP / P (doplňková Tabulka 1 a doplňkový Obrázek 1). Tyto varianty byly nalezeny napříč 384 geny a jsou zahrnuty 1810 delece a 1034 zdvojování, které dohromady představovaly prevalencí 1,9% v této kohortě, 4.4% mezi jedinci s alespoň jednou hlášeno varianta, a více významně, a to o 9,8% u jedinců, kteří obdrželi zprávu s LP/P varianta jakéhokoli typu.
Vzory intragenic CNV výskyt
CNVs spadl do jedné ze tří kategorií—jednotlivé vzácné události, časté opakující se události, a nízké frekvence opakujících se událostí (Obr. 1a). Každá kategorie představovala přibližně jednu třetinu všech pozorovaných CNV. Drtivá většina z 384 genů s CNV měla každý pouze jeden CNV, ale tyto jednotlivé CNV společně představovaly méně než 10% všech událostí (obr. 1b). Naproti tomu 31 z 384 genů mělo 15 nebo více CNV, ale ty představovaly téměř 70% všech CNV. Kromě frekvencí byly zkoumány intragenní umístění a velikosti CNV, protože tyto vlastnosti mohou určit klinický dopad. Jedna čtvrtina CNV zahrnovala pouze jeden exon. Většina intragenic CNVs jsou multi-exonic částečné-gen akce, a nejvíce postihl pouze vnitřní exons bez zapojení terminálu (první nebo poslední) kódujících exonů (Obr. 1c, d). Mezi dílčí-gen CNVs zahrnující terminálu exons, více delecí než zdvojování zahrnuty první exons, vzhledem k tomu, že podobný počet delecí a duplikací zahrnuty poslední exons. Konečně větší podíl duplikací než delecí zahrnoval celý gen. Téměř jedna pětina všech odlišných (non-redundant) CNVs zahrnuty plnou genu, a v 40 případech, CNVs zahrnoval několik sousedních genů a byli přítomni na minimálně 10 chromozomů (Doplňující Tabulky 1, 2).
Klinická klasifikace CNVs
Delece byly častější v této klinické kohorty, a většina z nich byla hlášena jako LP/P varianty (Obr. 1c). Několik delecí však bylo klasifikováno jako VUS, především proto, že se jednalo o in-frame varianty v genech bez mutačních mechanismů ztráty funkce (LOF). Naproti tomu více než polovina duplikací byla klasifikována jako VUS. Mezi duplikacemi parciálních genů zahrnovalo 359 terminálních exonů a 225 pouze interní exony (obr. 1d). Alespoň 166 duplikací zahrnující pouze vnitřní exons se předpokládalo, že budou mít nepříznivý vliv na přepis čtení rámu a proto klasifikovány jako LP/P (Doplňující Tabulka 2). Alespoň 30 duplikace, Pozorovali jsme domnělé zarážky založené na datech sekvence s rozděleným čtením a předpovídali tandemové uspořádání, které by narušilo rámec čtení přepisu. To podporuje předchozí tvrzení, že intragenic duplicity jsou typicky lokalizované tandemu přestavby versus složitější akce, jako jsou inzerční translokace.18
také Jsme za distribuci a zygosity CNVs u genů spojených s autozomálně dominantní (AD), autozomálně recesivní (AR) a X-vázaná (XL) poruchy (Obr. 1e, f). Drtivá většina CNVs byly v geny spojené s AD nebo XL dědictví, i když tento výsledek odráží zaujatost, protože většina z testovaných genů byly tyto dědictví vzory. Z 2096 CNV klasifikovaných jako LP / P bylo 85% v genech spojených s dědičností AD nebo XL a 15% v genech spojených s dědičností AR. Druhé, 6,7% bylo homozygotní delece, 2.8% byly složené heterozygotní změny doprovázející patogenní SNV na druhé alely (představující pozitivní molekulární diagnostika pro AR porucha; Doplňující Tabulka 1), a 5,5% byl jeden heterozygotní události.
téměř všechny CNV v této kohortě byly nalezeny v genech s mechanismy LOF (obr. 1e). Většina CNV v těchto genech byla delece klasifikovaná jako patogenní, zatímco více než polovina duplikací byla klasifikována jako VUS. Poměrně 304 genů bez mechanismů LOF mělo málo CNV, většinou klasifikovaných jako VUS nebo benigní (obr. 1f) a výrazně více duplikací než delecí (p = 1,8×10-9).
CNV a morbidita
analýza velkého počtu multigenních panelů ukázala různou prevalenci CNV napříč skupinami onemocnění (obr. 2a, b; doplňková Tabulka 4). Geny s CNV měly buď většinou opakující se události, většinou jedinečné události, nebo kombinaci obou (obr. 2c). Mezi panely, které přinesl alespoň 10 patogenní varianty jakéhokoliv typu, více než třetina CNVs což představuje více než 10% patogenních variant. Gen panely generují nejvyšší počet CNVs ty byly pro spinální muskulární atrofie, Charcot–Marie–Tooth onemocnění, a dystrophinopathies, jak se očekávalo. Nicméně, panely pro vrozené srdeční vady a heterotaxy, Lynch syndrom, nádor, svalové dystrofie, a dystonie také identifikovat mnoho CNVs. Naproti tomu genové panely s nejnižšími frekvencemi CNV zahrnovaly panely pro chronickou pankreatitidu, Rasopatie, kardiomyopatie a dědičnou trombofilii.
Genů pro dědičné nádorové syndromy ukázaly vysokou (8.3% celkové; 0-50% rozsahu mezi panely) prevalence CNVs mezi patogenní varianty (Obr. 2a; doplňkové tabulky 3 a 4). Z 1059 patogenních CNV pozorovaných u těchto genů bylo 219 pozorováno pouze jednou a 174 se opakovalo. BRCA1 a BRCA2 měl v kombinaci CNV prevalence 6,1% (interval spolehlivosti : 5.4–o 6,9%), mezi patogenní varianty, v souladu s předchozí studií (individuálně, BRCA1 11.4%, BRCA2 1,7%).15,19,20 CNVs byly také obohacené jinými geny, jako EPCAM, STK11, a VHL, a v genech na různých panely s nízkou celkovou diagnostiku výnosy. Pomocí našeho NGS metody, jsme také pozorován 90 CNVs v segmentově duplicitní exons 12-15 funkční kopii genu PMS2 (Doplňující Tabulka 1). Naposledy bylo 25 CNV pozorováno v promotorových oblastech grem1, TP53 a APC.
CNVs u genů spojených s pediatrickou a vzácné poruchy představovaly 7,7% patogenních variant (0-82% rozsahu mezi panely; Obr. 2c). Našli jsme nejvyšší frekvence CNVs u panelů pro časný infantilní epileptická encefalopatie, Joubert syndrom, tuberózní skleróza a mozková kavernózní malformace (Doplňující Tabulka 4). Geny nejčastěji ovlivněné patogenními CNV byly NF1, NPHP1 a TSC2 (doplňková Tabulka 3). Mezi epilepsií geny, jsme pozorovali CNVs zahrnující UBE3A v 15q13.1 a PRRT2 v 16p11.2, které byly pravděpodobně rekurentní cytogenetické přestavby. Pozorovali jsme nižší frekvence CNV v genových panelech pro ciliopatie, Rasopatie, osteogenesis imperfecta a cystickou fibrózu (doplňková Tabulka 4). Noonan syndrom a chronická pankreatitida panely identifikovány velmi málo nebo žádné patogenní CNVs, i když alespoň 270 jedinců, byly testovány a více než 60 patogenní varianty byly hlášeny v každém panelu.
geny pro kardiovaskulární poruchy vykazovaly poměrně nižší prevalenci CNV mezi patogenními variantami (celkově 4, 7%; 0-16, 7% rozmezí mezi panely). Nejvyšší frekvence CNVs došlo v panelech pro kardiomyopatie a onemocnění kosterního svalstva (podmnožina komplexní kardiomyopatie panel), familiární hypercholesterolemie, a Brugada syndrom (Doplňující Tabulka 4). Naopak, velmi málo CNVs byly nalezeny v panelech pro arytmie (jiné než Brugada) a aortopathies, vzhledem k tomu, že kardiomyopatie panel měl nejnižší výskyt patogenních CNVs. Geny s nejvyšším počtem patogenních CNVs byly LDLR, FBN1, PKP2, MYBPC3, a RYR2 (Doplňující Tabulka 3). V některých panelech vykazujících zjevně vysokou prevalenci CNV byla většina, ne-li všechny CNV, pouze v jednom nebo dvou genech (např. Panely pro kardiovaskulární poruchy s nejvyšší celkovou diagnostiku výnos měl také geny s nejvyšší prevalencí CNVs, s výjimkou těch, pro arytmie a kardiomyopatie, které byly vyčerpány CNVs a v nichž většinou pozitivní diagnózy byly místo toho vysvětlil SNVs.
Genových panelů pro neurologické poruchy (většinou neuromuskulární poruchy v našem panely) ukázaly, že nejvyšší prevalence intragenic CNVs mezi patogenní varianty (35% celkově 0-100% rozsahu mezi panely; Obr. 2a, c; doplňková Tabulka 4). Tento výsledek byl do značné míry vysvětlen rekurentní duplikací genů a reciproční delecí v PMP22, delecemi v SMN1 a různými CNV v DMD(doplňková Tabulka 3; obr. 2c, d; Doplňkový Obrázek 2). Pomocí vlastní metody NGS jsme našli 135 případů delece SMN1 u 819 jedinců s podezřením na spinální svalovou atrofii a rozsah kopií SMN2 se pohyboval od 0 do 5. I když PMP22, SMN1, a DMD byly vyloučeny, intragenic CNVs v genech spojených s neurologickými poruchami stále představuje 6% všech patogenních variant v naší kohortě. Jiné geny pro neurologické poruchy běžně postižené CNV zahrnovaly PARK2, LAMA2 a SPG11.
Analýza základní CNVs
Naše diagnostické testování byla omezena na onemocnění geny zabaveno lékaři, ale mnoho genů nesouvisí s prezentaci klinického fenotypu byly také sekvenovány na naše NGS testy. Jsme de-identified data pro všechny 1507 geny sekvenovány v 143,142 jednotlivců a zkoumali výskyt intragenic CNVs v non-zabaveno geny odhadnout základní výskytu těchto událostí. Tyto CNV nezávislé na fenotypu jsou dále označovány jako “ základní CNV.“Hledání výchozích CNV bylo provedeno u 7-616 genů na jednotlivce pro celkem 16 milionů jednogenových analýz. Toto hledání přineslo 4054 intragenních CNV (1465 odlišných událostí) u 3772 jedinců napříč 599 geny (doplňková Tabulka 5). Většina z těchto CNV byla přítomna pouze jednou ,ale několik z nich bylo vidět 2 až více než 15krát (obr. 3a; doplňková Tabulka 6). Rekurentní příhody však v souhrnu představovaly většinu výchozích pozorování CNV. Drtivá většina genů s výchozími CNV měla pět nebo méně příhod (obr. 3b). Pouhých 47 genů obsahovalo více než polovinu všech pozorovaných výchozích CNV, včetně obou genů s identickými opakujícími se událostmi a genů s množstvím jedinečných událostí. Většina jedinců s intragenní základní CNV měla pouze jednu událost, ale 146 jedinců mělo další CNV v genech na různých chromozomech. V průměru jsme detekovali základní CNV rychlostí 1 z každých 3979 genů sekvenovaných našimi testy.
V kontrastu k CNVs identifikovány v klinicky testovaných genů v této skupině, nejvíce základní intragenic CNVs byly duplicity (Fíky. 1c, d a 3c). Většina z nich byla také heterozygotními variantami v genech AR nebo genech, které postrádaly zavedené mechanismy LOF (obr. 3d,e). Menšina výchozích CNV se vyskytla v genech spojených s dědičností AD nebo mechanismy LOF(obr. 1e, f a 3d, e). Nejčastější základní CNVs součástí celku-genu události v NPHP1, NIPA1, MYH11, DNAI2, HFE2, SMN1, a PMP22 a částečné-gen akce v TFG, BBS9, CTNNA3, PARK2, KCTD7, DNAJC6, GLIS2, a TUBB4A (Doplňující Tabulka 6). Pokud jde o vlastnosti, které mohou vysvětlit existenci základní CNVs v nemoc, geny, jsme zaznamenali, že téměř 40% z těchto CNVs obsáhla celý gen, a proto to není přímo narušit přepis čtení snímků (Obr. 3c). Dále zhruba 90% duplikací v genech s LOF mechanismy byly celé-gen akce nebo dílčí-gen akce včetně terminální exon, vzhledem k tomu, že pouze polovina delece těchto genů ukázala, že stejné vzory (Doplňující Tabulka 5).
kromě hodnocení celkové prevalence a vlastností výchozích CNV jsme zvažovali předpokládané klinické důsledky. Pozorovali jsme 237 heterozygotní delece v 97 genů s AD nebo XL dědictví a LOF mechanismy; nejvíce byly v PMP22, DMD, VÝROČNÍCH zpráv o činnosti, KCNQ1, FIG4, CHEK2, a LRSAM1 (Doplňující Tabulky 5 a 7). Našli jsme pouze dva homozygotní delece v genech s AR dědičnost (NPHP1 a SPG7) a pouze dva hemizygous delece v jediném genu s XL dědictví (DMD) u mužů. Všechny ostatní homozygotní CNVs u genů s AR dědičnost, nebo hemizygous CNVs u genů s XL dědičnost u mužů, byly duplicity. Dále jsme pozorovali CNV specificky v genech s ohledem na lékařskou účinnost podle ACMG.21,22 Jsme hodnotili CNVs u 58 59 ACMG-uvedené geny (kromě PMS2) v 5,300–69,000 jedinců v závislosti na testy používané pro testování. Bylo zjištěno celkem 46 delecí a 110 duplikací, což naznačuje frekvenci až 0,8% (CI: 0,58-1,11%) u jedinců testovaných na tyto geny. MYH11, MYH7, KCNQ1 a RYR2 obsahovaly většinu CNV. Konkrétně tam byli vypuštění v 16 genů—KCNQ1, MYH11, MYH7, MYBPC3, PCSK9, BRCA1, RYR2, PKP2, TGFBR2, SMAD3, OTC, NF2, FBN1, DSP, DSC2, a APC—více než polovina z nich mají LOF mechanismy (Doplňující Tabulka 7).