Výskyt a vlastnosti intragenic copy-number variation v Mendelistická onemocnění geny

Prevalence intragenic CNVs ve velké klinické kohorty

testovali Jsme různé podmnožiny 1507 geny v 143,515 nesouvisející osoby uvedené pro diagnostické NGS gen panel testování. Celkem bylo dokončeno ~4,8 milionu jednogenových analýz. Z téměř 8,1 milionu variant všech typů jsme identifikovali 2844 intragenních CNV(1237 odlišných událostí). Tyto CNV představovaly 0,03% všech variant, 3,1% hlášených variant a zejména 9,1% variant klasifikovaných jako LP / P (doplňková Tabulka 1 a doplňkový Obrázek 1). Tyto varianty byly nalezeny napříč 384 geny a jsou zahrnuty 1810 delece a 1034 zdvojování, které dohromady představovaly prevalencí 1,9% v této kohortě, 4.4% mezi jedinci s alespoň jednou hlášeno varianta, a více významně, a to o 9,8% u jedinců, kteří obdrželi zprávu s LP/P varianta jakéhokoli typu.

Vzory intragenic CNV výskyt

CNVs spadl do jedné ze tří kategorií—jednotlivé vzácné události, časté opakující se události, a nízké frekvence opakujících se událostí (Obr. 1a). Každá kategorie představovala přibližně jednu třetinu všech pozorovaných CNV. Drtivá většina z 384 genů s CNV měla každý pouze jeden CNV, ale tyto jednotlivé CNV společně představovaly méně než 10% všech událostí (obr. 1b). Naproti tomu 31 z 384 genů mělo 15 nebo více CNV, ale ty představovaly téměř 70% všech CNV. Kromě frekvencí byly zkoumány intragenní umístění a velikosti CNV, protože tyto vlastnosti mohou určit klinický dopad. Jedna čtvrtina CNV zahrnovala pouze jeden exon. Většina intragenic CNVs jsou multi-exonic částečné-gen akce, a nejvíce postihl pouze vnitřní exons bez zapojení terminálu (první nebo poslední) kódujících exonů (Obr. 1c, d). Mezi dílčí-gen CNVs zahrnující terminálu exons, více delecí než zdvojování zahrnuty první exons, vzhledem k tomu, že podobný počet delecí a duplikací zahrnuty poslední exons. Konečně větší podíl duplikací než delecí zahrnoval celý gen. Téměř jedna pětina všech odlišných (non-redundant) CNVs zahrnuty plnou genu, a v 40 případech, CNVs zahrnoval několik sousedních genů a byli přítomni na minimálně 10 chromozomů (Doplňující Tabulky 1, 2).

obr. 1: Frekvence, velikost, interpretace a distribuce variant copy-number (CNV) pozorovaných u klinicky testovaných genů.

Histogram ukazující počet odlišných CNV pozorovaných v testovaných genech. Sloupce v grafu udávají, kolikrát byly pozorovány CNV. Řádkový graf ukazuje podíl celkových pozorovaných CNV v každém frekvenčním zásobníku. Například první sloupec ukazuje, že téměř 900 CNV se vyskytlo pouze jednou a celkově představovalo zhruba 30% všech CNV. B Histogram ukazující počet genů, které obsahovaly CNV v naší klinické kohortě. Sloupce v grafu ukazují přírůstkové zvýšení počtu CNV pozorovaných v genu. Řádkový graf ukazuje podíl CNV v libovolných přírůstcích výskytu CNV na gen. Například téměř 200 genů mělo pouze 1 CNV, což dohromady představovalo méně než 10% všech událostí. Naproti tomu přibližně 30 genů mělo více než 15 CNV, což představovalo téměř 70% všech CNV. C distribuce delecí a duplikací podle počtu postižených exonů a podle klinické interpretace. Cytogenetické příhody jsou definovány jako souvislé CNV stejné zygosity ovlivňující sousední geny na jednom chromozomu. Některé celku-genu události mohou být ve skutečnosti součástí větší cytogenetické události, ale nejsou uvedeny jako takové, protože ostatní geny v rámci předpokládané cytogenetické případě byly chybějící z našeho testu, a proto k dispozici pro analýzu. D Počet duplikací a delecí CNV zjištěných v klinických a výchozích datech CNV. CNVs jsou rozděleny na ty, včetně celého genu (třídy I, V), alespoň poslední exon (třídy II, VI), alespoň první exon (třídy III, VII) nebo pouze vnitřní exon(s) (třídy IV, VIII). Generická genová struktura je zobrazena nahoře. Zelené a fialové boxy označují „terminální exony“ a všechny ostatní jsou „vnitřní exony“, jak je popsáno v textu. Prázdná pole označují smazané exony. Tento údaj předpokládá, že intragenní duplikace se vyskytují v tandemu, což je často případ takových událostí. CNV zahrnující pouze promotérské regiony nejsou na tomto obrázku zastoupeny. Pearsonova chi-kvadrátová kontingenční tabulka dává P hodnotu p < 1×10-5 pro duplikace a p = 1.5×10-5 pro smazání, což znamená, že rozdíl v distribuci CNVs přes gen není jen kvůli odběru vzorků rozdíly mezi klinickou a základní CNVs. E A f delece a duplikace v klinicky testovaných genech a jejich interpretace. Graf v (e) ukazuje geny s mutačními mechanismy ztráty funkce (LOF) a že v (f) ukazuje geny bez mechanismů ztráty funkce (LOF). Většina genů obsažených v našich panelech byla kurátorována jako mechanismy LOF. Porovnává se klinická klasifikace každého CNV, dědičnost genu s CNV a zygosita variant. U genů vázaných na X (XL) jsou heterozygotní CNV u žen zobrazeny odděleně od CNV u mužů. AD autozomálně dominantní, AR-autozomálně recesivní, F ženy, het heterozygotní, hom homozygotní, M muž, LP pravděpodobně patogenní varianta, P patogenní varianta, VUS variant nejasného významu. „Patogenní“ label v jazyce c, e, a f zahrnuje CNVs klasifikovat jako patogenní a pravděpodobně patogenní

Klinická klasifikace CNVs

Delece byly častější v této klinické kohorty, a většina z nich byla hlášena jako LP/P varianty (Obr. 1c). Několik delecí však bylo klasifikováno jako VUS, především proto, že se jednalo o in-frame varianty v genech bez mutačních mechanismů ztráty funkce (LOF). Naproti tomu více než polovina duplikací byla klasifikována jako VUS. Mezi duplikacemi parciálních genů zahrnovalo 359 terminálních exonů a 225 pouze interní exony (obr. 1d). Alespoň 166 duplikací zahrnující pouze vnitřní exons se předpokládalo, že budou mít nepříznivý vliv na přepis čtení rámu a proto klasifikovány jako LP/P (Doplňující Tabulka 2). Alespoň 30 duplikace, Pozorovali jsme domnělé zarážky založené na datech sekvence s rozděleným čtením a předpovídali tandemové uspořádání, které by narušilo rámec čtení přepisu. To podporuje předchozí tvrzení, že intragenic duplicity jsou typicky lokalizované tandemu přestavby versus složitější akce, jako jsou inzerční translokace.18

také Jsme za distribuci a zygosity CNVs u genů spojených s autozomálně dominantní (AD), autozomálně recesivní (AR) a X-vázaná (XL) poruchy (Obr. 1e, f). Drtivá většina CNVs byly v geny spojené s AD nebo XL dědictví, i když tento výsledek odráží zaujatost, protože většina z testovaných genů byly tyto dědictví vzory. Z 2096 CNV klasifikovaných jako LP / P bylo 85% v genech spojených s dědičností AD nebo XL a 15% v genech spojených s dědičností AR. Druhé, 6,7% bylo homozygotní delece, 2.8% byly složené heterozygotní změny doprovázející patogenní SNV na druhé alely (představující pozitivní molekulární diagnostika pro AR porucha; Doplňující Tabulka 1), a 5,5% byl jeden heterozygotní události.

téměř všechny CNV v této kohortě byly nalezeny v genech s mechanismy LOF (obr. 1e). Většina CNV v těchto genech byla delece klasifikovaná jako patogenní, zatímco více než polovina duplikací byla klasifikována jako VUS. Poměrně 304 genů bez mechanismů LOF mělo málo CNV, většinou klasifikovaných jako VUS nebo benigní (obr. 1f) a výrazně více duplikací než delecí (p = 1,8×10-9).

CNV a morbidita

analýza velkého počtu multigenních panelů ukázala různou prevalenci CNV napříč skupinami onemocnění (obr. 2a, b; doplňková Tabulka 4). Geny s CNV měly buď většinou opakující se události, většinou jedinečné události, nebo kombinaci obou (obr. 2c). Mezi panely, které přinesl alespoň 10 patogenní varianty jakéhokoliv typu, více než třetina CNVs což představuje více než 10% patogenních variant. Gen panely generují nejvyšší počet CNVs ty byly pro spinální muskulární atrofie, Charcot–Marie–Tooth onemocnění, a dystrophinopathies, jak se očekávalo. Nicméně, panely pro vrozené srdeční vady a heterotaxy, Lynch syndrom, nádor, svalové dystrofie, a dystonie také identifikovat mnoho CNVs. Naproti tomu genové panely s nejnižšími frekvencemi CNV zahrnovaly panely pro chronickou pankreatitidu, Rasopatie, kardiomyopatie a dědičnou trombofilii.

obr. 2: varianty patogenních kopií (CNV) podle genu a panelu.

na Panely v každém klinickém oboru jsou zobrazeny s procentem pozitivních zpráv, které zahrnovaly jednu nebo více patogenních CNVs. Zahrnuty jsou pouze panely, které byly klinicky testovány nejméně 100krát a měly alespoň 10 patogenních variant jakéhokoli typu. Každý panel je reprezentován kruhem. b podíl pozitivních zpráv, které zahrnovaly patogenní CNV v různých panelech. Tyto panely byly prvních pět s nejvíce patogenními variantami v každé klinické specialitě. c byly patrné tři vzorce výskytu CNV: rekurentní příhody (např. u PMP22 a SMN1), převážně vzácné jedinečné příhody (např. u DMD a BRCA2) a kombinace obou (např. u BRCA1 a MSH2). Počet odlišných variant je zobrazen modře a další / opakující se pozorování těchto variant jsou zobrazeny zeleně. D frakce patogenních variant, které byly CNV v různých genech. Top pěti geny s nejvíce patogenní varianty jakéhokoliv typu jsou uvedeny v každém klinickém oboru

Genů pro dědičné nádorové syndromy ukázaly vysokou (8.3% celkové; 0-50% rozsahu mezi panely) prevalence CNVs mezi patogenní varianty (Obr. 2a; doplňkové tabulky 3 a 4). Z 1059 patogenních CNV pozorovaných u těchto genů bylo 219 pozorováno pouze jednou a 174 se opakovalo. BRCA1 a BRCA2 měl v kombinaci CNV prevalence 6,1% (interval spolehlivosti : 5.4–o 6,9%), mezi patogenní varianty, v souladu s předchozí studií (individuálně, BRCA1 11.4%, BRCA2 1,7%).15,19,20 CNVs byly také obohacené jinými geny, jako EPCAM, STK11, a VHL, a v genech na různých panely s nízkou celkovou diagnostiku výnosy. Pomocí našeho NGS metody, jsme také pozorován 90 CNVs v segmentově duplicitní exons 12-15 funkční kopii genu PMS2 (Doplňující Tabulka 1). Naposledy bylo 25 CNV pozorováno v promotorových oblastech grem1, TP53 a APC.

CNVs u genů spojených s pediatrickou a vzácné poruchy představovaly 7,7% patogenních variant (0-82% rozsahu mezi panely; Obr. 2c). Našli jsme nejvyšší frekvence CNVs u panelů pro časný infantilní epileptická encefalopatie, Joubert syndrom, tuberózní skleróza a mozková kavernózní malformace (Doplňující Tabulka 4). Geny nejčastěji ovlivněné patogenními CNV byly NF1, NPHP1 a TSC2 (doplňková Tabulka 3). Mezi epilepsií geny, jsme pozorovali CNVs zahrnující UBE3A v 15q13.1 a PRRT2 v 16p11.2, které byly pravděpodobně rekurentní cytogenetické přestavby. Pozorovali jsme nižší frekvence CNV v genových panelech pro ciliopatie, Rasopatie, osteogenesis imperfecta a cystickou fibrózu (doplňková Tabulka 4). Noonan syndrom a chronická pankreatitida panely identifikovány velmi málo nebo žádné patogenní CNVs, i když alespoň 270 jedinců, byly testovány a více než 60 patogenní varianty byly hlášeny v každém panelu.

geny pro kardiovaskulární poruchy vykazovaly poměrně nižší prevalenci CNV mezi patogenními variantami (celkově 4, 7%; 0-16, 7% rozmezí mezi panely). Nejvyšší frekvence CNVs došlo v panelech pro kardiomyopatie a onemocnění kosterního svalstva (podmnožina komplexní kardiomyopatie panel), familiární hypercholesterolemie, a Brugada syndrom (Doplňující Tabulka 4). Naopak, velmi málo CNVs byly nalezeny v panelech pro arytmie (jiné než Brugada) a aortopathies, vzhledem k tomu, že kardiomyopatie panel měl nejnižší výskyt patogenních CNVs. Geny s nejvyšším počtem patogenních CNVs byly LDLR, FBN1, PKP2, MYBPC3, a RYR2 (Doplňující Tabulka 3). V některých panelech vykazujících zjevně vysokou prevalenci CNV byla většina, ne-li všechny CNV, pouze v jednom nebo dvou genech (např. Panely pro kardiovaskulární poruchy s nejvyšší celkovou diagnostiku výnos měl také geny s nejvyšší prevalencí CNVs, s výjimkou těch, pro arytmie a kardiomyopatie, které byly vyčerpány CNVs a v nichž většinou pozitivní diagnózy byly místo toho vysvětlil SNVs.

Genových panelů pro neurologické poruchy (většinou neuromuskulární poruchy v našem panely) ukázaly, že nejvyšší prevalence intragenic CNVs mezi patogenní varianty (35% celkově 0-100% rozsahu mezi panely; Obr. 2a, c; doplňková Tabulka 4). Tento výsledek byl do značné míry vysvětlen rekurentní duplikací genů a reciproční delecí v PMP22, delecemi v SMN1 a různými CNV v DMD(doplňková Tabulka 3; obr. 2c, d; Doplňkový Obrázek 2). Pomocí vlastní metody NGS jsme našli 135 případů delece SMN1 u 819 jedinců s podezřením na spinální svalovou atrofii a rozsah kopií SMN2 se pohyboval od 0 do 5. I když PMP22, SMN1, a DMD byly vyloučeny, intragenic CNVs v genech spojených s neurologickými poruchami stále představuje 6% všech patogenních variant v naší kohortě. Jiné geny pro neurologické poruchy běžně postižené CNV zahrnovaly PARK2, LAMA2 a SPG11.

Analýza základní CNVs

Naše diagnostické testování byla omezena na onemocnění geny zabaveno lékaři, ale mnoho genů nesouvisí s prezentaci klinického fenotypu byly také sekvenovány na naše NGS testy. Jsme de-identified data pro všechny 1507 geny sekvenovány v 143,142 jednotlivců a zkoumali výskyt intragenic CNVs v non-zabaveno geny odhadnout základní výskytu těchto událostí. Tyto CNV nezávislé na fenotypu jsou dále označovány jako “ základní CNV.“Hledání výchozích CNV bylo provedeno u 7-616 genů na jednotlivce pro celkem 16 milionů jednogenových analýz. Toto hledání přineslo 4054 intragenních CNV (1465 odlišných událostí) u 3772 jedinců napříč 599 geny (doplňková Tabulka 5). Většina z těchto CNV byla přítomna pouze jednou ,ale několik z nich bylo vidět 2 až více než 15krát (obr. 3a; doplňková Tabulka 6). Rekurentní příhody však v souhrnu představovaly většinu výchozích pozorování CNV. Drtivá většina genů s výchozími CNV měla pět nebo méně příhod (obr. 3b). Pouhých 47 genů obsahovalo více než polovinu všech pozorovaných výchozích CNV, včetně obou genů s identickými opakujícími se událostmi a genů s množstvím jedinečných událostí. Většina jedinců s intragenní základní CNV měla pouze jednu událost, ale 146 jedinců mělo další CNV v genech na různých chromozomech. V průměru jsme detekovali základní CNV rychlostí 1 z každých 3979 genů sekvenovaných našimi testy.

obr. 3: Výchozí varianty kopírovacího čísla (CNV) nesouvisející s klinickým fenotypem ve Velké kohortě.

klinický význam těchto CNVs nebyl hodnocen nad jejich delece v American College of Medical Genetics and Genomics–uvedené geny se známou ztráta-of-funkce (LOF) mutační mechanismy. CNV v genech, které patřily ke stejné klinické specialitě jako ty, které byly objednány pro klinické testování, byly z analýzy odstraněny. Single-exon nízkokvalitní hovory byly odstraněny, aby se snížily potenciální falešně pozitivní hovory. Histogram ukazující počet odlišných CNV pozorovaných v genech analyzovaných pro základní CNV. Sloupce v grafu ukazují, kolikrát byly pozorovány CNV. Řádkový graf ukazuje podíl celkových pozorovaných CNV v každém frekvenčním zásobníku. Například, první sloupec ukazuje, že více než 1100 CNVs došlo jen jednou, v souhrnu tvořily zhruba 25% všech CNVs. Naproti tomu poslední sloupec uvádí, že 36 CNV bylo nalezeno více než 15krát a představovalo více než 40% všech výchozích CNV. B Histogram ukazující počet genů, které obsahovaly základní CNV. Sloupce v grafu ukazují přírůstkové zvýšení počtu CNV pozorovaných v genu. Řádkový graf ukazuje podíl CNV v libovolných přírůstcích výskytu CNV na gen. Například téměř 240 genů mělo pouze jeden CNV a společně tyto CNV představovaly zhruba 6% všech událostí. Naproti tomu přibližně 45 genů mělo více než 15 CNV, což představovalo o něco více než 60% všech CNV. C distribuce výchozích CNV je zobrazena podle počtu postižených exonů. Multiexon CNV zahrnují tři třídy 5 ‚terminálních exonů, Interních exonů a 3‘ terminálních exonů. (D A E) zátěž výchozích CNV v genech podle způsobu dědičnosti a zygosity. CNV v genech s LOF mutačními mechanismy jsou uvedeny částečně (d) a ty v genech bez LOF mechanismů jsou uvedeny částečně (e). CNV v genech vázaných na X (XL) byly kategorizovány jako ty, které byly pozorovány jako heterozygotní příhody u žen a hemizygotní příhody u mužů. AD autozomálně dominantní, AR-autozomálně recesivní, F-žena, M muž, het heterozygotní, homozygotní hom

V kontrastu k CNVs identifikovány v klinicky testovaných genů v této skupině, nejvíce základní intragenic CNVs byly duplicity (Fíky. 1c, d a 3c). Většina z nich byla také heterozygotními variantami v genech AR nebo genech, které postrádaly zavedené mechanismy LOF (obr. 3d,e). Menšina výchozích CNV se vyskytla v genech spojených s dědičností AD nebo mechanismy LOF(obr. 1e, f a 3d, e). Nejčastější základní CNVs součástí celku-genu události v NPHP1, NIPA1, MYH11, DNAI2, HFE2, SMN1, a PMP22 a částečné-gen akce v TFG, BBS9, CTNNA3, PARK2, KCTD7, DNAJC6, GLIS2, a TUBB4A (Doplňující Tabulka 6). Pokud jde o vlastnosti, které mohou vysvětlit existenci základní CNVs v nemoc, geny, jsme zaznamenali, že téměř 40% z těchto CNVs obsáhla celý gen, a proto to není přímo narušit přepis čtení snímků (Obr. 3c). Dále zhruba 90% duplikací v genech s LOF mechanismy byly celé-gen akce nebo dílčí-gen akce včetně terminální exon, vzhledem k tomu, že pouze polovina delece těchto genů ukázala, že stejné vzory (Doplňující Tabulka 5).

kromě hodnocení celkové prevalence a vlastností výchozích CNV jsme zvažovali předpokládané klinické důsledky. Pozorovali jsme 237 heterozygotní delece v 97 genů s AD nebo XL dědictví a LOF mechanismy; nejvíce byly v PMP22, DMD, VÝROČNÍCH zpráv o činnosti, KCNQ1, FIG4, CHEK2, a LRSAM1 (Doplňující Tabulky 5 a 7). Našli jsme pouze dva homozygotní delece v genech s AR dědičnost (NPHP1 a SPG7) a pouze dva hemizygous delece v jediném genu s XL dědictví (DMD) u mužů. Všechny ostatní homozygotní CNVs u genů s AR dědičnost, nebo hemizygous CNVs u genů s XL dědičnost u mužů, byly duplicity. Dále jsme pozorovali CNV specificky v genech s ohledem na lékařskou účinnost podle ACMG.21,22 Jsme hodnotili CNVs u 58 59 ACMG-uvedené geny (kromě PMS2) v 5,300–69,000 jedinců v závislosti na testy používané pro testování. Bylo zjištěno celkem 46 delecí a 110 duplikací, což naznačuje frekvenci až 0,8% (CI: 0,58-1,11%) u jedinců testovaných na tyto geny. MYH11, MYH7, KCNQ1 a RYR2 obsahovaly většinu CNV. Konkrétně tam byli vypuštění v 16 genů—KCNQ1, MYH11, MYH7, MYBPC3, PCSK9, BRCA1, RYR2, PKP2, TGFBR2, SMAD3, OTC, NF2, FBN1, DSP, DSC2, a APC—více než polovina z nich mají LOF mechanismy (Doplňující Tabulka 7).

Napsat komentář

Vaše e-mailová adresa nebude zveřejněna.

Previous post Jak Nainstalovat NetBeans IDE 12 v Debianu, Ubuntu a Linux Mint
Next post V 83 tento muž zůstává na špici fitness