introgeenisten CNV: iden prevalenssi suuressa kliinisessä kohortissa
testasimme 1507 geenin eri osajoukkoja 143 515 toisiinsa liittymättömällä yksilöllä, jotka on tarkoitettu diagnostiseen NGS-geenipaneelin testaukseen. Yhteensä noin 4,8 miljoonaa yhden geenin analyysiä valmistui. Lähes 8,1 miljoonasta eri muunnoksesta tunnistimme 2844 introgeenistä CNV :tä (1237 erillistä tapahtumaa). Näiden CNV: iden osuus kaikista muunnoksista oli 0,03 prosenttia, ilmoitetuista muunnoksista 3,1 prosenttia ja erityisesti 9,1 prosenttia LP/P-luokitelluista muunnoksista (täydentävä Taulukko 1 ja täydentävä Kuva 1). Näitä variantteja löytyi 384 geenistä, ja ne sisälsivät 1810 deleetiota ja 1034 kahdennusta, mikä yhdessä edusti 1,9%: n esiintyvyyttä tässä kohortissa, 4,4%: n esiintyvyyttä yksilöillä, joilla oli vähintään yksi raportoitu muunnos, ja mikä merkittävämpää, 9,8%: n esiintyvyyttä henkilöillä, jotka saivat raportin, jossa oli minkä tahansa tyyppinen LP/P-muunnos.
geeni—CNV: n Esiintymistavat
CNV: t jakautuivat yhteen kolmesta kategoriasta-yksittäiset harvinaiset tapahtumat, yleiset toistuvat tapahtumat ja matalataajuiset toistuvat tapahtumat (Kuva. 1 A). Kunkin luokan osuus kaikista havaituista CNV-arvoista oli noin kolmannes. Suurimmalla osalla 384 geenistä, joilla oli CNV: t, oli vain yksi CNV kussakin, mutta nämä yksittäiset CNV: t yhdessä muodostivat alle 10% kaikista tapahtumista (Kuva. 1b). Sitä vastoin 31 geenissä 384 geenistä oli 15 tai enemmän CNV: tä, mutta nämä edustivat lähes 70 prosenttia kaikista CNV: istä. Frekvenssien lisäksi tutkittiin CNV: n introgeenisiä paikkoja ja kokoja, koska nämä ominaisuudet voivat määrittää kliinisen vaikutuksen. Neljäsosa CNV: stä sisälsi vain yhden eksonin. Suurin osa introgeenisistä CNV: istä oli monieksonisia osittaisgeenin tapahtumia, ja useimmat käsittivät vain sisäiset eksonit ilman terminaalisia (ensimmäinen tai viimeinen) koodaavia eksoneja (Fig. 1c, d). Terminaalisia eksoneja sisältävistä osittaisgeenin CNVs: istä useampiin deleetioihin kuin kahdennuksiin sisältyi ensimmäiset eksonit, kun taas vastaavaan määrään deleetioita ja kahdennuksia sisältyi viimeiset eksonit. Lopulta poistoja suurempi osa kahdennuksista sisälsi koko geenin. Lähes viidesosa kaikista erillisistä (ei-redundanteista) CNV: istä sisälsi täyden geenin, ja 40 tapauksessa CNV: t käsittivät useita viereisiä geenejä ja niitä oli vähintään 10 kromosomissa (Lisätaulukot 1, 2).
CNVs: n kliininen luokitus
Deleetiot olivat yleisempiä tässä kliinisessä kohortissa, ja useimmat raportoitiin LP/P-variantteina (Kuva. 1c). Muutama deleetio luokiteltiin kuitenkin VUS: ksi lähinnä siksi, että ne olivat geeneissä olevia kehysvariantteja, joilla ei ollut LOF-mutaatiomekanismeja (loss-of-function, LOF). Sen sijaan yli puolet kaksoiskappaleista luokiteltiin VUS: ksi. Osittaisgeenin kahdennuksista 359 liittyi terminaalisiin eksoneihin ja 225 pelkästään sisäisiin eksoneihin (Kuva. 1d). Ainakin 166 kaksoiskappaleen, jotka sisälsivät vain sisäiset eksonit, ennustettiin vaikuttavan haitallisesti transkription lukukehykseen, minkä vuoksi ne luokiteltiin LP/P: ksi (täydentävä Taulukko 2). Ainakin 30 päällekkäisyyksiä, havaitsimme oletettuja breakpoints perustuu split-read sequence data ja ennusti tandem järjestely, joka häiritsisi transkripti lukukehys. Tämä tukee aiempia väitteitä, että introgeeniset päällekkäisyydet ovat tyypillisesti paikallisia tandem-uudelleenjärjestelyjä vs. monimutkaisempia tapahtumia, kuten insertionaalisia translokaatioita.18
tarkastelimme myös CNV: n jakautumista ja tsygositeettia autosomaalisesti dominoiviin (AD), autosomaalisesti resessiivisiin (AR) ja X-linkittyneisiin (XL) häiriöihin liittyvissä geeneissä (Fig. 1 e,f). Valtaosa CNVs: stä oli geeneissä, jotka liittyvät AD-tai XL-perintöön, vaikka tämä tulos heijastaa harhaa, koska suurimmalla osalla testatuista geeneistä oli nämä periytymismallit. LP/P-luokkaan luokitelluista 2096 CNVs: stä 85% oli AD-tai XL-periytymiseen liittyvissä geeneissä ja 15% AR-periytymiseen liittyvissä geeneissä. Jälkimmäisistä 6, 7% oli homotsygoottisia deleetioita, 2, 8% oli yhdisteen heterotsygoottisia muutoksia, jotka liittyivät patogeeniseen SNV: hen toisessa alleelissa (mikä on positiivinen MOLEKYYLIDIAGNOOSI AR-häiriölle; täydentävä Taulukko 1), ja 5, 5% oli yksittäisiä heterotsygoottisia tapahtumia.
lähes kaikki tämän kohortin CNV: t löytyivät geeneistä, joilla oli LOF-mekanismit (Kuva. 1 e). Useimmat näiden geenien CNV: t olivat patogeenisiksi luokiteltuja deleetioita, kun taas yli puolet kaksoiskappaleista luokiteltiin VUS: iin. Verrattain 304 geenissä, joilla ei ollut LOF-mekanismeja, oli vain vähän CNV: tä, jotka luokiteltiin useimmiten vus: iin tai hyvänlaatuisiin (Fig. 1f), ja huomattavasti enemmän päällekkäisyyksiä kuin poistoja (p = 1,8×10-9).
CNVs ja sairastuvuus
suuren määrän monigeenipaneeleita analysointi osoitti CNV: n esiintyvyyden vaihtelevan eri tautiryhmien välillä (Kuva. 2a, b; täydentävä Taulukko 4). Geeneillä, joilla oli CNVs, oli joko enimmäkseen toistuvia tapahtumia, enimmäkseen ainutlaatuisia tapahtumia, tai sekoitus molempia (Kuva. 2c). Niistä paneeleista, jotka olivat tuottaneet vähintään 10 patogeenistä varianttia mistä tahansa tyypistä, yli kolmanneksessa oli CNV: t, joiden osuus oli yli 10 prosenttia patogeenisistä variansseista. Eniten CNV: tä tuottavia geenipaneeleita olivat odotetusti selkärangan lihasatrofian, Charcot–Marie–Hammassairauden ja dystrofinopatioiden geenipaneelit. Synnynnäisiä sydänvikoja ja heterotaksiaa, Lynchin oireyhtymää, sarkoomaa, lihasdystrofiaa ja dystoniaa selvittävissä tutkimuksissa tunnistettiin kuitenkin myös monia CNV: Itä. Sen sijaan matalimmat CNV-frekvenssit omaaviin geenipaneeleihin kuuluivat kroonisen haimatulehduksen, Rasopatioiden, kardiomyopatioiden ja perinnöllisen trombofilian geenipaneelit.
perinnöllisten syöpäoireyhtymien geenit osoittivat CNV: n esiintyvyyden patogeenisten varianttien keskuudessa olevan korkea (8,3% kokonaisuudesta; 0-50% vaihteluväli paneeleista) (Kuva. 2a; Lisätaulukot 3 ja 4). Näissä geeneissä havaituista 1059 patogeenisestä CNV: stä 219 havaittiin vain kerran ja 174 toistui. BRCA1 : n ja BRCA2: n yhdistetty CNV–esiintyvyys oli 6, 1% (luottamusväli: 5, 4-6, 9%) patogeenisten varianttien keskuudessa, mikä on yhdenmukaista aiempien tutkimusten kanssa (erikseen BRCA1 11.4% , BRCA2 1, 7%).15,19,20 CNV: tä rikastettiin myös muissa geeneissä, kuten EPCAM: ssa, STK11: ssä ja VHL: ssä, sekä geeneissä eri paneeleissa, joiden yleinen diagnostinen tuotto oli alhainen. Käyttämällä NGS-menetelmää havaitsimme myös 90 CNVs: ää pms2: n funktionaalisen geenikopion segmentaalisesti kahdennetuissa eksoneissa 12-15 (täydentävä Taulukko 1). Viimeksi havaittiin 25 CNV: tä grem1: n, TP53: n ja APC: n promoottorialueilla.
lapsilla esiintyviin ja harvinaisiin sairauksiin liittyvien geenien CNV: t muodostivat 7, 7% patogeenisistä muunnoksista (0-82%: n vaihteluväli paneeleissa; Kuva. 2c). Löysimme korkeimmat CNV: n esiintymistiheydet paneeleista varhaisen infantiilin epileptisen enkefalopatian, Joubertin oireyhtymän, tuberoosiskleroosin ja aivojen kavernaalisten epämuodostumien osalta (täydentävä Taulukko 4). Geenit, joihin patogeeniset CNV: t useimmin vaikuttivat, olivat NF1, NPHP1 ja TSC2 (täydentävä Taulukko 3). Epilepsiageeneistä havaitsimme CNV: tä, johon liittyi UBE3A: ta 15q13.1: ssä ja PRRT2: ta 16P11.2: ssa, jotka olivat todennäköisesti toistuvia sytogeneettisiä uudelleenjärjestelyjä. Havaitsimme matalampia CNV-frekvenssejä geenipaneeleissa, jotka koskivat siliopatioita, Rasopatioita, osteogenesis imperfecta-bakteeria ja kystistä fibroosia (täydentävä Taulukko 4). Noonanin oireyhtymää ja kroonista haimatulehdusta käsittelevissä paneeleissa tunnistettiin hyvin vähän tai ei lainkaan patogeenisiä CNV: Itä, vaikka ainakin 270 yksilöä testattiin ja kussakin paneelissa raportoitiin yli 60 patogeenista varianttia.
sydän-ja verisuonisairauksien geeneissä CNV: n esiintyvyys oli suhteessa pienempi patogeenisten varianttien keskuudessa (4, 7% kaiken kaikkiaan; 0-16, 7%: n vaihteluväli paneeleissa). CNVs: n esiintymistiheydet olivat korkeimmat kardiomyopatiaa ja luustolihassairautta (kattavan kardiomyopatiapaneelin alaryhmä), familiaalista hyperkolesterolemiaa ja Brugadan oireyhtymää sairastavilla paneeleilla (täydentävä Taulukko 4). Sen sijaan rytmihäiriöitä (Brugadaa lukuun ottamatta) ja aortopatioita käsittelevissä paneeleissa havaittiin hyvin vähän CNV: tä, kun taas kardiomyopatioita käsittelevässä paneelissa patogeenisten CNV: iden esiintyvyys oli pienin. Geenit, joissa oli eniten patogeenisiä CNV: Itä, olivat LDLR, FBN1, PKP2, MYBPC3 ja RYR2 (täydentävä Taulukko 3). Joissakin paneeleissa, joissa CNV: n esiintyvyys on ilmeisen korkea, useimmat, jos eivät kaikki, olivat vain yhdessä tai kahdessa geenissä (esim.ENG ja LDLR). Kardiovaskulaarisia sairauksia käsittelevillä paneeleilla, joiden kokonaisdiagnostiikkatuotto oli suurin, oli myös ne geenit, joilla oli korkein CNV: n esiintyvyys, lukuun ottamatta rytmihäiriöitä ja kardiomyopatioita koskevia geenejä, jotka olivat vähentyneet CNV: stä ja joissa positiivisimmat diagnoosit selitettiin sen sijaan SNV: llä.
neurologisten häiriöiden Geenipaneelit (enimmäkseen neuromuskulaariset häiriöt paneeleissamme) osoittivat introgeenisten CNV: iden suurimman esiintyvyyden patogeenisten varianttien keskuudessa (yhteensä 35%, paneeleissa 0-100%; Kuva. 2a, c; täydentävä Taulukko 4). Tämä tulos selittyi suurelta osin toistuvalla geenien kahdentumisella ja vastavuoroisella deleetiolla PMP22: ssa, deleetioilla SMN1: ssä ja erilaisilla CNV: llä DMD: ssä (täydentävä Taulukko 3; kuva. 2C, d; lisäkuva 2). Käyttämällä mukautettua NGS-menetelmää löysimme 135 smn1-poistotapausta 819 henkilön joukosta, joilla epäiltiin selkärangan lihasatrofiaa, ja SMN2-kopioiden valikoima vaihteli 0: sta 5: een. Vaikka pmp22, SMN1 ja DMD jätettiin pois, neurologisiin häiriöihin liittyvien geenien Introgeeniset CNV: t edustivat edelleen 6%: a kaikista patogeenisistä variaatioista kohortissamme. Muita neurologisten häiriöiden geenejä, joihin CNVs yleensä vaikuttaa, olivat PARK2, LAMA2 ja SPG11.
lähtötilanteen CNVs
diagnostinen testimme rajoittui lääkäreiden takavarikoimiin tautigeeneihin, mutta NGS-testeissämme sekvensoitiin myös monia geenejä, jotka eivät liity esittävään kliiniseen fenotyyppiin. Poistimme tunnistetiedot kaikista 1507 geenistä, jotka on sekvensoitu 143 142 yksilöön, ja tutkimme introgeenisten CNV: iden esiintymistä ei-vaadituissa geeneissä arvioidaksemme näiden tapahtumien prevalenssin. Näistä fenotyypistä riippumattomista CNV: istä käytetään jäljempänä nimitystä ” perusnvv: t.”Lähtötilanteen CNVs: ää haettiin 7-616 geenistä yksilöä kohti yhteensä 16 miljoonasta yhden geenin analyysistä. Tämä tutkimus tuotti 4054 introgeenistä CNV :tä (1465 erillistä tapahtumaa) 3772 yksilöllä 599 geenissä (täydentävä Taulukko 5). Useimmat näistä CNV: t olivat läsnä vain kerran, mutta muutama nähtiin 2-15 kertaa (Kuva. 3a; täydentävä Taulukko 6). Toistuvien tapahtumien yhteenlaskettu osuus oli kuitenkin suurin osa CNV: n perustason havainnoista. Suurimmalla osalla geeneistä, joilla oli lähtötilanteen CNVs, oli viisi tai vähemmän tapahtumia(Kuva. 3b). Vain 47 geeniä sisälsi yli puolet kaikista havaituista lähtötilanteen CNV-arvoista, mukaan lukien molemmat geenit, joilla oli samat toistuvat tapahtumat ja useita ainutlaatuisia tapahtumia. Useimmilla yksilöillä, joilla oli introgeeninen lähtötason CNV, oli vain yksi tapahtuma, mutta 146 yksilöllä oli ylimääräisiä CNV-arvoja eri kromosomeissa olevissa geeneissä. Keskimäärin havaitsimme CNV: n lähtötason nopeudella, joka oli yksi jokaisesta 3979 geenistä, jotka oli sekvensoitu testeissämme.
toisin kuin tämän kohortin kliinisesti testatuissa geeneissä tunnistetuissa CNV: issä, useimmat lähtötilanteen introgeeniset CNV: t olivat kahdennettuja (Figs. 1c, d ja 3c). Useimmat olivat myös heterotsygoottisia variantteja AR-geeneissä tai geeneissä, joilla ei ollut vakiintuneita LOF-mekanismeja (Fig. 3d, e). Vähemmistö lähtötilanteen CNVs: stä esiintyi geeneissä, jotka liittyivät AD: n periytymiseen tai LOF: n mekanismeihin (Figs. 1e, f ja 3d, e). Tavallisimpiin perusnormaaleihin sisältyivät nphp1: n, NIPA1: n, MYH11: n, DNAI2: n, HFE2: n, SMN1: n ja PMP22: n kokogeenitapahtumat ja TFG: n, BBS9: n, CTNNA3: n, PARK2: n, KCTD7: n, DNAJC6: n, GLIS2: n ja TUBB4A: n osittaisgeenitapahtumat (täydentävä Taulukko 6). Niiden ominaisuuksien osalta, jotka voivat selittää taudin geeneissä esiintyvien perusnormien olemassaolon, olemme todenneet, että lähes 40% näistä Geeninormeista käsitti kokonaisen geenin, joten ne eivät suoraan häirinneet transkriptioiden lukukehyksiä (Kuva. 3c). Lisäksi noin 90% LOF-mekanismilla varustettujen geenien kaksoiskappaleista oli kokogeenin tapahtumia tai osageenin tapahtumia, mukaan lukien terminaalinen eksoni, kun taas vain puolessa näiden geenien deleetioista esiintyi samoja kuvioita (täydentävä Taulukko 5).
lähtötilanteen CNV: n yleisen esiintyvyyden ja ominaisuuksien arvioinnin lisäksi tarkastelimme ennustettuja kliinisiä seuraamuksia. Havaitsimme 237 heterotsygoottista deleetiota 97 geenissä, joilla oli AD-tai XL-periytyvyys ja LOF-mekanismit; useimmat olivat pmp22 -, DMD -, AARS -, KCNQ1 -, FIG4 -, CHEK2-ja LRSAM1-geeneissä (Lisätaulukot 5 ja 7). Löysimme vain kaksi homotsygoottista deleetiota geeneistä, joilla on AR-perintö (NPHP1 ja SPG7) ja vain kaksi hemizygoottista deleetiota yhdestä geenistä, jolla on XL-perintö (DMD) uroksilla. Kaikki muut homotsygoottiset CNV: t geeneissä, joilla on AR-periytyvyys, tai hemizygoottiset CNV: t geeneissä, joilla on XL-periytyvyys miehillä, olivat kaksoiskappaleita. Lisäksi havaitsimme CNV: tä nimenomaan geeneissä, joissa on ACMG: n mukaan lääketieteellistä toimintakykyä koskevia näkökohtia.21,22 arvioimme CNVs: ää 58: ssa 59: stä ACMG–listatusta geenistä (pms2: ta lukuun ottamatta) 5 300-69 000 yksilöllä riippuen testauksessa käytetyistä määrityksistä. Yhteensä 46 deleetiota ja 110 kaksoiskappaletta havaittiin, mikä viittaa siihen, että esiintyvyys oli jopa 0, 8% (CI: 0, 58–1, 11%) kyseisten geenien varalta testatuilla henkilöillä. Myh11, MYH7, KCNQ1 ja RYR2 sisälsivät suurimman osan CNV: stä. Deleetioita oli erityisesti 16 geenissä—KCNQ1, MYH11, myh7, MYBPC3, PCSK9, BRCA1, RYR2, PKP2, TGFBR2, SMAD3, OTC, NF2, FBN1, DSP, DSC2 ja APC—joista yli puolella on LOF-mekanismeja (täydentävä Taulukko 7).