prevalenciája intragén CNV-k egy nagy klinikai kohorsz
teszteltük különböző részhalmazai 1507 gének 143 515 független egyének említett diagnosztikai NGS gén panel vizsgálat. Összesen ~4,8 millió egygénes elemzés készült el. Az összes típus közel 8,1 millió változata közül 2844 intragén CNV-t azonosítottunk (1237 különálló esemény). Ezek a CNV-k az összes változat 0,03% – át, a jelentett változatok 3,1% – át, és nevezetesen az LP/P kategóriába sorolt változatok 9,1% – át tették ki (1.Kiegészítő táblázat és 1. Kiegészítő ábra). Ezeket a variánsokat 384 génben találták meg, és 1810 deléciót és 1034 duplikációt tartalmaztak, amelyek együttesen 1,9% – os prevalenciát jelentettek ebben a kohorszban, 4,4% – ot a legalább egy jelentett variánssal rendelkező egyének között, és ami még jelentősebb, 9,8% – ot azok között, akik bármilyen típusú LP/P variánssal kaptak jelentést.
az intragén CNV előfordulásának mintái
a CNV—k a három kategória egyikébe tartoztak-egyszeri ritka események, gyakori ismétlődő események és alacsony frekvenciájú ismétlődő események (ábra. 1a). Mindegyik kategória az összes megfigyelt CNV körülbelül egyharmadát képviselte. A CNV-kkel rendelkező 384 gén túlnyomó többségének csak egy CNV volt, de ezek az egyetlen CNV-k együttesen az összes esemény kevesebb mint 10% – át tették ki (ábra. 1b). Ezzel szemben a 31 384 génből 15 vagy több CNV volt, de ezek az összes CNV közel 70% – át képviselték. A frekvenciákon kívül megvizsgálták a CNV-k intragén helyét és méretét, mivel ezek a tulajdonságok meghatározhatják a klinikai hatást. A CNV-k egynegyede csak egy exont tartalmazott. Az intragén CNV-k többsége multiexonikus parciális génes események voltak, és a legtöbb csak belső exonokat ölelt fel, anélkül, hogy a terminális (első vagy Utolsó) kódoló exonokat bevonták volna (ábra. 1c,d). A terminális exonokat érintő részleges génű CNV-k között több deléció, mint duplikáció volt az első exon, míg hasonló számú deléció és duplikáció volt az utolsó exon is. Végül a duplikációk nagyobb hányada, mint a deléciók, tartalmazta a teljes gént. A különböző (nem redundáns) CNV-k közel egyötöde tartalmazott egy teljes gént, és 40 esetben a CNV-k több szomszédos gént is felöleltek, és legalább 10 kromoszómán voltak jelen (1.és 2. Kiegészítő táblázat).
A
CNV-k klinikai osztályozása gyakoribb volt ebben a klinikai kohorszban, és a legtöbb esetben LP/P variánsként számoltak be (ábra. 1c). Néhány törlést azonban a VU-k közé soroltak, elsősorban azért, mert a funkcióvesztés (lof) mutációs mechanizmusok nélküli gének keretváltozatai voltak. Ezzel szemben a duplikációk több mint felét Vu-knak minősítették. A részleges gén duplikációk közül 359 terminális exonokat, 225 pedig csak belső exonokat érintett (ábra. 1d). Az előrejelzések szerint legalább 166, csak belső exonokat tartalmazó duplikáció káros hatással lesz az átirat leolvasási keretére, ezért LP/P kategóriába sorolják (2.Kiegészítő táblázat). Legalább 30 duplikáció esetén feltételezett töréspontokat figyeltünk meg osztott olvasási szekvenciaadatok alapján, és megjósoltunk egy tandem elrendezést, amely megzavarja az átirat olvasási keretét. Ez alátámasztja azt a korábbi állítást, miszerint az intragén duplikációk jellemzően lokalizált tandem átrendeződések, szemben a bonyolultabb eseményekkel, például az inszerciós transzlokációkkal.18
megvizsgáltuk a CNV-k eloszlását és zigozitását az autoszomális domináns (AD), autoszomális recesszív (AR) és X-kapcsolt (XL) rendellenességekhez kapcsolódó génekben (ábra. 1e, f). A CNV-k túlnyomó többsége AD vagy XL öröklődéshez kapcsolódó génekben volt, bár ez az eredmény elfogultságot tükröz, mivel a vizsgált gének többségének ilyen öröklési mintái voltak. Az LP/P kategóriába sorolt 2096 CNV-k 85% – a az AD vagy XL öröklődéshez kapcsolódó génekben, 15% – a pedig az AR öröklődéshez kapcsolódó génekben volt. Az utóbbiak közül 6,7% volt homozigóta deléció, 2,8% volt összetett heterozigóta változás, amely a másik allél patogén SNV-jét kísérte (pozitív molekuláris diagnózist jelent egy AR rendellenességre; kiegészítő táblázat 1), 5,5% pedig egyszeri heterozigóta esemény volt.
ebben a kohorszban szinte az összes CNV-t lof mechanizmusú génekben találták (ábra. 1e). Ezekben a génekben a legtöbb CNV patogénnek minősített deléció volt, míg a duplikációk több mint felét VUS-ként osztályozták. Viszonylag, a lof mechanizmusok nélküli 304 génnek kevés CNV – je volt, többnyire VUS vagy jóindulatú (ábra. 1f), és lényegesen több duplikáció, mint törlések (p = 1,8 60-9).
CNVs és morbiditás
nagyszámú multigén panel elemzése különböző CNV prevalenciát mutatott a betegségcsoportok között (ábra. 2A, B; 4. Kiegészítő táblázat). A CNV-kkel rendelkező gének többnyire visszatérő eseményekkel, többnyire egyedi eseményekkel vagy mindkettő keverékével rendelkeztek (ábra. 2c). Azok közül a panelek közül, amelyek legalább 10 bármilyen típusú patogén variánst eredményeztek, több mint egyharmadának volt CNV-je, amely a patogén variánsok több mint 10% – át tette ki. A legtöbb CNV-t eredményező génpanelek a spinális izom atrófia, a Charcot-Marie-Tooth betegség és a dystrophinopathiák voltak, ahogy az várható volt. A veleszületett szívhibák és a heterotaxia, a Lynch-szindróma, a szarkóma, az izomdisztrófia és a dystonia paneljei azonban számos CNV-t azonosítottak. Ezzel szemben a legalacsonyabb CNV frekvenciájú génpanelek közé tartoztak a krónikus pancreatitis, Rasopathiák, cardiomyopathiák és örökletes thrombophilia.
az örökletes rákos szindrómák génjei a CNV-k magas (összesen 8,3%; 0-50% – os tartomány a panelek között) prevalenciáját mutatták a patogén variánsok között (ábra. 2a; 3. és 4. Kiegészítő táblázat). Az ezekben a génekben megfigyelt 1059 patogén CNV közül 219-et csak egyszer figyeltek meg, 174 pedig visszatérő volt. A BRCA1 és a BRCA2 kombinált CNV prevalenciája 6,1% volt (konfidencia intervallum : 5,4–6,9%) a patogén variánsok között, összhangban a korábbi vizsgálatokkal (egyénileg, BRCA1 11.4% , BRCA2 1, 7% ).15,19,20 CNV-t dúsítottak más génekben is, mint például az EPCAM, az STK11 és a VHL, valamint a különböző panelek génjeiben, alacsony általános diagnosztikai hozammal. NGS módszerünk segítségével 90 CNV-t is megfigyeltünk a pms2 funkcionális gén másolatának szegmentálisan duplikált exonjaiban 12-15 (1.Kiegészítő táblázat). Legutóbb 25 CNV-t figyeltek meg a grem1, TP53 és APC promoter régióiban.
a gyermekgyógyászati és ritka rendellenességekhez kapcsolódó génekben a CNV-k a patogén variánsok 7,7% – át tették ki (0-82% – os tartomány a panelek között; ábra. 2c). A CNV-k legmagasabb gyakoriságát a korai infantilis epilepsziás encephalopathia, a Joubert-szindróma, a tuberous sclerosis és az agyi cavernous malformációk paneleiben találtuk (4.Kiegészítő táblázat). A kórokozó CNV-k által leggyakrabban érintett gének az NF1, az NPHP1 és a TSC2 voltak (3.Kiegészítő táblázat). Az epilepsziás gének közül az UBE3A-t a 15q13.1-ben és a PRRT2-t a 16P11.2-ben érintő CNV-ket figyeltünk meg, amelyek valószínűleg visszatérő citogenetikai átrendeződések voltak. Alacsonyabb CNV-frekvenciákat figyeltünk meg a ciliopathiák, Rasopathiák, osteogenesis imperfecta és cisztás fibrózis génpaneleiben (4.Kiegészítő táblázat). A Noonan-szindróma és a krónikus pancreatitis panelek nagyon kevés vagy egyáltalán nem azonosítottak patogén CNV-ket, bár legalább 270 személyt vizsgáltak, és mindegyik panelben több mint 60 patogén variánst jelentettek.
a kardiovaszkuláris rendellenességek génjei a CNV-k viszonylag alacsonyabb prevalenciáját mutatták a patogén variánsok között (összesen 4,7%; 0-16, 7% – os tartomány a panelek között). A CNV-k legmagasabb gyakorisága a cardiomyopathia és a vázizombetegség (az átfogó cardiomyopathia panel egy alcsoportja), a familiáris hypercholesterinaemia és a Brugada-szindróma (4.Kiegészítő táblázat) panelekben fordult elő. Ezzel szemben nagyon kevés CNV-t találtak az aritmiák (a Brugada kivételével) és az aortopathiák paneljeiben, míg a cardiomyopathiák panelen volt a legalacsonyabb a patogén CNV-k előfordulása. A legtöbb patogén CNV-vel rendelkező gének az LDLR, FBN1, PKP2, MYBPC3 és RYR2 voltak (3.Kiegészítő táblázat). Egyes panelekben, amelyek látszólag magas CNV prevalenciát mutattak, a legtöbb, ha nem az összes CNV csak egy vagy két génben volt (pl. A legmagasabb teljes diagnosztikai hozammal rendelkező kardiovaszkuláris rendellenességek paneljei a CNVs legmagasabb prevalenciájával rendelkező géneket is tartalmazták, kivéve az aritmiákat és a cardiomyopathiákat, amelyek CNV-kből kimerültek, és amelyekben a legtöbb pozitív diagnózist SNVs magyarázta.
a neurológiai rendellenességek Génpaneljei (többnyire neuromuszkuláris rendellenességek paneljeinkben) az intragén CNV-k legmagasabb prevalenciáját mutatták a patogén variánsok között (összesen 35%, 0-100% – os tartomány a panelek között; ábra. 2A, C; 4. Kiegészítő táblázat). Ezt az eredményt nagyrészt a visszatérő génduplikációval és a reciprok delécióval magyarázták a PMP22-ben, a deléciókkal az SMN1 – ben és a különböző CNV-kkel a DMD-ben (3.Kiegészítő táblázat; ábra. 2c, d; 2. Kiegészítő ábra). Egyéni NGS módszerrel 135 SMN1 deléciós esetet találtunk 819 olyan személy között, akiknek gyanúja volt a gerinc izom atrófiájának, és az SMN2 másolatok tartománya 0-tól 5-ig változott. Még akkor is, ha a pmp22, az SMN1 és a DMD kizárásra került, az intragén CNV-k a neurológiai rendellenességekhez kapcsolódó génekben még mindig a kohorszunk összes patogén variánsának 6% – át képviselték. A CNV-k által gyakran érintett neurológiai rendellenességek egyéb génjei közé tartozik a PARK2, a LAMA2 és az SPG11.
a kiindulási CNV-K elemzése
diagnosztikai vizsgálataink az orvosok által igényelt betegséggénekre korlátozódtak, de sok olyan gén, amely nem kapcsolódik a bemutató klinikai fenotípushoz, szintén szekvenáltak az NGS vizsgálatainkon. Mind az 1507 gén adatait 143 142 egyénben szekvenáltuk, és megvizsgáltuk az intragén CNV-k előfordulását a nem rekvirált génekben, hogy megbecsüljük ezen események kiindulási prevalenciáját. Ezeket a fenotípustól független CNV-ket a továbbiakban “kiindulási CNV-knek” nevezzük.”A kiindulási CNV-k keresése egyénenként 7-616 génben történt, összesen 16 millió egygénes elemzéssel. Ez a keresés 4054 intragén CNV-t (1465 különálló eseményt) eredményezett 3772 egyénben 599 génben (5.Kiegészítő táblázat). Ezeknek a CNV-knek a többsége csak egyszer volt jelen, de néhányat 2-15-nél több alkalommal láttak (ábra. 3a; 6. Kiegészítő táblázat). A kiindulási CNV-megfigyelések nagy részét azonban összességében a visszatérő események tették ki. A kiindulási CNV-vel rendelkező gének túlnyomó többségének öt vagy kevesebb eseménye volt (ábra. 3b). Mindössze 47 gén tartalmazta az összes megfigyelt kiindulási CNV több mint felét, beleértve mind az azonos visszatérő eseményekkel rendelkező, mind az egyedi események sokaságával rendelkező géneket. A legtöbb intragén kiindulási CNV-vel rendelkező egyénnek csak egyetlen eseménye volt, de 146 egyénnek további CNV-je volt a különböző kromoszómák génjeiben. Átlagosan kimutattunk egy kiindulási CNV-t 1-es sebességgel minden 3979 génben, amelyet a vizsgálatainkkal szekvenáltunk.
az ebben a kohorszban klinikailag tesztelt génekben azonosított CNV-kkel ellentétben a legtöbb kiindulási intragén CNV duplikáció volt (ábra. 1c, d és 3c). A legtöbb heterozigóta variáns volt az AR génekben vagy olyan génekben is, amelyekből hiányzott a kialakult LOF mechanizmus (ábra. 3d, e). A kiindulási CNV-k kisebb része az AD öröklődésével vagy LOF mechanizmusokkal kapcsolatos génekben fordult elő (ábra. 1e, f és 3d, e). A leggyakoribb kiindulási CNV-k az nphp1, a NIPA1, a MYH11, a DNAI2, a HFE2, az SMN1 és a PMP22 teljes génes eseményeit, valamint a TFG, a BBS9, a CTNNA3, a PARK2, a KCTD7, a DNAJC6, a GLIS2 és a TUBB4A részleges génes eseményeit tartalmazták (6.Kiegészítő táblázat). Azon jellemzők tekintetében, amelyek magyarázhatják a kiindulási CNV-k létezését a betegség génjeiben, megjegyeztük, hogy ezeknek a CNV-knek közel 40% – a egy egész gént ölelt fel, ezért nem zavarta meg közvetlenül a transzkriptum olvasási kereteket (ábra. 3c). Ezenkívül a lof mechanizmusú gének duplikációinak nagyjából 90%-a teljes génes esemény vagy részleges génes esemény volt, beleértve a terminális exont is, míg ezekben a génekben a delécióknak csak a fele mutatta ugyanazokat a mintákat (5.Kiegészítő táblázat).
a kiindulási CNV-k általános prevalenciájának és tulajdonságainak értékelése mellett figyelembe vettük az előre jelzett klinikai következményeket is. 237 heterozigóta deléciót figyeltünk meg 97 ad vagy XL öröklődéssel és LOF mechanizmussal rendelkező génben; a legtöbb a PMP22, DMD, AARS, KCNQ1, FIG4, CHEK2 és LRSAM1 (kiegészítő 5.és 7. táblázat). Csak két homozigóta deléciót találtunk Az AR öröklődésű génekben (NPHP1 és SPG7), és csak két hemizigóta deléciót találtunk egyetlen XL öröklődésű génben (DMD) férfiaknál. Az összes többi homozigóta CNV az AR öröklődésű génekben, vagy hemizigóta CNV-k a férfiak XL öröklődésű génjeiben, duplikációk voltak. Ezenkívül a CNV-ket kifejezetten olyan génekben figyeltük meg, amelyek orvosi beavatkozási szempontokkal rendelkeznek az ACMG szerint.21,22 értékeltük CNVs 58 A 59 ACMG-felsorolt gének (kivéve PMS2) 5,300-69,000 egyének függően a vizsgálatok használt vizsgálatokhoz. Összesen 46 deléciót és 110 duplikációt észleltek, ami 0,8%–os gyakoriságra utal (CI: 0,58-1,11%) a vizsgált egyének körében. A Myh11, MYH7, KCNQ1 és RYR2 tartalmazta a legtöbb CNV-t. Pontosabban 16 génben—KCNQ1, MYH11, MYH7, MYBPC3, PCSK9, BRCA1, RYR2, PKP2, TGFBR2, SMAD3, OTC, NF2, FBN1, DSP, DSC2ÉS APC—több mint fele rendelkezik LOF mechanizmusokkal (kiegészítő táblázat 7).