częstość występowania wewnątrzgenowych CNVs w dużej kohorcie klinicznej
przetestowaliśmy różne podgrupy 1507 genów u 143 515 niepowiązanych osób, skierowanych do diagnostycznych badań panelu genów NGS. Ukończono łącznie około 4,8 miliona analiz pojedynczych genów. Spośród prawie 8,1 miliona wariantów wszystkich typów zidentyfikowaliśmy 2844 intragenicznych CNV (1237 różnych zdarzeń). Te CNV stanowiły 0,03% wszystkich wariantów, 3,1% zgłoszonych wariantów, a zwłaszcza 9,1% wariantów zaklasyfikowanych jako LP/P (tabela uzupełniająca 1 i wykres uzupełniający 1). Warianty te znaleziono w 384 genach i obejmowały 1810 delecji i 1034 duplikacji, co łącznie stanowiło częstość występowania 1,9% w tej kohorcie, 4,4% wśród osób z co najmniej jednym zgłoszonym wariantem, a co ważniejsze, 9,8% wśród osób, które otrzymały raport z wariantem LP/P dowolnego typu.
wzorce występowania WEWNĄTRZGENICZNYCH CNV
CNV były podzielone na jedną z trzech kategorii—pojedyncze rzadkie zdarzenia, częste nawracające zdarzenia i nawracające zdarzenia o niskiej częstotliwości (Fig. 1a). Każda kategoria stanowiła około jednej trzeciej wszystkich obserwowanych CNV. Zdecydowana większość z 384 genów z CNV miała tylko jeden CNV każdy, ale te pojedyncze CNV razem stanowiły mniej niż 10% wszystkich zdarzeń (rys. 1B). Natomiast 31 Z 384 genów miało 15 lub więcej CNV, ale stanowiły one prawie 70% wszystkich CNV. Oprócz częstości, zbadano intrageniczne lokalizacje i rozmiary CNVs, ponieważ właściwości te mogą determinować wpływ kliniczny. Jedna czwarta CNV obejmowała tylko jeden Egzon. Większość wewnątrzgenicznych CNV stanowiły wielo-egzoniczne zdarzenia częściowego genu, a większość obejmowała tylko egzony wewnętrzne bez udziału końcowych (pierwszych lub ostatnich) egzonów kodujących (Fig. 1c, d). Wśród częściowych genów CNV obejmujących końcowe eksony, więcej delecji niż duplikacji obejmowało pierwsze eksony, podczas gdy podobna liczba delecji i duplikacji obejmowała Ostatnie eksony. Ostatecznie większy odsetek duplikacji niż delecji obejmował pełny Gen. Prawie jedna piąta wszystkich odrębnych (niewymiarowych) CNV zawierała pełny gen, a w 40 przypadkach CNV obejmowały kilka sąsiednich genów i były obecne na co najmniej 10 chromosomach (dodatkowe tabele 1, 2).
Klasyfikacja kliniczna CNVS
delecje były częstsze w tej kohorcie klinicznej, a większość z nich zgłaszano jako warianty LP / P (Fig. 1c). Jednak kilka delecji zostało sklasyfikowanych jako VUS, głównie dlatego, że były one wariantami w genach bez mechanizmów mutacyjnych bez utraty funkcji (LOF). Natomiast ponad połowa duplikatów została sklasyfikowana jako VUS. Wśród częściowych duplikacji genów, 359 dotyczyło egzonów końcowych, a 225 dotyczyło tylko egzonów wewnętrznych (Fig. 1d). Przewidywano, że co najmniej 166 duplikacji obejmujących tylko eksony wewnętrzne miało niekorzystny wpływ na ramę odczytu transkryptu i w związku z tym zostało sklasyfikowanych jako LP/P (tabela uzupełniająca 2). W przypadku co najmniej 30 duplikacji zaobserwowaliśmy domniemane punkty przerwania w oparciu o dane sekwencji podzielonego odczytu i przewidzieliśmy układ tandemowy, który zakłóciłby ramkę odczytu transkrypcji. Potwierdza to wcześniejsze twierdzenia, że duplikacje wewnątrzgeniczne są zazwyczaj zlokalizowanymi tandemowymi rearanżacjami w porównaniu z bardziej skomplikowanymi zdarzeniami, takimi jak translokacje wstawkowe.18
rozważaliśmy również dystrybucję i zygotyczność CNVs w genach związanych z autosomalnym dominującym (AD), autosomalnym recesywnym (AR) i zaburzeniami związanymi z X (XL) (Fig. 1e, f). Zdecydowana większość CNV była w genach związanych z dziedziczeniem AD lub XL, chociaż wynik ten odzwierciedla stronniczość, ponieważ większość badanych genów miała takie wzorce dziedziczenia. Spośród 2096 CNV sklasyfikowanych jako LP / P, 85% było w genach związanych z dziedziczeniem AD lub XL, a 15% w genach związanych z dziedziczeniem AR. Z tych ostatnich 6,7% stanowiły delecje homozygotyczne, 2,8% to złożone zmiany heterozygotyczne towarzyszące patogennemu SNV na innych allelach (stanowiące pozytywną diagnozę molekularną dla zaburzenia AR; tabela uzupełniająca 1), a 5,5% to pojedyncze zdarzenia heterozygotyczne.
prawie wszystkie CNV w tej kohorcie znaleziono w genach z mechanizmami LOF (Fig. 1e). Większość CNV w tych genach było delecjami sklasyfikowanymi jako patogenne, podczas gdy ponad połowa duplikacji została sklasyfikowana jako VUS. Porównawczo, 304 geny bez mechanizmów LOF miały niewiele CNV, przeważnie klasyfikowane jako vus lub łagodne (Fig. 1f) i znacznie więcej duplikacji niż delecji (p = 1,8×10-9).
CNV i zachorowalność
Analiza dużej liczby paneli multigenowych wykazała różną częstość występowania CNV w różnych grupach chorobowych (Fig. 2a, b; tabela uzupełniająca 4). Geny z CNV miały w większości powtarzające się zdarzenia, w większości unikalne zdarzenia, lub mieszankę obu tych zdarzeń (rys. 2c). Spośród paneli, które dostarczyły co najmniej 10 wariantów chorobotwórczych dowolnego typu, ponad jedna trzecia miała CNV stanowiące ponad 10% wariantów chorobotwórczych. Panele genowe dające największą liczbę CNV były te dla rdzeniowego zaniku mięśni, choroby Charcota–Marie–Tooth i dystrofinopatii, zgodnie z oczekiwaniami. Jednak panele dotyczące wrodzonych wad serca i heterotaksji, zespołu Lyncha, mięsaka, dystrofii mięśniowej i dystonii również zidentyfikowały wiele CNV. Natomiast panele genowe o najniższej częstotliwości CNV obejmowały te dla przewlekłego zapalenia trzustki, Rasopatii, kardiomiopatii i dziedzicznej trombofilii.
geny dziedzicznych zespołów nowotworowych wykazywały wysoką (8,3% ogółu; zakres 0-50% wśród paneli) częstość występowania CNVs wśród wariantów chorobotwórczych (Fig. 2a; tabele uzupełniające 3 i 4). Spośród 1059 patogennych CNV obserwowanych w tych genach, 219 zaobserwowano tylko raz, a 174 nawracały. BRCA1 i BRCA2 miały łączne występowanie CNV 6,1% (przedział ufności: 5,4-6,9%) wśród wariantów chorobotwórczych, zgodnie z wcześniejszymi badaniami (indywidualnie, BRCA1 11.4% , BRCA2 1, 7% ).15,19,20 CNVs wzbogacono również w inne geny, takie jak EPCAM, STK11 i VHL, oraz w geny na różnych panelach o niskiej ogólnej wydajności diagnostycznej. Stosując naszą metodę NGS, zaobserwowaliśmy również 90 CNVs w segmentowo duplikowanych eksonach 12-15 funkcjonalnej kopii genu PMS2 (tabela uzupełniająca 1). Ostatnio zaobserwowano 25 CNVs w regionach promotorów GREM1, TP53 i APC.
CNVs w genach związanych z zaburzeniami pediatrycznymi i rzadkimi stanowiły 7,7% wariantów chorobotwórczych (zakres 0-82% wśród paneli; Fig. 2c). Znaleźliśmy najwyższe częstotliwości CNVs w panelach dla wczesnych dziecięcych encefalopatii epileptycznej, zespołu Jouberta, stwardnienia guzowatego i malformacji jamistych mózgu (tabela uzupełniająca 4). Genami najczęściej dotkniętymi patogennymi CNVs były NF1, NPHP1 i TSC2 (tabela uzupełniająca 3). Wśród genów padaczki zaobserwowaliśmy CNV z udziałem UBE3A w 15q13.1 i PRRT2 w 16P11. 2, które były prawdopodobnie nawracającymi rearanżacjami cytogenetycznymi. Zaobserwowaliśmy niższe częstotliwości CNV w panelach genowych dla ciliopatii, Rasopatii, wrodzonej osteogenezy i mukowiscydozy (tabela uzupełniająca 4). W panelach z zespołem Noonana i przewlekłym zapaleniem trzustki stwierdzono bardzo niewiele patogennych CNV lub ich brak, chociaż przebadano co najmniej 270 osób, a w każdym panelu zgłoszono ponad 60 wariantów patogennych.
geny zaburzeń sercowo-naczyniowych wykazały stosunkowo mniejszą częstość występowania CNVs wśród wariantów chorobotwórczych(4,7% ogółem; zakres 0-16, 7% wśród paneli). Najwyższe częstości CNVs występowały w panelach kardiomiopatii i chorób mięśni szkieletowych (podgrupa panelu kardiomiopatii kompleksowej), hipercholesterolemii rodzinnej i zespole Brugada (tabela uzupełniająca 4). Z kolei bardzo niewiele CNV stwierdzono w panelach zajmujących się arytmią (innych niż Brugada) i aortopatiami, podczas gdy panel kardiomiopatii miał najniższą częstość występowania patogennych CNV. Genami o największej liczbie patogennych CNV były LDLR, FBN1, PKP2, MYBPC3 i RYR2 (tabela uzupełniająca 3). W niektórych panelach dających pozornie wysoką częstość występowania CNV, większość, jeśli nie wszystkie CNV były tylko w jednym lub dwóch genach (np. ENG i LDLR). Panele chorób układu sercowo-naczyniowego z najwyższą ogólną wydajnością diagnostyczną miały również geny o największej częstości występowania CNVs, z wyjątkiem genów dotyczących arytmii i kardiomiopatii, które zostały wyczerpane CNVs i w których większość pozytywnych diagnoz była zamiast tego wyjaśniana przez SNVs.
panele genowe dla zaburzeń neurologicznych (głównie zaburzenia nerwowo-mięśniowe w naszych panelach) wykazały najwyższą częstość występowania wewnątrzgenicznych CNV wśród wariantów chorobotwórczych (35% ogółem, zakres 0-100% wśród paneli; Fig. 2a, c; tabela uzupełniająca 4). Wynik ten został w dużej mierze wyjaśniony przez powtarzające się duplikacje genów i wzajemną delecję w PMP22, delecje w SMN1 i różne CNVs w DMD (tabela uzupełniająca 3; Fig. 2c, d; rysunek uzupełniający 2). Stosując niestandardową metodę NGS, znaleźliśmy 135 przypadków delecji SMN1 wśród 819 osób z podejrzeniem rdzeniowego zaniku mięśni, a zakres kopii SMN2 wahał się od 0 do 5. Nawet po wykluczeniu PMP22, SMN1 i DMD, intrageniczne CNV w genach związanych z zaburzeniami neurologicznymi nadal stanowiły 6% wszystkich wariantów chorobotwórczych w naszej kohorcie. Inne geny zaburzeń neurologicznych często wpływających na CNVs to PARK2, LAMA2 i SPG11.
Analiza wyjściowych CNVs
Nasze testy diagnostyczne ograniczały się do genów chorobowych wymaganych przez lekarzy, ale wiele genów niezwiązanych z prezentującym się fenotypem klinicznym zostało zsekwencjonowanych w naszych testach NGS. Zdekodowaliśmy dane dla wszystkich 1507 genów zsekwencjonowanych u 143 142 osób i zbadaliśmy występowanie wewnątrzgenicznych CNV w genach, które nie były wymagane, aby oszacować początkową częstość występowania tych zdarzeń. Te niezależne od fenotypu CNV są dalej określane jako ” podstawowe CNV.”Poszukiwanie wyjściowych CNVs przeprowadzono w 7-616 genach na osobę w sumie 16 milionów analiz pojedynczych genów. W wyniku tych badań uzyskano 4054 intragenicznych CNV (1465 różnych zdarzeń) u 3772 osób w 599 genach (tabela uzupełniająca 5). Większość z tych CNV była obecna tylko raz, ale kilka było widzianych od 2 do ponad 15 razy (rys. 3a; tabela uzupełniająca 6). Jednakże powtarzające się zdarzenia łącznie stanowiły większość podstawowych obserwacji CNV. Zdecydowana większość genów z wyjściowymi CNV miała pięć lub mniej zdarzeń (Fig. 3b). Zaledwie 47 genów zawierało ponad połowę wszystkich obserwowanych wyjściowych CNV, w tym zarówno genów o identycznych powtarzających się zdarzeniach, jak i genów o wielu unikalnych zdarzeniach. U większości osób z wyjściowym WEWNĄTRZGENICZNYM CNV wystąpił tylko jeden przypadek, ale 146 osób miało dodatkowe CNV w genach na różnych chromosomach. Średnio wykryliśmy wyjściowy CNV z szybkością 1 na każde 3979 genów zsekwencjonowanych naszymi testami.
w przeciwieństwie do CNVs zidentyfikowanych w klinicznie badanych genach w tej kohorcie, większość wyjściowych wewnątrzgenicznych CNV było duplikacjami (Fig. 1c, d i 3c). Większość z nich była również heterozygotycznymi wariantami genów AR lub genów, które nie posiadały ustalonych mechanizmów LOF (Fig. 3d, e). Mniejszość wyjściowych CNVs wystąpiła w genach związanych z dziedziczeniem AD lub mechanizmami LOF (Fig. 1e, f i 3d, e). Najczęstsze wyjściowe CNVs obejmowały zdarzenia całego genu w NPHP1, NIPA1, MYH11, DNAI2, HFE2, SMN1 i PMP22 oraz zdarzenia częściowego genu w TFG, BBS9, CTNNA3, PARK2, KCTD7, DNAJC6, GLIS2 i TUBB4A (tabela uzupełniająca 6). Jeśli chodzi o cechy, które mogą wyjaśniać istnienie wyjściowych CNV w genach choroby, zauważyliśmy, że prawie 40% tych CNV obejmowało cały gen, a zatem nie zakłócało bezpośrednio RAM odczytu transkrypcji (rys. 3c). Co więcej, około 90% duplikacji w genach z mechanizmami LOF było zdarzeniami pełnowymiarowymi lub częściowymi, w tym końcowym egzonem, podczas gdy tylko połowa delecji w tych genach wykazywała takie same wzorce (tabela uzupełniająca 5).
oprócz oceny ogólnej częstości występowania i właściwości wyjściowych CNVs, wzięliśmy pod uwagę przewidywane implikacje kliniczne. Zaobserwowaliśmy 237 delecji heterozygotycznych w 97 genach z dziedziczeniem AD lub XL i mechanizmami LOF; większość z nich była w PMP22, DMD, Aars, KCNQ1, FIG4, CHEK2 i LRSAM1 (dodatkowe tabele 5 i 7). Znaleźliśmy tylko dwa homozygotyczne delecje w genach z dziedziczeniem AR (NPHP1 i SPG7) i tylko dwa hemizygotyczne delecje w jednym genie z dziedziczeniem XL (DMD) u mężczyzn. Wszystkie inne homozygotyczne CNV w genach z dziedziczeniem AR lub hemizygotyczne CNV w genach z dziedziczeniem XL u mężczyzn były duplikacjami. Ponadto, zgodnie z acmg, zaobserwowaliśmy CNV szczególnie w genach o względnej przydatności do działania w medycynie.21,22 oceniliśmy CNVs w 58 Z 59 genów z listą ACMG (z wyłączeniem PMS2) U 5 300-69 000 osób, w zależności od testów używanych do testowania. Wykryto łącznie 46 delecji i 110 duplikacji, co sugeruje częstość do 0,8% (CI: 0,58-1,11%) wśród osób badanych pod kątem tych genów. MYH11, MYH7, KCNQ1 i RYR2 zawierały większość CNV. W szczególności stwierdzono delecje w 16 genach-KCNQ1, MYH11, MYH7, MYBPC3, PCSK9, BRCA1, RYR2, PKP2, TGFBR2, SMAD3, OTC, NF2, FBN1, DSP, DSC2 i APC—z których ponad połowa ma mechanizmy LOF (tabela uzupełniająca 7).