częstość występowania i właściwości wewnątrzgenowej zmiany liczby kopii w genach choroby Mendeliana

częstość występowania wewnątrzgenowych CNVs w dużej kohorcie klinicznej

przetestowaliśmy różne podgrupy 1507 genów u 143 515 niepowiązanych osób, skierowanych do diagnostycznych badań panelu genów NGS. Ukończono łącznie około 4,8 miliona analiz pojedynczych genów. Spośród prawie 8,1 miliona wariantów wszystkich typów zidentyfikowaliśmy 2844 intragenicznych CNV (1237 różnych zdarzeń). Te CNV stanowiły 0,03% wszystkich wariantów, 3,1% zgłoszonych wariantów, a zwłaszcza 9,1% wariantów zaklasyfikowanych jako LP/P (tabela uzupełniająca 1 i wykres uzupełniający 1). Warianty te znaleziono w 384 genach i obejmowały 1810 delecji i 1034 duplikacji, co łącznie stanowiło częstość występowania 1,9% w tej kohorcie, 4,4% wśród osób z co najmniej jednym zgłoszonym wariantem, a co ważniejsze, 9,8% wśród osób, które otrzymały raport z wariantem LP/P dowolnego typu.

wzorce występowania WEWNĄTRZGENICZNYCH CNV

CNV były podzielone na jedną z trzech kategorii—pojedyncze rzadkie zdarzenia, częste nawracające zdarzenia i nawracające zdarzenia o niskiej częstotliwości (Fig. 1a). Każda kategoria stanowiła około jednej trzeciej wszystkich obserwowanych CNV. Zdecydowana większość z 384 genów z CNV miała tylko jeden CNV każdy, ale te pojedyncze CNV razem stanowiły mniej niż 10% wszystkich zdarzeń (rys. 1B). Natomiast 31 Z 384 genów miało 15 lub więcej CNV, ale stanowiły one prawie 70% wszystkich CNV. Oprócz częstości, zbadano intrageniczne lokalizacje i rozmiary CNVs, ponieważ właściwości te mogą determinować wpływ kliniczny. Jedna czwarta CNV obejmowała tylko jeden Egzon. Większość wewnątrzgenicznych CNV stanowiły wielo-egzoniczne zdarzenia częściowego genu, a większość obejmowała tylko egzony wewnętrzne bez udziału końcowych (pierwszych lub ostatnich) egzonów kodujących (Fig. 1c, d). Wśród częściowych genów CNV obejmujących końcowe eksony, więcej delecji niż duplikacji obejmowało pierwsze eksony, podczas gdy podobna liczba delecji i duplikacji obejmowała Ostatnie eksony. Ostatecznie większy odsetek duplikacji niż delecji obejmował pełny Gen. Prawie jedna piąta wszystkich odrębnych (niewymiarowych) CNV zawierała pełny gen, a w 40 przypadkach CNV obejmowały kilka sąsiednich genów i były obecne na co najmniej 10 chromosomach (dodatkowe tabele 1, 2).

Fig. 1: Częstotliwość, rozmiar, interpretacja, i dystrybucja copy-number warianty (CNVs) Obserwowani w klinicznie testowanych genach.

Histogram pokazujący liczbę odrębnych CNV obserwowanych w badanych genach. Kolumny na wykresie wskazują liczbę obserwacji CNV. Wykres liniowy pokazuje udział całkowitej obserwowanej CNV w każdym przedziale częstotliwości. Na przykład pierwsza kolumna pokazuje, że prawie 900 CNV wystąpiło tylko raz i łącznie stanowiło około 30% wszystkich CNV. Histogram B pokazujący liczbę genów, które zawierały CNVs w naszej kohorcie klinicznej. Kolumny na wykresie pokazują stopniowy wzrost liczby CNV obserwowanych w genie. Wykres liniowy pokazuje udział CNV w dowolnych przyrostach występowania CNV na gen. Na przykład prawie 200 genów miało tylko 1 CNV, co razem stanowiło mniej niż 10% wszystkich zdarzeń. Natomiast około 30 genów miało ponad 15 CNV każdy, co stanowiło prawie 70% wszystkich CNV. C rozkład delecji i duplikacji według liczby eksonów dotkniętych i interpretacji klinicznej. Zdarzenia cytogenetyczne są definiowane jako przylegające CNV o tej samej zygotyczności wpływające na sąsiednie geny na pojedynczym chromosomie. Niektóre całe geny mogą w rzeczywistości być częścią większych zdarzeń cytogenetycznych, ale nie są wymienione jako takie, ponieważ inne geny w przewidywanym zdarzeniu cytogenetycznym były nieobecne w naszym teście i dlatego niedostępne do analizy. D Liczba duplikacji i delecji CNV wykrytych w danych klinicznych i wyjściowych CNV. CNV dzieli się na takie, które obejmują cały Gen (klasy I, V), co najmniej ostatni Egzon (klasy II, VI), co najmniej pierwszy Egzon (klasy III, VII) lub tylko Egzon(egzony wewnętrzne) (klasy IV, VIII). Generyczna struktura genów jest pokazana na górze. Zielone i fioletowe pola oznaczają „egzony końcowe”, a wszystkie pozostałe są” egzonami wewnętrznymi”, jak opisano w tekście. Puste pola oznaczają usunięte eksony. Liczba ta zakłada, że duplikacje wewnątrzgeniczne występują w tandemie, co często ma miejsce w przypadku takich zdarzeń. Na tym rysunku nie przedstawiono CNV obejmujących tylko regiony promotorów. Chi-kwadrat tabeli awaryjnej Pearsona daje wartość p p < 1×10-5 dla duplikacji i p = 1.5×10-5 w przypadku delecji, co wskazuje, że różnica w dystrybucji CNVs w genie nie wynika jedynie z różnic w pobieraniu próbek między klinicznymi i wyjściowymi CNVs. delecje i duplikacje e i f w testowanych klinicznie genach oraz ich interpretacje. Wykres w (e) pokazuje geny z mechanizmami mutacyjnymi utraty funkcji (LOF), a w (f) pokazuje geny bez mechanizmów utraty funkcji (LOF). Większość genów zawartych w naszych panelach była kuratorowana jako posiadająca mechanizmy LOF. Porównuje się klasyfikację kliniczną każdego CNV, wzór dziedziczenia genu z CNV i zygotyczność wariantów. W przypadku genów związanych z X (XL) heterozygotyczne CNVs u kobiet są pokazane oddzielnie od CNVs u mężczyzn. AD autosomalny dominujący, AR autosomalny recesywny, F Kobieta, het heterozygous, hom homozygous, m mężczyzna, LP prawdopodobny wariant patogenny, P wariant patogenny, warianty VUS o niepewnym znaczeniu. Etykieta „patogenna” w c, e i f zawiera CNV zaklasyfikowane jako patogenne i prawdopodobnie patogenne

Klasyfikacja kliniczna CNVS

delecje były częstsze w tej kohorcie klinicznej, a większość z nich zgłaszano jako warianty LP / P (Fig. 1c). Jednak kilka delecji zostało sklasyfikowanych jako VUS, głównie dlatego, że były one wariantami w genach bez mechanizmów mutacyjnych bez utraty funkcji (LOF). Natomiast ponad połowa duplikatów została sklasyfikowana jako VUS. Wśród częściowych duplikacji genów, 359 dotyczyło egzonów końcowych, a 225 dotyczyło tylko egzonów wewnętrznych (Fig. 1d). Przewidywano, że co najmniej 166 duplikacji obejmujących tylko eksony wewnętrzne miało niekorzystny wpływ na ramę odczytu transkryptu i w związku z tym zostało sklasyfikowanych jako LP/P (tabela uzupełniająca 2). W przypadku co najmniej 30 duplikacji zaobserwowaliśmy domniemane punkty przerwania w oparciu o dane sekwencji podzielonego odczytu i przewidzieliśmy układ tandemowy, który zakłóciłby ramkę odczytu transkrypcji. Potwierdza to wcześniejsze twierdzenia, że duplikacje wewnątrzgeniczne są zazwyczaj zlokalizowanymi tandemowymi rearanżacjami w porównaniu z bardziej skomplikowanymi zdarzeniami, takimi jak translokacje wstawkowe.18

rozważaliśmy również dystrybucję i zygotyczność CNVs w genach związanych z autosomalnym dominującym (AD), autosomalnym recesywnym (AR) i zaburzeniami związanymi z X (XL) (Fig. 1e, f). Zdecydowana większość CNV była w genach związanych z dziedziczeniem AD lub XL, chociaż wynik ten odzwierciedla stronniczość, ponieważ większość badanych genów miała takie wzorce dziedziczenia. Spośród 2096 CNV sklasyfikowanych jako LP / P, 85% było w genach związanych z dziedziczeniem AD lub XL, a 15% w genach związanych z dziedziczeniem AR. Z tych ostatnich 6,7% stanowiły delecje homozygotyczne, 2,8% to złożone zmiany heterozygotyczne towarzyszące patogennemu SNV na innych allelach (stanowiące pozytywną diagnozę molekularną dla zaburzenia AR; tabela uzupełniająca 1), a 5,5% to pojedyncze zdarzenia heterozygotyczne.

prawie wszystkie CNV w tej kohorcie znaleziono w genach z mechanizmami LOF (Fig. 1e). Większość CNV w tych genach było delecjami sklasyfikowanymi jako patogenne, podczas gdy ponad połowa duplikacji została sklasyfikowana jako VUS. Porównawczo, 304 geny bez mechanizmów LOF miały niewiele CNV, przeważnie klasyfikowane jako vus lub łagodne (Fig. 1f) i znacznie więcej duplikacji niż delecji (p = 1,8×10-9).

CNV i zachorowalność

Analiza dużej liczby paneli multigenowych wykazała różną częstość występowania CNV w różnych grupach chorobowych (Fig. 2a, b; tabela uzupełniająca 4). Geny z CNV miały w większości powtarzające się zdarzenia, w większości unikalne zdarzenia, lub mieszankę obu tych zdarzeń (rys. 2c). Spośród paneli, które dostarczyły co najmniej 10 wariantów chorobotwórczych dowolnego typu, ponad jedna trzecia miała CNV stanowiące ponad 10% wariantów chorobotwórczych. Panele genowe dające największą liczbę CNV były te dla rdzeniowego zaniku mięśni, choroby Charcota–Marie–Tooth i dystrofinopatii, zgodnie z oczekiwaniami. Jednak panele dotyczące wrodzonych wad serca i heterotaksji, zespołu Lyncha, mięsaka, dystrofii mięśniowej i dystonii również zidentyfikowały wiele CNV. Natomiast panele genowe o najniższej częstotliwości CNV obejmowały te dla przewlekłego zapalenia trzustki, Rasopatii, kardiomiopatii i dziedzicznej trombofilii.

Fig. 2: patogenne warianty liczby kopii (CNVs) według genów i panelu.

panele w każdej specjalności klinicznej są pokazane z odsetkiem pozytywnych raportów, które obejmowały jeden lub więcej patogennych CNV. Uwzględniono tylko panele, które zostały przebadane klinicznie co najmniej 100 razy i miały co najmniej 10 wariantów patogennych dowolnego typu. Każdy panel jest reprezentowany przez okrąg. B odsetek pozytywnych sprawozdań, które obejmowały patogenne CNV w różnych panelach. Panele te były w pierwszej piątce z najbardziej patogennymi wariantami w każdej specjalności klinicznej. c trzy wzorce występowania CNV były dostrzegalne: powtarzające się zdarzenia (np. w PMP22 i SMN1), przeważnie rzadkie zdarzenia unikalne (np. w DMD i BRCA2) oraz połączenie obu tych zdarzeń (np. w BRCA1 i MSH2). Liczba różnych wariantów jest pokazana na niebiesko, A Dodatkowe / powtarzające się obserwacje tych wariantów są pokazane na Zielono. D frakcja wariantów chorobotwórczych, które były CNVs w różnych genach. W każdej specjalności klinicznej przedstawiono pięć najlepszych genów o najbardziej patogennych wariantach dowolnego typu

geny dziedzicznych zespołów nowotworowych wykazywały wysoką (8,3% ogółu; zakres 0-50% wśród paneli) częstość występowania CNVs wśród wariantów chorobotwórczych (Fig. 2a; tabele uzupełniające 3 i 4). Spośród 1059 patogennych CNV obserwowanych w tych genach, 219 zaobserwowano tylko raz, a 174 nawracały. BRCA1 i BRCA2 miały łączne występowanie CNV 6,1% (przedział ufności: 5,4-6,9%) wśród wariantów chorobotwórczych, zgodnie z wcześniejszymi badaniami (indywidualnie, BRCA1 11.4% , BRCA2 1, 7% ).15,19,20 CNVs wzbogacono również w inne geny, takie jak EPCAM, STK11 i VHL, oraz w geny na różnych panelach o niskiej ogólnej wydajności diagnostycznej. Stosując naszą metodę NGS, zaobserwowaliśmy również 90 CNVs w segmentowo duplikowanych eksonach 12-15 funkcjonalnej kopii genu PMS2 (tabela uzupełniająca 1). Ostatnio zaobserwowano 25 CNVs w regionach promotorów GREM1, TP53 i APC.

CNVs w genach związanych z zaburzeniami pediatrycznymi i rzadkimi stanowiły 7,7% wariantów chorobotwórczych (zakres 0-82% wśród paneli; Fig. 2c). Znaleźliśmy najwyższe częstotliwości CNVs w panelach dla wczesnych dziecięcych encefalopatii epileptycznej, zespołu Jouberta, stwardnienia guzowatego i malformacji jamistych mózgu (tabela uzupełniająca 4). Genami najczęściej dotkniętymi patogennymi CNVs były NF1, NPHP1 i TSC2 (tabela uzupełniająca 3). Wśród genów padaczki zaobserwowaliśmy CNV z udziałem UBE3A w 15q13.1 i PRRT2 w 16P11. 2, które były prawdopodobnie nawracającymi rearanżacjami cytogenetycznymi. Zaobserwowaliśmy niższe częstotliwości CNV w panelach genowych dla ciliopatii, Rasopatii, wrodzonej osteogenezy i mukowiscydozy (tabela uzupełniająca 4). W panelach z zespołem Noonana i przewlekłym zapaleniem trzustki stwierdzono bardzo niewiele patogennych CNV lub ich brak, chociaż przebadano co najmniej 270 osób, a w każdym panelu zgłoszono ponad 60 wariantów patogennych.

geny zaburzeń sercowo-naczyniowych wykazały stosunkowo mniejszą częstość występowania CNVs wśród wariantów chorobotwórczych(4,7% ogółem; zakres 0-16, 7% wśród paneli). Najwyższe częstości CNVs występowały w panelach kardiomiopatii i chorób mięśni szkieletowych (podgrupa panelu kardiomiopatii kompleksowej), hipercholesterolemii rodzinnej i zespole Brugada (tabela uzupełniająca 4). Z kolei bardzo niewiele CNV stwierdzono w panelach zajmujących się arytmią (innych niż Brugada) i aortopatiami, podczas gdy panel kardiomiopatii miał najniższą częstość występowania patogennych CNV. Genami o największej liczbie patogennych CNV były LDLR, FBN1, PKP2, MYBPC3 i RYR2 (tabela uzupełniająca 3). W niektórych panelach dających pozornie wysoką częstość występowania CNV, większość, jeśli nie wszystkie CNV były tylko w jednym lub dwóch genach (np. ENG i LDLR). Panele chorób układu sercowo-naczyniowego z najwyższą ogólną wydajnością diagnostyczną miały również geny o największej częstości występowania CNVs, z wyjątkiem genów dotyczących arytmii i kardiomiopatii, które zostały wyczerpane CNVs i w których większość pozytywnych diagnoz była zamiast tego wyjaśniana przez SNVs.

panele genowe dla zaburzeń neurologicznych (głównie zaburzenia nerwowo-mięśniowe w naszych panelach) wykazały najwyższą częstość występowania wewnątrzgenicznych CNV wśród wariantów chorobotwórczych (35% ogółem, zakres 0-100% wśród paneli; Fig. 2a, c; tabela uzupełniająca 4). Wynik ten został w dużej mierze wyjaśniony przez powtarzające się duplikacje genów i wzajemną delecję w PMP22, delecje w SMN1 i różne CNVs w DMD (tabela uzupełniająca 3; Fig. 2c, d; rysunek uzupełniający 2). Stosując niestandardową metodę NGS, znaleźliśmy 135 przypadków delecji SMN1 wśród 819 osób z podejrzeniem rdzeniowego zaniku mięśni, a zakres kopii SMN2 wahał się od 0 do 5. Nawet po wykluczeniu PMP22, SMN1 i DMD, intrageniczne CNV w genach związanych z zaburzeniami neurologicznymi nadal stanowiły 6% wszystkich wariantów chorobotwórczych w naszej kohorcie. Inne geny zaburzeń neurologicznych często wpływających na CNVs to PARK2, LAMA2 i SPG11.

Analiza wyjściowych CNVs

Nasze testy diagnostyczne ograniczały się do genów chorobowych wymaganych przez lekarzy, ale wiele genów niezwiązanych z prezentującym się fenotypem klinicznym zostało zsekwencjonowanych w naszych testach NGS. Zdekodowaliśmy dane dla wszystkich 1507 genów zsekwencjonowanych u 143 142 osób i zbadaliśmy występowanie wewnątrzgenicznych CNV w genach, które nie były wymagane, aby oszacować początkową częstość występowania tych zdarzeń. Te niezależne od fenotypu CNV są dalej określane jako ” podstawowe CNV.”Poszukiwanie wyjściowych CNVs przeprowadzono w 7-616 genach na osobę w sumie 16 milionów analiz pojedynczych genów. W wyniku tych badań uzyskano 4054 intragenicznych CNV (1465 różnych zdarzeń) u 3772 osób w 599 genach (tabela uzupełniająca 5). Większość z tych CNV była obecna tylko raz, ale kilka było widzianych od 2 do ponad 15 razy (rys. 3a; tabela uzupełniająca 6). Jednakże powtarzające się zdarzenia łącznie stanowiły większość podstawowych obserwacji CNV. Zdecydowana większość genów z wyjściowymi CNV miała pięć lub mniej zdarzeń (Fig. 3b). Zaledwie 47 genów zawierało ponad połowę wszystkich obserwowanych wyjściowych CNV, w tym zarówno genów o identycznych powtarzających się zdarzeniach, jak i genów o wielu unikalnych zdarzeniach. U większości osób z wyjściowym WEWNĄTRZGENICZNYM CNV wystąpił tylko jeden przypadek, ale 146 osób miało dodatkowe CNV w genach na różnych chromosomach. Średnio wykryliśmy wyjściowy CNV z szybkością 1 na każde 3979 genów zsekwencjonowanych naszymi testami.

Fig. 3: Początkowe warianty liczby kopii (CNVs) niezwiązane z fenotypem Klinicznym w dużej kohorcie.

kliniczne znaczenie tych CNV nie zostało ocenione poza ich delecjami w genach wymienionych w American College of Medical Genetics i Genomics ze znanymi mechanizmami mutacyjnymi utraty funkcji (LOF). CNV w genach, które należały do tej samej specjalności klinicznej, co te zamówione do badań klinicznych, zostały usunięte z analizy. Pojedyncze eksony niskiej jakości połączeń zostały usunięte w celu zmniejszenia potencjalnych fałszywie dodatnich połączeń. Histogram pokazujący liczbę różnych CNVs obserwowanych w genach analizowanych dla wyjściowych CNVs. Kolumny na wykresie pokazują liczbę obserwacji CNV. Wykres liniowy pokazuje udział całkowitej obserwowanej CNV w każdym przedziale częstotliwości. Na przykład pierwsza kolumna pokazuje, że ponad 1100 CNV wystąpiło tylko raz i łącznie stanowiło około 25% wszystkich CNV. Natomiast ostatnia kolumna wskazuje, że 36 CNV znaleziono ponad 15 razy i stanowiło ponad 40% wszystkich wyjściowych CNV. Histogram B pokazujący liczbę genów, które zawierały wyjściowe CNVs. Kolumny na wykresie pokazują stopniowy wzrost liczby CNV obserwowanych w genie. Wykres liniowy pokazuje udział CNV w dowolnych przyrostach występowania CNV na gen. Na przykład, prawie 240 genów miało tylko jeden CNV, a razem te CNV stanowiły około 6% wszystkich zdarzeń. Natomiast około 45 genów miało ponad 15 CNV każdy, co stanowiło nieco ponad 60% wszystkich CNV. C rozkład wyjściowych CNVs jest pokazany w zależności od liczby eksonów dotkniętych. CNV Multiexon obejmują trzy klasy 5 'egzonów końcowych, egzonów wewnętrznych i 3′ egzonów końcowych. (D i E) obciążenie wyjściowych CNVs w genach w zależności od sposobu dziedziczenia i zygotyczności. CNVs w genach z mechanizmami mutacyjnymi LOF są pokazane w części (d), a te w genach bez mechanizmów LOF są pokazane w części (e). CNVs w genach X-linked (XL) zostały sklasyfikowane jako te obserwowane jako heterozygotyczne zdarzenia u kobiet i hemizygotyczne zdarzenia u mężczyzn. AD autosomalny dominujący, AR autosomalny recesywny, F Kobieta, m mężczyzna, het heterozygotyczny, hom homozygotyczny

w przeciwieństwie do CNVs zidentyfikowanych w klinicznie badanych genach w tej kohorcie, większość wyjściowych wewnątrzgenicznych CNV było duplikacjami (Fig. 1c, d i 3c). Większość z nich była również heterozygotycznymi wariantami genów AR lub genów, które nie posiadały ustalonych mechanizmów LOF (Fig. 3d, e). Mniejszość wyjściowych CNVs wystąpiła w genach związanych z dziedziczeniem AD lub mechanizmami LOF (Fig. 1e, f i 3d, e). Najczęstsze wyjściowe CNVs obejmowały zdarzenia całego genu w NPHP1, NIPA1, MYH11, DNAI2, HFE2, SMN1 i PMP22 oraz zdarzenia częściowego genu w TFG, BBS9, CTNNA3, PARK2, KCTD7, DNAJC6, GLIS2 i TUBB4A (tabela uzupełniająca 6). Jeśli chodzi o cechy, które mogą wyjaśniać istnienie wyjściowych CNV w genach choroby, zauważyliśmy, że prawie 40% tych CNV obejmowało cały gen, a zatem nie zakłócało bezpośrednio RAM odczytu transkrypcji (rys. 3c). Co więcej, około 90% duplikacji w genach z mechanizmami LOF było zdarzeniami pełnowymiarowymi lub częściowymi, w tym końcowym egzonem, podczas gdy tylko połowa delecji w tych genach wykazywała takie same wzorce (tabela uzupełniająca 5).

oprócz oceny ogólnej częstości występowania i właściwości wyjściowych CNVs, wzięliśmy pod uwagę przewidywane implikacje kliniczne. Zaobserwowaliśmy 237 delecji heterozygotycznych w 97 genach z dziedziczeniem AD lub XL i mechanizmami LOF; większość z nich była w PMP22, DMD, Aars, KCNQ1, FIG4, CHEK2 i LRSAM1 (dodatkowe tabele 5 i 7). Znaleźliśmy tylko dwa homozygotyczne delecje w genach z dziedziczeniem AR (NPHP1 i SPG7) i tylko dwa hemizygotyczne delecje w jednym genie z dziedziczeniem XL (DMD) u mężczyzn. Wszystkie inne homozygotyczne CNV w genach z dziedziczeniem AR lub hemizygotyczne CNV w genach z dziedziczeniem XL u mężczyzn były duplikacjami. Ponadto, zgodnie z acmg, zaobserwowaliśmy CNV szczególnie w genach o względnej przydatności do działania w medycynie.21,22 oceniliśmy CNVs w 58 Z 59 genów z listą ACMG (z wyłączeniem PMS2) U 5 300-69 000 osób, w zależności od testów używanych do testowania. Wykryto łącznie 46 delecji i 110 duplikacji, co sugeruje częstość do 0,8% (CI: 0,58-1,11%) wśród osób badanych pod kątem tych genów. MYH11, MYH7, KCNQ1 i RYR2 zawierały większość CNV. W szczególności stwierdzono delecje w 16 genach-KCNQ1, MYH11, MYH7, MYBPC3, PCSK9, BRCA1, RYR2, PKP2, TGFBR2, SMAD3, OTC, NF2, FBN1, DSP, DSC2 i APC—z których ponad połowa ma mechanizmy LOF (tabela uzupełniająca 7).

Dodaj komentarz

Twój adres e-mail nie zostanie opublikowany.

Previous post Jak zainstalować NetBeans IDE 12 w Debianie, Ubuntu i Linux Mint
Next post w wieku 83 ten człowiek pozostaje w czołówce fitness