Prevalencia y propiedades de la variación intragénica del número de copias en genes de la enfermedad mendeliana

Prevalencia de NVC intragénicos en una cohorte clínica grande

Probamos varios subconjuntos de 1507 genes en 143.515 individuos no relacionados remitidos para pruebas diagnósticas de panel genético de NGS. Se completó un total de aproximadamente 4,8 millones de análisis de un solo gen. Entre casi 8,1 millones de variantes de todos los tipos, identificamos 2.844 CNV intragénicos (1.237 eventos distintos). Estas NVC representaron el 0,03% de todas las variantes, el 3,1% de las variantes notificadas y, en particular, el 9,1% de las variantes clasificadas como LP/P (Tabla Suplementaria 1 y Figura Suplementaria 1). Estas variantes se encontraron en 384 genes e incluyeron 1810 deleciones y 1034 duplicaciones, que en conjunto representaron una prevalencia de 1,9% en esta cohorte, 4,4% entre individuos con al menos una variante reportada y, más significativamente, 9,8% entre individuos que recibieron un reporte con una variante LP/P de cualquier tipo.

Los patrones de ocurrencia intragénica de NVC

los NVC se clasificaron en una de tres categorías: eventos raros únicos, eventos recurrentes comunes y eventos recurrentes de baja frecuencia (Fig. 1a). Cada categoría representaba aproximadamente un tercio de todas las AVN observadas. La gran mayoría de los 384 genes con VNC tenían solo un VNC cada uno, pero estos VNC individuales juntos representaron menos del 10% de todos los eventos (Fig. 1b). Por el contrario, 31 de los 384 genes tenían 15 o más VNC, pero estos representaban casi el 70% de todos los VNC. Además de las frecuencias, se examinaron las ubicaciones intragénicas y los tamaños de las NVC, ya que estas propiedades pueden determinar el impacto clínico. Una cuarta parte de los CNV incluía solo un exón. La mayoría de las NVC intragénicas fueron eventos multiexónicos de genes parciales, y la mayoría abarcaron solo exones internos sin involucrar los exones codificadores terminales (primero o último) (Fig. 1c, d). Entre los CNV de genes parciales que involucran exones terminales, más deleciones que duplicaciones incluyeron los primeros exones, mientras que un número similar de deleciones y duplicaciones incluyó los últimos exones. Finalmente, una mayor proporción de duplicaciones que deleciones incluyó el gen completo. Casi una quinta parte de todos los CNV distintos (no redundantes) incluían un gen completo, y en 40 casos, los CNV abarcaban varios genes vecinos y estaban presentes en al menos 10 cromosomas (Tablas suplementarias 1, 2).

Fig. 1: Frecuencia, tamaño, interpretación y distribución de variantes de número de copias (NVC) observadas en genes clínicamente probados.

histograma que muestra el número de NVC distintos observados en los genes analizados. Las columnas del gráfico indican el número de veces que se observaron los CNV. El gráfico de líneas muestra la proporción de VNC totales observadas en cada compartimiento de frecuencia. Por ejemplo, la primera columna muestra que casi 900 CNV ocurrieron una sola vez y, en conjunto, representaron aproximadamente el 30% de todos los CNV. b Histograma que muestra el número de genes que contenían NVC en nuestra cohorte clínica. Las columnas del gráfico muestran aumentos incrementales en el número de NVC observados en un gen. El gráfico de líneas muestra la proporción de VNC en incrementos arbitrarios de ocurrencia de VNC por gen. Por ejemplo, casi 200 genes tenían solo 1 NVC, que juntos representaron menos del 10% de todos los eventos. Por el contrario, aproximadamente 30 genes tenían más de 15 VNC cada uno, lo que representaba casi el 70% de todos los VNC. c Distribución de supresiones y duplicaciones por número de exones afectados y por interpretación clínica. Los eventos citogenéticos se definen como NVC contiguos de la misma cigosidad que afectan a genes vecinos en un solo cromosoma. De hecho, algunos eventos de genes completos pueden ser parte de eventos citogenéticos más grandes, pero no se enumeran como tales porque otros genes dentro del evento citogenético predicho estaban ausentes de nuestro ensayo y, por lo tanto, no estaban disponibles para el análisis. d Recuento de duplicaciones y supresiones de NVC detectadas en datos clínicos y basales de NVC. Los CNV se dividen en aquellos que incluyen un gen completo (clases I, V), al menos el último exón (clases II, VI), al menos el primer exón (clases III, VII), o solo un exón interno(clases IV, VIII). En la parte superior se muestra una estructura génica genérica. Los cuadros verdes y morados denotan » exones terminales «y todos los demás son» exones internos», como se describe en el texto. Las casillas vacías indican exones eliminados. Esta figura asume que las duplicaciones intragénicas ocurren en tándem, lo que a menudo es el caso de tales eventos. En esta figura no están representadas las CNV que solo involucran regiones promotoras. Una tabla de contingencia chi cuadrado de Pearson da un valor de p de p < 1×10-5 para duplicaciones y p = 1.5×10-5 para las eliminaciones, lo que indica que la diferencia en la distribución de las NVC a través del gen no se debe simplemente a diferencias de muestreo entre las NVC clínicas y basales. deleciones e y f y duplicaciones en genes clínicamente probados y sus interpretaciones. La tabla en (e) muestra genes con mecanismos mutacionales de pérdida de función (LOF), y en (f) muestra genes sin mecanismos de pérdida de función (LOF). La mayoría de los genes incluidos en nuestros paneles fueron seleccionados con mecanismos LOF. Se comparan la clasificación clínica de cada NVC, el patrón de herencia del gen con el NVC y la cigosidad de las variantes. Para los genes ligados al cromosoma X (XL), los CNV heterocigotos en las mujeres se muestran por separado de los CNV en los hombres. AD autosómico dominante, AR autosómico recesivo, F hembra, het heterocigoto, hom homocigoto, M macho, LP variante probablemente patógena, P variante patógena, variantes VUS de significado incierto. La etiqueta «patógena» en c, e y f incluye las NVC clasificadas como patógenas y probablemente patógenas

La clasificación clínica de las eliminaciones de NVC

fue más frecuente en esta cohorte clínica, y la mayoría se notificaron como variantes LP/P (Fig. 1c). Sin embargo, algunas eliminaciones se clasificaron como VUS, principalmente porque eran variantes en el marco de genes sin mecanismos mutacionales de pérdida de función (LOF). En cambio, más de la mitad de las duplicaciones se clasificaron como VUS. Entre las duplicaciones parciales de genes, 359 involucraron exones terminales y 225 solo exones internos (Fig. 1d). Se pronosticó que al menos 166 duplicaciones que abarcaban solo exones internos tendrían un efecto adverso en el marco de lectura de transcripción y, por lo tanto, se clasificaron como LP/P (Tabla Suplementaria 2). Para al menos 30 duplicaciones, observamos supuestos puntos de interrupción basados en datos de secuencia de lectura dividida y predijimos una disposición en tándem que interrumpiría el marco de lectura de transcripción. Esto apoya afirmaciones anteriores de que las duplicaciones intragénicas son reordenamientos tándem típicamente localizados versus eventos más complicados como las translocaciones insercionales.18

También se consideró la distribución y cigosidad de las NVC en genes asociados con trastornos autosómicos dominantes (EA), autosómicos recesivos (RA) y ligados al cromosoma X (XL) (Fig. 1e, f). La gran mayoría de los AVN se encontraban en genes asociados con la herencia AD o XL, aunque este resultado refleja un sesgo porque la mayoría de los genes probados tenían estos patrones de herencia. De 2.096 NVC clasificados como LP / P, el 85% se encontraban en genes asociados a la herencia de EA o XL y el 15% en genes asociados a la herencia de RA. De estos últimos, el 6,7% eran deleciones homocigotas, el 2,8% eran alteraciones heterocigotas compuestas que acompañaban a un SNV patógeno en el otro alelo (constituyendo un diagnóstico molecular positivo para un trastorno de RA; Tabla Suplementaria 1) y el 5,5% eran eventos heterocigotos únicos.

Casi todos los NVC de esta cohorte se encontraron en genes con mecanismos LOF (Fig. 1e). La mayoría de los VNCs en estos genes fueron deleciones clasificadas como patógenas, mientras que más de la mitad de las duplicaciones fueron clasificadas como VUS. Comparativamente, los 304 genes sin mecanismos de LOF tenían pocos NVC, en su mayoría clasificados como VUS o benignos (Fig. 1f), y significativamente más duplicaciones que eliminaciones (p = 1,8×10-9).

VNC y morbilidad

El análisis de un gran número de paneles multigénicos mostró una prevalencia variable de VNC entre los grupos de enfermedades (Fig. 2a, b; Cuadro suplementario 4). Los genes con NVC tenían eventos recurrentes en su mayoría, eventos únicos en su mayoría, o una mezcla de ambos (Fig. 2c). Entre los paneles que habían producido al menos 10 variantes patógenas de cualquier tipo, más de un tercio tenían VNC que representaban más del 10% de las variantes patógenas. Los paneles genéticos que presentaron el mayor número de AVNc fueron los de atrofia muscular espinal, enfermedad de Charcot–Marie-Tooth y distrofinopatías, como se esperaba. Sin embargo, los paneles para defectos cardíacos congénitos y heterotaxia, síndrome de Lynch, sarcoma, distrofia muscular y distonía también identificaron muchos NVC. Por el contrario, los paneles genéticos con las frecuencias más bajas de NVC incluyeron los de pancreatitis crónica, rasopatías, cardiomiopatías y trombofilia hereditaria.

Fig. 2: Variantes de número de copias patógenas (CNVs) por gen y panel.

se muestran paneles en cada especialidad clínica con el porcentaje de informes positivos que incluyeron una o más NVC patógenas. Solo se incluyen paneles que fueron probados clínicamente al menos 100 veces y tenían al menos 10 variantes patógenas de cualquier tipo. Cada panel está representado por un círculo. b Proporción de informes positivos que incluyeron VNC patógenas en varios paneles. Estos paneles fueron los cinco primeros con las variantes más patógenas en cada especialidad clínica. c Se detectaron tres patrones de aparición de NVC: eventos recurrentes (por ejemplo, en PMP22 y SMN1), eventos únicos predominantemente raros (por ejemplo, en DUCHENNE y BRCA2) y una mezcla de ambos (por ejemplo, en BRCA1 y MSH2). El número de variantes distintas se muestra en azul, y las observaciones adicionales / recurrentes de estas variantes se muestran en verde. Fracción d de variantes patógenas que eran VNCs en varios genes. Los cinco genes con las variantes más patógenas de cualquier tipo se muestran en cada especialidad clínica

Los genes para síndromes de cáncer hereditarios mostraron una prevalencia alta (8,3% en general; rango de 0-50% entre los paneles) de NVC entre las variantes patógenas (Fig. 2a; Cuadros complementarios 3 y 4). De los 1059 NVC patógenos observados en estos genes, 219 se observaron una sola vez y 174 fueron recurrentes. El BRCA1 y el BRCA2 tuvieron una prevalencia combinada de NVC del 6,1% (intervalo de confianza : 5,4–6,9%) entre las variantes patógenas, en consonancia con estudios previos (individualmente, BRCA1 11.4%, BRCA2 1,7%).15,19,20 NVC también se enriquecieron en otros genes, como EPCAM, STK11 y VHL, y en genes en varios paneles con bajos rendimientos diagnósticos generales. Utilizando nuestro método NGS, también observamos 90 NVC en los exones duplicados segmentalmente 12-15 de la copia génica funcional de PMS2 (Tabla Suplementaria 1). Por último, se observaron 25 CNV en las regiones promotoras de GREM1, TP53 y APC.

Las NVC en genes asociados a trastornos pediátricos y raros representaron el 7,7% de las variantes patógenas (rango de 0-82% entre los paneles; Fig. 2c). Se encontraron las frecuencias más altas de AVNc en los paneles de encefalopatía epiléptica infantil temprana, síndrome de Joubert, esclerosis tuberosa y malformaciones cavernosas cerebrales (Tabla suplementaria 4). Los genes afectados con mayor frecuencia por las NVC patógenas fueron NF1, NPHP1 y TSC2 (Tabla Suplementaria 3). Entre los genes de epilepsia, observamos NVC que involucraban UBE3A en 15q13.1 y PRRT2 en 16p11.2, que probablemente fueron reordenamientos citogenéticos recurrentes. Se observaron frecuencias más bajas de NVC en los paneles genéticos de ciliopatías, rasopatías, osteogénesis imperfecta y fibrosis quística (Tabla Suplementaria 4). Los paneles de síndrome de Noonan y pancreatitis crónica identificaron muy pocos o ningún CNV patógeno, aunque se analizaron al menos 270 individuos y se notificaron más de 60 variantes patógenas en cada panel.

Los genes para trastornos cardiovasculares mostraron una prevalencia comparativamente menor de AVNC entre las variantes patógenas (4,7% en general; rango de 0-16, 7% entre los paneles). Las frecuencias más altas de NVC se produjeron en los paneles de cardiomiopatía y enfermedad del músculo esquelético (un subconjunto del panel de cardiomiopatía integral), hipercolesterolemia familiar y síndrome de Brugada (Tabla Suplementaria 4). Por el contrario, en los paneles de arritmias (distintas de Brugada) y aortopatías se encontraron muy pocas AVN, mientras que en el panel de cardiomiopatías se encontró la menor prevalencia de AVN patógenas. Los genes con mayor número de NVC patogénicos fueron LDLR, FBN1, PKP2, MYBPC3 y RYR2 (Tabla suplementaria 3). En algunos paneles que presentaron una prevalencia aparentemente alta de NVC, la mayoría, si no todos, de las NVC estaban en solo uno o dos genes (por ejemplo, ENG y LDLR). Los paneles de trastornos cardiovasculares con mayor rendimiento diagnóstico global también tenían los genes con mayor prevalencia de AVNc, excepto los de arritmias y cardiomiopatías, que estaban agotados de AVNc y en los que los diagnósticos más positivos se explicaban por VNC.

Los paneles genéticos para trastornos neurológicos (principalmente trastornos neuromusculares en nuestros paneles) mostraron la mayor prevalencia de NVC intragénicos entre las variantes patógenas (35% global, rango de 0-100% entre los paneles; Fig. 2a, c; Cuadro suplementario 4). Este resultado se explica en gran medida por la duplicación recurrente de genes y la deleción recíproca en PMP22, las deleciones en SMN1 y varios CNV en Duchenne (Tabla suplementaria 3; Fig. 2c, d; Figura complementaria 2). Utilizando un método NGS personalizado, encontramos 135 casos de deleción de SMN1 entre 819 individuos con sospecha de atrofia muscular espinal, y el rango de copias de SMN2 varió de 0 a 5. Incluso cuando se excluyeron PMP22, SMN1 y duchenne, las NVC intragénicas en genes vinculados a trastornos neurológicos seguían representando el 6% de todas las variantes patógenas en nuestra cohorte. Otros genes para trastornos neurológicos comúnmente afectados por NVC incluyeron PARK2, LAMA2 y SPG11.

Análisis de VNCS basales

Nuestras pruebas diagnósticas se limitaron a genes de enfermedad requisados por médicos, pero muchos genes no relacionados con el fenotipo clínico de presentación también se secuenciaron en nuestros ensayos de NGS. Desidentificamos los datos de los 1.507 genes secuenciados en 143.142 individuos e investigamos la aparición de NVC intragénicos en genes no requisados para estimar la prevalencia basal de estos eventos. Estos NVC independientes del fenotipo se denominan en lo sucesivo «NVC basales».»Se realizó una búsqueda de VNCS de referencia en 7-616 genes por individuo para un total de 16 millones de análisis de un solo gen. Esta búsqueda produjo 4.054 NVC intragénicos (1.465 eventos distintos) en 3.772 individuos en 599 genes (Tabla suplementaria 5). La mayoría de estos CNV estuvieron presentes solo una vez, pero algunos fueron vistos de 2 a más de 15 veces (Fig. 3a; Cuadro complementario 6). Sin embargo, los eventos recurrentes en conjunto representaron la mayoría de las observaciones de referencia de la NVC. La gran mayoría de los genes con NVC basales tuvieron cinco o menos eventos (Fig. 3b). Solo 47 genes contenían más de la mitad de todos los NVC basales observados, incluidos ambos genes con eventos recurrentes idénticos y aquellos con una multitud de eventos únicos. La mayoría de los individuos con una NVC intragénica basal solo tuvieron un evento único, pero 146 individuos tuvieron NVC adicionales en genes de diferentes cromosomas. En promedio, detectamos una NVC basal a una tasa de 1 de cada 3979 genes secuenciados con nuestros ensayos.

Fig. 3: Variantes basales del número de copias (NVC) no relacionadas con el fenotipo clínico en una cohorte grande.

La importancia clínica de estos VNCS no se evaluó más allá de su eliminación en genes enumerados en el Colegio Americano de Genética Médica y Genómica con mecanismos mutacionales de pérdida de función (LOF) conocidos. Los NVC en genes que pertenecían a la misma especialidad clínica que los ordenados para pruebas clínicas se eliminaron del análisis. Se eliminaron las llamadas de baja calidad de un solo exón para reducir las posibles llamadas de falsos positivos. histograma que muestra el número de VNCS distintas observadas en genes analizados para VNCs basales. Las columnas del gráfico muestran el número de veces que se observaron los CNV. El gráfico de líneas muestra la proporción de VNC totales observadas en cada compartimiento de frecuencia. Por ejemplo, la primera columna muestra que más de 1100 CNV ocurrieron una sola vez y, en conjunto, representaron aproximadamente el 25% de todos los CNV. Por el contrario, la última columna indica que se encontraron 36 VNC más de 15 veces y representaron más del 40% de todos los VNC basales. b Histograma que muestra el número de genes que contenían NVC basales. Las columnas del gráfico muestran aumentos incrementales en el número de NVC observados en un gen. El gráfico de líneas muestra la proporción de VNC en incrementos arbitrarios de ocurrencia de VNC por gen. Por ejemplo, casi 240 genes tenían solo un NVC, y juntos estos NVC representaron aproximadamente el 6% de todos los eventos. Por el contrario, aproximadamente 45 genes tenían más de 15 VNC cada uno, lo que representaba un poco más del 60% de todos los VNC. c La distribución de las NVC basales se muestra de acuerdo con el número de exones afectados. Los CNV multiexón incluyen tres clases de exones terminales de 5′, exones internos y exones terminales de 3′. D y E) Carga de VNCS de referencia en genes según el modo de herencia y cigosidad. Los CNV en genes con mecanismos mutacionales de LOF se muestran en la parte (d) y los de genes sin mecanismos de LOF se muestran en la parte (e). Los CNV en genes ligados al cromosoma X (XL) se clasificaron como aquellos observados como eventos heterocigotos en mujeres y eventos hemizigóticos en hombres. AD autosómico dominante, AR autosómico recesivo, F mujer, M hombre, het heterocigoto, hom homocigoto

En contraste con las NVC identificadas en los genes clínicamente probados en esta cohorte, la mayoría de las NVC intragénicas basales fueron duplicaciones (Figs. 1c, d y 3c). La mayoría también eran variantes heterocigotas en genes AR o genes que carecían de mecanismos LOF establecidos (Fig. 3d, e). Una minoría de los AVN basales se produjeron en genes asociados con la herencia de EA o mecanismos de LOF (Figs. 1e, f y 3d, e). Los NVC basales más comunes incluyeron eventos de genes completos en NPHP1, NIPA1, MYH11, DNAI2, HFE2, SMN1 y PMP22 y eventos de genes parciales en TFG, BBS9, CTNNA3, PARK2, KCTD7, DNAJC6, GLIS2 y TUBB4A (Tabla suplementaria 6). En cuanto a las características que pueden explicar la existencia de VNCS basales en genes de la enfermedad, observamos que casi el 40% de estos VNCs abarcaban un gen completo y, por lo tanto, no interrumpían directamente los marcos de lectura de transcripción (Fig. 3c). Además, aproximadamente el 90% de las duplicaciones en genes con mecanismos LOF fueron eventos de genes completos o eventos de genes parciales que incluyeron un exón terminal, mientras que solo la mitad de las deleciones en estos genes mostraron los mismos patrones (Tabla suplementaria 5).

Además de evaluar la prevalencia global y las propiedades de las NVC basales, se consideraron las implicaciones clínicas previstas. Se observaron 237 deleciones heterocigotas en 97 genes con herencia DA o XL y mecanismos LOF, la mayoría en PMP22, DMD, AARS, KCNQ1, FIG4, CHEK2 y LRSAM1 (Tablas suplementarias 5 y 7). Encontramos solo dos deleciones homocigotas en genes con herencia AR (NPHP1 y SPG7) y solo dos deleciones hemizigóticas en un solo gen con herencia XL (DMD) en hombres. Todos los demás CNV homocigotos en genes con herencia AR, o CNV hemizígotos en genes con herencia XL en varones, eran duplicaciones. Además, observamos VNCS específicamente en genes con consideraciones de accionabilidad médica de acuerdo con la ACMG.21,22 Evaluamos VNCS en 58 de los 59 genes enumerados en ACMG (excluyendo PMS2) en 5,300-69,000 individuos, dependiendo de los ensayos utilizados para las pruebas. Se detectaron un total de 46 deleciones y 110 duplicaciones, lo que sugiere una frecuencia de hasta 0,8% (IC: 0,58–1,11%) entre los individuos evaluados para esos genes. MYH11, MYH7, KCNQ1 y RYR2 contenían la mayoría de los vehículos CNV. Específicamente, hubo deleciones en 16 genes: KCNQ1, MYH11, MYH7, MYBPC3, PCSK9, BRCA1, RYR2, PKP2, TGFBR2, SMAD3, OTC, NF2, FBN1, DSP, DSC2 y APC, más de la mitad de los cuales tienen mecanismos LOF (Tabla Suplementaria 7).

Deja una respuesta

Tu dirección de correo electrónico no será publicada.

Previous post Cómo instalar NetBeans IDE 12 en Debian, Ubuntu y Linux Mint
Next post A los 83 años, este hombre se mantiene a la vanguardia del fitness