Prevalencia de NVC intragénicos en una cohorte clínica grande
Probamos varios subconjuntos de 1507 genes en 143.515 individuos no relacionados remitidos para pruebas diagnósticas de panel genético de NGS. Se completó un total de aproximadamente 4,8 millones de análisis de un solo gen. Entre casi 8,1 millones de variantes de todos los tipos, identificamos 2.844 CNV intragénicos (1.237 eventos distintos). Estas NVC representaron el 0,03% de todas las variantes, el 3,1% de las variantes notificadas y, en particular, el 9,1% de las variantes clasificadas como LP/P (Tabla Suplementaria 1 y Figura Suplementaria 1). Estas variantes se encontraron en 384 genes e incluyeron 1810 deleciones y 1034 duplicaciones, que en conjunto representaron una prevalencia de 1,9% en esta cohorte, 4,4% entre individuos con al menos una variante reportada y, más significativamente, 9,8% entre individuos que recibieron un reporte con una variante LP/P de cualquier tipo.
Los patrones de ocurrencia intragénica de NVC
los NVC se clasificaron en una de tres categorías: eventos raros únicos, eventos recurrentes comunes y eventos recurrentes de baja frecuencia (Fig. 1a). Cada categoría representaba aproximadamente un tercio de todas las AVN observadas. La gran mayoría de los 384 genes con VNC tenían solo un VNC cada uno, pero estos VNC individuales juntos representaron menos del 10% de todos los eventos (Fig. 1b). Por el contrario, 31 de los 384 genes tenían 15 o más VNC, pero estos representaban casi el 70% de todos los VNC. Además de las frecuencias, se examinaron las ubicaciones intragénicas y los tamaños de las NVC, ya que estas propiedades pueden determinar el impacto clínico. Una cuarta parte de los CNV incluía solo un exón. La mayoría de las NVC intragénicas fueron eventos multiexónicos de genes parciales, y la mayoría abarcaron solo exones internos sin involucrar los exones codificadores terminales (primero o último) (Fig. 1c, d). Entre los CNV de genes parciales que involucran exones terminales, más deleciones que duplicaciones incluyeron los primeros exones, mientras que un número similar de deleciones y duplicaciones incluyó los últimos exones. Finalmente, una mayor proporción de duplicaciones que deleciones incluyó el gen completo. Casi una quinta parte de todos los CNV distintos (no redundantes) incluían un gen completo, y en 40 casos, los CNV abarcaban varios genes vecinos y estaban presentes en al menos 10 cromosomas (Tablas suplementarias 1, 2).
La clasificación clínica de las eliminaciones de NVC
fue más frecuente en esta cohorte clínica, y la mayoría se notificaron como variantes LP/P (Fig. 1c). Sin embargo, algunas eliminaciones se clasificaron como VUS, principalmente porque eran variantes en el marco de genes sin mecanismos mutacionales de pérdida de función (LOF). En cambio, más de la mitad de las duplicaciones se clasificaron como VUS. Entre las duplicaciones parciales de genes, 359 involucraron exones terminales y 225 solo exones internos (Fig. 1d). Se pronosticó que al menos 166 duplicaciones que abarcaban solo exones internos tendrían un efecto adverso en el marco de lectura de transcripción y, por lo tanto, se clasificaron como LP/P (Tabla Suplementaria 2). Para al menos 30 duplicaciones, observamos supuestos puntos de interrupción basados en datos de secuencia de lectura dividida y predijimos una disposición en tándem que interrumpiría el marco de lectura de transcripción. Esto apoya afirmaciones anteriores de que las duplicaciones intragénicas son reordenamientos tándem típicamente localizados versus eventos más complicados como las translocaciones insercionales.18
También se consideró la distribución y cigosidad de las NVC en genes asociados con trastornos autosómicos dominantes (EA), autosómicos recesivos (RA) y ligados al cromosoma X (XL) (Fig. 1e, f). La gran mayoría de los AVN se encontraban en genes asociados con la herencia AD o XL, aunque este resultado refleja un sesgo porque la mayoría de los genes probados tenían estos patrones de herencia. De 2.096 NVC clasificados como LP / P, el 85% se encontraban en genes asociados a la herencia de EA o XL y el 15% en genes asociados a la herencia de RA. De estos últimos, el 6,7% eran deleciones homocigotas, el 2,8% eran alteraciones heterocigotas compuestas que acompañaban a un SNV patógeno en el otro alelo (constituyendo un diagnóstico molecular positivo para un trastorno de RA; Tabla Suplementaria 1) y el 5,5% eran eventos heterocigotos únicos.
Casi todos los NVC de esta cohorte se encontraron en genes con mecanismos LOF (Fig. 1e). La mayoría de los VNCs en estos genes fueron deleciones clasificadas como patógenas, mientras que más de la mitad de las duplicaciones fueron clasificadas como VUS. Comparativamente, los 304 genes sin mecanismos de LOF tenían pocos NVC, en su mayoría clasificados como VUS o benignos (Fig. 1f), y significativamente más duplicaciones que eliminaciones (p = 1,8×10-9).
VNC y morbilidad
El análisis de un gran número de paneles multigénicos mostró una prevalencia variable de VNC entre los grupos de enfermedades (Fig. 2a, b; Cuadro suplementario 4). Los genes con NVC tenían eventos recurrentes en su mayoría, eventos únicos en su mayoría, o una mezcla de ambos (Fig. 2c). Entre los paneles que habían producido al menos 10 variantes patógenas de cualquier tipo, más de un tercio tenían VNC que representaban más del 10% de las variantes patógenas. Los paneles genéticos que presentaron el mayor número de AVNc fueron los de atrofia muscular espinal, enfermedad de Charcot–Marie-Tooth y distrofinopatías, como se esperaba. Sin embargo, los paneles para defectos cardíacos congénitos y heterotaxia, síndrome de Lynch, sarcoma, distrofia muscular y distonía también identificaron muchos NVC. Por el contrario, los paneles genéticos con las frecuencias más bajas de NVC incluyeron los de pancreatitis crónica, rasopatías, cardiomiopatías y trombofilia hereditaria.
Los genes para síndromes de cáncer hereditarios mostraron una prevalencia alta (8,3% en general; rango de 0-50% entre los paneles) de NVC entre las variantes patógenas (Fig. 2a; Cuadros complementarios 3 y 4). De los 1059 NVC patógenos observados en estos genes, 219 se observaron una sola vez y 174 fueron recurrentes. El BRCA1 y el BRCA2 tuvieron una prevalencia combinada de NVC del 6,1% (intervalo de confianza : 5,4–6,9%) entre las variantes patógenas, en consonancia con estudios previos (individualmente, BRCA1 11.4%, BRCA2 1,7%).15,19,20 NVC también se enriquecieron en otros genes, como EPCAM, STK11 y VHL, y en genes en varios paneles con bajos rendimientos diagnósticos generales. Utilizando nuestro método NGS, también observamos 90 NVC en los exones duplicados segmentalmente 12-15 de la copia génica funcional de PMS2 (Tabla Suplementaria 1). Por último, se observaron 25 CNV en las regiones promotoras de GREM1, TP53 y APC.
Las NVC en genes asociados a trastornos pediátricos y raros representaron el 7,7% de las variantes patógenas (rango de 0-82% entre los paneles; Fig. 2c). Se encontraron las frecuencias más altas de AVNc en los paneles de encefalopatía epiléptica infantil temprana, síndrome de Joubert, esclerosis tuberosa y malformaciones cavernosas cerebrales (Tabla suplementaria 4). Los genes afectados con mayor frecuencia por las NVC patógenas fueron NF1, NPHP1 y TSC2 (Tabla Suplementaria 3). Entre los genes de epilepsia, observamos NVC que involucraban UBE3A en 15q13.1 y PRRT2 en 16p11.2, que probablemente fueron reordenamientos citogenéticos recurrentes. Se observaron frecuencias más bajas de NVC en los paneles genéticos de ciliopatías, rasopatías, osteogénesis imperfecta y fibrosis quística (Tabla Suplementaria 4). Los paneles de síndrome de Noonan y pancreatitis crónica identificaron muy pocos o ningún CNV patógeno, aunque se analizaron al menos 270 individuos y se notificaron más de 60 variantes patógenas en cada panel.
Los genes para trastornos cardiovasculares mostraron una prevalencia comparativamente menor de AVNC entre las variantes patógenas (4,7% en general; rango de 0-16, 7% entre los paneles). Las frecuencias más altas de NVC se produjeron en los paneles de cardiomiopatía y enfermedad del músculo esquelético (un subconjunto del panel de cardiomiopatía integral), hipercolesterolemia familiar y síndrome de Brugada (Tabla Suplementaria 4). Por el contrario, en los paneles de arritmias (distintas de Brugada) y aortopatías se encontraron muy pocas AVN, mientras que en el panel de cardiomiopatías se encontró la menor prevalencia de AVN patógenas. Los genes con mayor número de NVC patogénicos fueron LDLR, FBN1, PKP2, MYBPC3 y RYR2 (Tabla suplementaria 3). En algunos paneles que presentaron una prevalencia aparentemente alta de NVC, la mayoría, si no todos, de las NVC estaban en solo uno o dos genes (por ejemplo, ENG y LDLR). Los paneles de trastornos cardiovasculares con mayor rendimiento diagnóstico global también tenían los genes con mayor prevalencia de AVNc, excepto los de arritmias y cardiomiopatías, que estaban agotados de AVNc y en los que los diagnósticos más positivos se explicaban por VNC.
Los paneles genéticos para trastornos neurológicos (principalmente trastornos neuromusculares en nuestros paneles) mostraron la mayor prevalencia de NVC intragénicos entre las variantes patógenas (35% global, rango de 0-100% entre los paneles; Fig. 2a, c; Cuadro suplementario 4). Este resultado se explica en gran medida por la duplicación recurrente de genes y la deleción recíproca en PMP22, las deleciones en SMN1 y varios CNV en Duchenne (Tabla suplementaria 3; Fig. 2c, d; Figura complementaria 2). Utilizando un método NGS personalizado, encontramos 135 casos de deleción de SMN1 entre 819 individuos con sospecha de atrofia muscular espinal, y el rango de copias de SMN2 varió de 0 a 5. Incluso cuando se excluyeron PMP22, SMN1 y duchenne, las NVC intragénicas en genes vinculados a trastornos neurológicos seguían representando el 6% de todas las variantes patógenas en nuestra cohorte. Otros genes para trastornos neurológicos comúnmente afectados por NVC incluyeron PARK2, LAMA2 y SPG11.
Análisis de VNCS basales
Nuestras pruebas diagnósticas se limitaron a genes de enfermedad requisados por médicos, pero muchos genes no relacionados con el fenotipo clínico de presentación también se secuenciaron en nuestros ensayos de NGS. Desidentificamos los datos de los 1.507 genes secuenciados en 143.142 individuos e investigamos la aparición de NVC intragénicos en genes no requisados para estimar la prevalencia basal de estos eventos. Estos NVC independientes del fenotipo se denominan en lo sucesivo «NVC basales».»Se realizó una búsqueda de VNCS de referencia en 7-616 genes por individuo para un total de 16 millones de análisis de un solo gen. Esta búsqueda produjo 4.054 NVC intragénicos (1.465 eventos distintos) en 3.772 individuos en 599 genes (Tabla suplementaria 5). La mayoría de estos CNV estuvieron presentes solo una vez, pero algunos fueron vistos de 2 a más de 15 veces (Fig. 3a; Cuadro complementario 6). Sin embargo, los eventos recurrentes en conjunto representaron la mayoría de las observaciones de referencia de la NVC. La gran mayoría de los genes con NVC basales tuvieron cinco o menos eventos (Fig. 3b). Solo 47 genes contenían más de la mitad de todos los NVC basales observados, incluidos ambos genes con eventos recurrentes idénticos y aquellos con una multitud de eventos únicos. La mayoría de los individuos con una NVC intragénica basal solo tuvieron un evento único, pero 146 individuos tuvieron NVC adicionales en genes de diferentes cromosomas. En promedio, detectamos una NVC basal a una tasa de 1 de cada 3979 genes secuenciados con nuestros ensayos.
En contraste con las NVC identificadas en los genes clínicamente probados en esta cohorte, la mayoría de las NVC intragénicas basales fueron duplicaciones (Figs. 1c, d y 3c). La mayoría también eran variantes heterocigotas en genes AR o genes que carecían de mecanismos LOF establecidos (Fig. 3d, e). Una minoría de los AVN basales se produjeron en genes asociados con la herencia de EA o mecanismos de LOF (Figs. 1e, f y 3d, e). Los NVC basales más comunes incluyeron eventos de genes completos en NPHP1, NIPA1, MYH11, DNAI2, HFE2, SMN1 y PMP22 y eventos de genes parciales en TFG, BBS9, CTNNA3, PARK2, KCTD7, DNAJC6, GLIS2 y TUBB4A (Tabla suplementaria 6). En cuanto a las características que pueden explicar la existencia de VNCS basales en genes de la enfermedad, observamos que casi el 40% de estos VNCs abarcaban un gen completo y, por lo tanto, no interrumpían directamente los marcos de lectura de transcripción (Fig. 3c). Además, aproximadamente el 90% de las duplicaciones en genes con mecanismos LOF fueron eventos de genes completos o eventos de genes parciales que incluyeron un exón terminal, mientras que solo la mitad de las deleciones en estos genes mostraron los mismos patrones (Tabla suplementaria 5).
Además de evaluar la prevalencia global y las propiedades de las NVC basales, se consideraron las implicaciones clínicas previstas. Se observaron 237 deleciones heterocigotas en 97 genes con herencia DA o XL y mecanismos LOF, la mayoría en PMP22, DMD, AARS, KCNQ1, FIG4, CHEK2 y LRSAM1 (Tablas suplementarias 5 y 7). Encontramos solo dos deleciones homocigotas en genes con herencia AR (NPHP1 y SPG7) y solo dos deleciones hemizigóticas en un solo gen con herencia XL (DMD) en hombres. Todos los demás CNV homocigotos en genes con herencia AR, o CNV hemizígotos en genes con herencia XL en varones, eran duplicaciones. Además, observamos VNCS específicamente en genes con consideraciones de accionabilidad médica de acuerdo con la ACMG.21,22 Evaluamos VNCS en 58 de los 59 genes enumerados en ACMG (excluyendo PMS2) en 5,300-69,000 individuos, dependiendo de los ensayos utilizados para las pruebas. Se detectaron un total de 46 deleciones y 110 duplicaciones, lo que sugiere una frecuencia de hasta 0,8% (IC: 0,58–1,11%) entre los individuos evaluados para esos genes. MYH11, MYH7, KCNQ1 y RYR2 contenían la mayoría de los vehículos CNV. Específicamente, hubo deleciones en 16 genes: KCNQ1, MYH11, MYH7, MYBPC3, PCSK9, BRCA1, RYR2, PKP2, TGFBR2, SMAD3, OTC, NF2, FBN1, DSP, DSC2 y APC, más de la mitad de los cuales tienen mecanismos LOF (Tabla Suplementaria 7).