Las tecnologías genómicas unicelulares están revelando la composición, las identidades y los estados celulares de los tejidos con una resolución sin precedentes. Ahora han escalado hasta el punto de que es posible consultar muestras a nivel de población, de miles de individuos. La combinación de información unicelular con datos de genotipo a esta escala brinda oportunidades para vincular la variación genética con los procesos celulares que sustentan aspectos clave de la biología y las enfermedades humanas. Esta estrategia tiene implicaciones potenciales para el diagnóstico de enfermedades, la predicción de riesgos y el desarrollo de soluciones terapéuticas. Pero para integrar eficazmente datos genómicos unicelulares a gran escala, variación genética y datos fenotípicos adicionales será necesario avanzar en los métodos de análisis y generación de datos.
Los estudios de asociación de todo el genoma (GWAS) han descubierto cientos de miles de variantes genéticas asociadas con el riesgo de enfermedades y rasgos humanos complejos. Sin embargo, aún es necesario caracterizar la mayoría de los mecanismos que vinculan estas variantes con su impacto biológico, especialmente para las variantes que se encuentran en regiones del genoma que no codifican proteínas. El mapeo del locus de rasgos cuantitativos de expresión (eQTL), que estima la asociación entre variantes genéticas (particularmente SNPs) y niveles de ARN de genes locales o distales, puede vincular variantes con los supuestos genes diana que regulan. Además, el mapeo de eQTL u otros QTL moleculares puede ayudar a caracterizar los modos de acción de la variación genética asociada a enfermedades. Este enfoque puede ayudar a identificar los genes (y, en consecuencia, las vías y procesos) que pueden estar implicados en la patogénesis de la enfermedad, lo que constituye un primer paso fundamental para identificar oportunidades de intervención terapéutica.
Para que el mapeo de eQTL proporcione información sobre la enfermedad, los cambios en los niveles de expresión del ARN deben analizarse en los tipos de células específicas y en las condiciones relevantes para la enfermedad de interés, ya que el transcriptoma y sus mecanismos reguladores son dinámicos y frecuentemente dependen del contexto. Estudios fundamentales han demostrado cómo los eQTL solo pueden detectarse en ciertos tipos de células o tras estimulación (es decir, eQTL de respuesta). Además, esfuerzos recientes han analizado los eQTL en muchos tejidos humanos; en particular, el Genotype-Tissue Expression Consortium ha mapeado eQTL en más de 50 tejidos humanos obtenidos de donantes post-mortem. Estos estudios tradicionales de eQTL utilizan transcriptomas masivos, que evalúan los niveles de expresión promedio en millones de células de tejidos completos o muestras de tipo celular. Utilizando herramientas experimentales (por ejemplo, clasificación de células activadas por fluorescencia (FACS) y diferenciación in vitro) y computacionales (por ejemplo, deconvolución), los estudios en masa revelaron algunos de los primeros conocimientos sobre los eQTL específicos de un tipo de célula o estado transitorio. Sin embargo, los estudios en masa tienen limitaciones en la resolución de estados celulares raros o carecen de proteínas de superficie con anticuerpos potentes para FACS. Además, algunos estados transitorios o dinámicos no pueden recapitularse in vitro. Estas limitaciones reducen la utilidad de los eQTL en masa para comprender la biología de las variantes asociadas a enfermedades: aunque los eQTL a nivel de tejido están enriquecidos con variantes genéticas asociadas a enfermedades a partir de GWAS, sólo entre el 20 y el 50% de los alelos de enfermedades comunes se colocalizan con los eQTL, lo que sugiere que muchas variantes influyen en la biología a través de mecanismos específicos del estado celular que no pueden identificarse sin enfoques fundamentalmente nuevos.
Las tecnologías genómicas unicelulares, en particular la transcriptómica unicelular (es decir, la secuenciación de ARN unicelular (scRNA-seq)), ofrecen una solución. A medida que estos enfoques, que miden los niveles de expresión en células individuales, se han vuelto prevalentes en los últimos años, han revelado una heterogeneidad celular imprevista en muchos sistemas biológicos. Además, los avances recientes en tecnología, algoritmos y diseño experimental han reducido el costo de scRNA-seq, haciéndolo más comparable con RNA-seq en masa y, por lo tanto, factible de implementar en miles de individuos. Este enfoque permite a los investigadores combinar la granularidad de los ensayos unicelulares con los grandes tamaños de muestra necesarios para los estudios de asociación genética, lo que permite una nueva categoría de estudios de ‘genética unicelular’ que presenta de manera más destacada estudios eQTL unicelulares (sc-eQTL).
El número de estudios sc-eQTL publicados se ha más que duplicado entre enero y diciembre de 2022, y iniciativas internacionales como el Consorcio eQTLGen unicelular (establecido en 2020) están intentando armonizar los esfuerzos en este espacio. Los estudios sc-eQTL han comenzado a abordar preguntas que no podrían plantearse con datos de expresión masiva, como encontrar eQTL que varían con el contexto celular o identificar los estados celulares en los que las variantes asociadas a enfermedades modulan la expresión génica. Los mapas de expresión de alta resolución y específicos del contexto entre individuos profundamente fenotipados eventualmente serán valiosos para el desarrollo terapéutico.
Cuomo ASE, Nathan A, Raychaudhuri S, MacArthur DG, Powell JE. Single-cell genomics meets human genetics. Nat Rev Genet. 2023 Aug;24(8):535-549. doi: 10.1038/s41576-023-00599-5. Epub 2023 Apr 21. PMID: 37085594; PMCID: PMC10784789.