Durante décadas, la potencia de cómputo siguió la ley de Moore, avanzando a un ritmo predecible. El número de componentes en un circuito integrado se duplicaba aproximadamente cada dos años. En 2012, los investigadores acuñaron el término ley de Eroom (Moore deletreado al revés) para describir el camino contrastante del desarrollo de fármacos. En los últimos 60 años, el número de medicamentos aprobados en Estados Unidos por cada mil millones de dólares en gastos de investigación y desarrollo se había reducido a la mitad cada nueve años. Ahora se pueden necesitar más de mil millones de dólares en fondos y una década de trabajo para llevar un nuevo medicamento al mercado. La mitad de ese tiempo y dinero se gasta en ensayos clínicos, que son cada vez más grandes y complejos. Y solo uno de cada siete medicamentos que ingresan a los ensayos de fase I finalmente se aprueba.
Algunos investigadores esperan que los frutos de la ley de Moore puedan ayudar a reducir la ley de Eroom. La inteligencia artificial (IA) ya se ha utilizado para hacer grandes avances en las primeras etapas del descubrimiento de fármacos, ayudando en la búsqueda de dianas terapéuticas adecuadas y nuevos diseños de moléculas. Ahora, los científicos están empezando a utilizar la IA para gestionar los ensayos clínicos, incluidas las tareas de redacción de protocolos, reclutamiento de pacientes y análisis de datos.
La reforma de la investigación clínica es “un gran tema de interés en la industria”, dice Lisa Moneymaker, directora de tecnología y directora de productos de Saama, una empresa de software en Campbell, California, que utiliza la IA para ayudar a las organizaciones a automatizar partes de los ensayos clínicos.
El primer paso del proceso de ensayos clínicos es el diseño del ensayo. ¿Qué dosis de medicamentos se deben administrar? ¿A cuántos pacientes? ¿Qué datos se deben recopilar sobre ellos? El laboratorio de Jimeng Sun, un científico informático de la Universidad de Illinois Urbana-Champaign, desarrolló un algoritmo llamado HINT (red de interacción jerárquica) que puede predecir si un ensayo tendrá éxito, basándose en la molécula del fármaco, la enfermedad objetivo y los criterios de elegibilidad del paciente. Hicieron un seguimiento con un sistema llamado SPOT (modelado predictivo secuencial de los resultados de los ensayos clínicos) que, además, tiene en cuenta cuándo se llevaron a cabo los ensayos en sus datos de entrenamiento y pondera más los ensayos más recientes. En función del resultado previsto, las compañías farmacéuticas podrían decidir modificar el diseño de un ensayo o probar un medicamento completamente diferente.
Una empresa llamada Intelligent Medical Objects en Rosemont, Illinois, ha desarrollado SEETrials, un método para solicitar que el gran modelo de lenguaje GPT-4 de OpenAI extraiga información de seguridad y eficacia de los resúmenes de los ensayos clínicos. Esto permite a los diseñadores de ensayos ver rápidamente cómo otros investigadores han diseñado los ensayos y cuáles han sido los resultados. El laboratorio de Michael Snyder, genetista de la Universidad de Stanford en California, desarrolló el año pasado una herramienta llamada CliniDigest que resume simultáneamente docenas de registros de ClinicalTrials.gov, el principal registro de ensayos médicos de Estados Unidos, agregando referencias al resumen unificado. Lo han utilizado para resumir cómo los investigadores clínicos están utilizando dispositivos portátiles como relojes inteligentes, rastreadores de sueño y monitores de glucosa para recopilar datos de los pacientes.
La parte más lenta de un ensayo clínico es el reclutamiento de pacientes, que ocupa hasta un tercio de la duración del estudio. Uno de cada cinco ensayos ni siquiera recluta el número requerido de personas, y casi todos los ensayos superan los plazos de reclutamiento esperados. A algunos investigadores les gustaría acelerar el proceso relajando algunos de los criterios de elegibilidad mientras se mantiene la seguridad. Un grupo de Stanford dirigido por James Zou, un científico de datos biomédicos, desarrolló un sistema llamado Trial Pathfinder que analiza un conjunto de ensayos clínicos completados y evalúa cómo el ajuste de los criterios de participación, como los umbrales para la presión arterial y los recuentos de linfocitos, afecta los cocientes de riesgo, o tasas de incidentes negativos como enfermedades graves o muerte entre los pacientes. En un estudio, lo aplicaron a ensayos de medicamentos para un tipo de cáncer de pulmón. Descubrieron que ajustar los criterios sugeridos por Trial Pathfinder habría duplicado el número de pacientes elegibles sin aumentar el cociente de riesgo. El estudio mostró que el sistema también funcionaba para otros tipos de cáncer y, de hecho, reducía los resultados dañinos porque hacía que las personas más enfermas, que tenían más que ganar con los medicamentos, fueran elegibles para el tratamiento.
La IA puede eliminar algunas de las conjeturas y el trabajo manual de la optimización de los criterios de elegibilidad. Un trabajo más reciente del laboratorio de Sun en Illinois ha producido AutoTrial, un método para entrenar un modelo de lenguaje grande para que un usuario pueda proporcionar una descripción de la prueba y pedirle que genere un rango de criterios apropiado para, por ejemplo, el índice de masa corporal. Una vez que los investigadores han establecido los criterios de elegibilidad, deben encontrar pacientes elegibles. El laboratorio de Chunhua Weng, informático biomédico de la Universidad de Columbia en la ciudad de Nueva York, ha desarrollado Criteria2Query. A través de una interfaz basada en la web, los usuarios pueden escribir los criterios de inclusión y exclusión en lenguaje natural, o ingresar el número de identificación de un ensayo, y el programa convierte los criterios de elegibilidad en una consulta formal de la base de datos para encontrar candidatos coincidentes en las bases de datos de pacientes. Weng también ha desarrollado métodos para ayudar a los pacientes a buscar ensayos. Un sistema, llamado DQueST, tiene dos partes. El primero usa Criteria2Query para extraer criterios de las descripciones de los ensayos. La segunda parte genera preguntas relevantes para los pacientes que ayudan a acotar su búsqueda. Otro sistema, TrialGPT, del laboratorio de Sun en colaboración con los Institutos Nacionales de Salud de EE.UU., es un método para impulsar un modelo de lenguaje grande para encontrar ensayos apropiados para un paciente. Dada una descripción de un paciente y un ensayo clínico, primero decide si el paciente cumple con cada criterio de un ensayo y ofrece una explicación. A continuación, agrega estas evaluaciones en una puntuación de nivel de prueba. Lo hace para muchos ensayos y los clasifica para el paciente.
A menudo, los ensayos excluyen innecesariamente a poblaciones como niños, ancianos o personas embarazadas, pero la IA puede encontrar formas de incluirlos. Las personas con cáncer terminal y las que padecen enfermedades raras tienen dificultades para encontrar ensayos a los que unirse. “Estos pacientes a veces hacen más trabajo que los médicos en la búsqueda diligente de oportunidades de ensayos”, dice Weng. La IA puede ayudar a emparejarlos con proyectos relevantes.
La IA también puede reducir el número de pacientes necesarios para un ensayo. Una start-up llamada Unlearn en San Francisco, California, crea gemelos digitales de pacientes en ensayos clínicos. Basándose en los datos de un paciente experimental al comienzo de un ensayo, los investigadores pueden usar el gemelo para predecir cómo habría progresado el mismo paciente en el grupo de control y comparar los resultados. Este método suele reducir el número de pacientes de control necesarios entre un 20% y un 50%, dice Charles Fisher, fundador y director ejecutivo de Unlearn. La empresa trabaja con varias pequeñas y grandes empresas farmacéuticas. Fisher dice que los gemelos digitales benefician no solo a los investigadores, sino también a los pacientes que se inscriben en los ensayos, porque tienen una menor probabilidad de recibir el placebo.
Los obstáculos en los ensayos clínicos no terminan una vez que los pacientes se inscriben. Las tasas de deserción escolar son altas. En un análisis de 95 ensayos clínicos, casi el 40% de los pacientes dejaron de tomar el medicamento recetado en el primer año. En un artículo de revisión reciente, los investigadores de Novartis mencionaron formas en que la IA puede ayudar. Entre ellas, el uso de datos anteriores para predecir quién tiene más probabilidades de abandonar los estudios para que los médicos puedan intervenir, o el uso de la IA para analizar vídeos de pacientes que toman su medicación para asegurarse de que no se les escapa ninguna dosis.
Los chatbots pueden responder a las preguntas de los pacientes, ya sea durante un estudio o en la práctica clínica normal. Un estudio tomó preguntas y respuestas del foro AskDocs de Reddit y le dio las preguntas a ChatGPT. Los profesionales de la salud prefirieron las respuestas de ChatGPT a las respuestas de los médicos casi el 80% de las veces. En otro estudio, los investigadores crearon una herramienta llamada ChatDoctor ajustando un gran modelo de lenguaje (LLaMA-7B de Meta) en los diálogos entre el paciente y el médico y dándole acceso en tiempo real a fuentes en línea. ChatDoctor podía responder preguntas sobre información médica que era más reciente que los datos de entrenamiento de ChatGPT.
La IA puede ayudar a los investigadores a gestionar los datos entrantes de los ensayos clínicos. Los investigadores de Novartis informaron que puede extraer datos de informes no estructurados, así como anotar imágenes o resultados de laboratorio, agregar puntos de datos ausentes (mediante la predicción de valores en los resultados) e identificar subgrupos entre una población que responde de manera única a un tratamiento. El grupo de Zou en Stanford ha desarrollado PLIP, un motor de búsqueda impulsado por IA que permite a los usuarios encontrar texto o imágenes relevantes dentro de grandes documentos médicos.
Para recopilar datos para un ensayo, los investigadores a veces tienen que producir más de 50 formularios de informes de casos. Una empresa en China llamada Taimei Technology está utilizando IA para generarlos automáticamente en función del protocolo de una prueba.
El costo del desarrollo de medicamentos sigue aumentando, y el tamaño y la complejidad de los ensayos clínicos son un factor importante. En las últimas dos décadas, el número de países en los que se lleva a cabo un ensayo clínico se ha duplicado con creces, y el número medio de puntos de datos recopilados ha crecido drásticamente. Hay más criterios de valoración (resultados de un ensayo clínico que ayudan a determinar la eficacia y la seguridad de una terapia experimental) y procedimientos para medir estos resultados, como análisis de sangre y evaluaciones de la actividad cardíaca. En comparación, los criterios de elegibilidad para los participantes, que incluyen datos demográficos como la edad y el sexo y si un participante es un voluntario sano o paciente, se han mantenido relativamente constantes.
Algunas empresas están desarrollando plataformas que integran muchos de estos enfoques de IA en un solo sistema. Xiaoyan Wang, que dirige el departamento de ciencias de la vida de Intelligent Medical Objects, codesarrolló AutoCriteria, un método para solicitar un gran modelo de lenguaje para extraer los requisitos de elegibilidad de las descripciones de los ensayos clínicos y formatearlos en una tabla. Esto informa a otros módulos de IA en su paquete de software, como aquellos que encuentran sitios de prueba ideales, optimizan los criterios de elegibilidad y predicen los resultados de los ensayos. Pronto, dice Wang, la compañía ofrecerá ChatTrial, un chatbot que permite a los investigadores preguntar sobre los ensayos en la base de datos del sistema, o qué pasaría si un ensayo hipotético se ajustara de cierta manera.
La compañía también ayuda a las empresas farmacéuticas a preparar informes de ensayos clínicos para presentarlos a la Administración de Alimentos y Medicamentos de los Estados Unidos (FDA), la organización que da la aprobación final para el uso de un medicamento en los Estados Unidos. Lo que la compañía llama su Revisión Sistemática Inteligente de la Literatura extrae datos de ensayos comparativos. Otra herramienta busca en las redes sociales lo que la gente dice sobre las enfermedades y los medicamentos para demostrar las necesidades insatisfechas en las comunidades, especialmente en aquellas que se sienten desatendidas. Los investigadores pueden agregar esta información a los informes.
Al comienzo de la pandemia, Saama trabajó con Pfizer en su ensayo de la vacuna contra el COVID-19. Utilizando la tecnología habilitada por IA de Saama, SDQ, “limpiaron” los datos de más de 30.000 pacientes en un corto período de tiempo. “Era el caso de uso perfecto para impulsar realmente lo que la IA podía aportar al espacio”, dice Moneymaker. La herramienta marca los datos anómalos o duplicados, utilizando varios tipos de enfoques de aprendizaje automático. Mientras que los expertos pueden necesitar dos meses para descubrir manualmente cualquier problema con un conjunto de datos, este software puede hacerlo en menos de dos días.
Xiaoyan Wang señala que existen varios desafíos éticos y prácticos para el despliegue de la IA en los ensayos clínicos. Los modelos de IA pueden estar sesgados. Sus resultados pueden ser difíciles de reproducir. Requieren grandes cantidades de datos de entrenamiento, lo que podría violar la privacidad del paciente o crear riesgos de seguridad. Los investigadores podrían volverse demasiado dependientes de la IA. Los algoritmos pueden ser demasiado complejos para entenderlos. “Esta falta de transparencia puede ser problemática en los ensayos clínicos, donde comprender cómo se toman las decisiones es crucial para la confianza y la validación”, dice. Un artículo de revisión reciente en el International Journal of Surgery afirma que el uso de sistemas de IA en ensayos clínicos “no puede tener en cuenta facultades humanas como el sentido común, la intuición y la formación médica”.
Matthew Hutson, Nature 627, S2-S5 (2024). doi: https://doi.org/10.1038/d41586-024-00753-x.