Bienvenidos a AboutData.blog de Gold Light Data, donde exploramos lo último en Big Data, IA, ML, Analítica de Negocios e Inteligencia de Negocios. Únete a nosotros para mantenerte informado y empoderado en el dinámico mundo de la tecnología de datos.

Nueva esperanza para la intervención temprana del cáncer de páncreas a través de la predicción de riesgo basada en IA

El primer caso documentado de cáncer de páncreas se remonta al siglo XVIII. Desde entonces, los investigadores han emprendido una odisea larga y desafiante para comprender esta enfermedad esquiva y mortal. Hasta la fecha, no existe un tratamiento mejor para el cáncer que la intervención temprana. Desafortunadamente, el páncreas, ubicado profundamente dentro del abdomen, es particularmente difícil de detectar en etapas tempranas.

Científicos del Laboratorio de Ciencias de la Computación e Inteligencia Artificial (CSAIL) del MIT, junto con Limor Appelbaum, científica del Departamento de Oncología Radioterápica en el Centro Médico Beth Israel Deaconess (BIDMC), estaban ansiosos por identificar mejor a los pacientes de alto riesgo. Se propusieron desarrollar dos modelos de aprendizaje automático para la detección temprana del adenocarcinoma ductal pancreático (PDAC), la forma más común de este cáncer. Para acceder a una base de datos amplia y diversa, el equipo se asoció con una empresa de red federada, utilizando datos de registros de salud electrónicos de varias instituciones en los Estados Unidos. Esta vasta cantidad de datos ayudó a asegurar la fiabilidad y generalización de los modelos, haciéndolos aplicables en una amplia gama de poblaciones, ubicaciones geográficas y grupos demográficos.

Los dos modelos —la red neuronal “PRISM” y el modelo de regresión logística (una técnica estadística para la probabilidad)— superaron los métodos actuales. La comparación del equipo mostró que mientras los criterios de detección estándar identifican alrededor del 10 por ciento de los casos de PDAC utilizando un umbral de riesgo relativo cinco veces mayor, Prism puede detectar el 35 por ciento de los casos de PDAC en este mismo umbral.

El uso de IA para detectar el riesgo de cáncer no es un fenómeno nuevo: los algoritmos analizan mamografías, escaneos CT para el cáncer de pulmón y asisten en el análisis de pruebas de Papanicolaou y pruebas de VPH, por nombrar algunas aplicaciones. “Los modelos PRISM se destacan por su desarrollo y validación en una extensa base de datos de más de 5 millones de pacientes, superando la escala de la mayoría de las investigaciones anteriores en el campo”, dice Kai Jia, estudiante de doctorado en ingeniería eléctrica y ciencias de la computación (EECS) en el MIT, afiliado al CSAIL y primer autor de un artículo de acceso abierto en eBioMedicine que describe el nuevo trabajo. “El modelo utiliza datos clínicos y de laboratorio de rutina para hacer sus predicciones, y la diversidad de la población estadounidense es un avance significativo sobre otros modelos de PDAC, que generalmente están limitados a regiones geográficas específicas, como algunos centros de atención médica en los EE. UU. Además, el uso de una técnica de regularización única en el proceso de entrenamiento mejoró la generalización e interpretabilidad de los modelos”.

“Este informe describe un enfoque poderoso para usar grandes datos y algoritmos de inteligencia artificial para refinar nuestro enfoque para identificar perfiles de riesgo para el cáncer”, dice David Avigan, profesor de la Escuela de Medicina de Harvard y director del centro de cáncer y jefe de hematología y malignidades hematológicas en BIDMC, quien no participó en el estudio. “Este enfoque puede llevar a estrategias novedosas para identificar pacientes con alto riesgo de malignidad que podrían beneficiarse de una detección enfocada con el potencial de una intervención temprana”.

Perspectivas prismáticas

El viaje hacia el desarrollo de PRISM comenzó hace más de seis años, impulsado por experiencias de primera mano con las limitaciones de las prácticas de diagnóstico actuales. “Aproximadamente el 80-85 por ciento de los pacientes con cáncer de páncreas son diagnosticados en etapas avanzadas, donde la cura ya no es una opción”, dice la autora principal Appelbaum, quien también es instructora en la Escuela de Medicina de Harvard y oncóloga radioterapeuta. “Esta frustración clínica despertó la idea de adentrarse en la riqueza de datos disponibles en los registros de salud electrónicos (EHR)”.

La estrecha colaboración del grupo CSAIL con Appelbaum hizo posible comprender mejor los aspectos médicos y de aprendizaje automático del problema, lo que finalmente llevó a un modelo mucho más preciso y transparente. “La hipótesis era que estos registros contenían pistas ocultas: signos y síntomas sutiles que podrían actuar como señales de advertencia temprana del cáncer de páncreas”, agrega. “Esto guió nuestro uso de redes EHR federadas en el desarrollo de estos modelos, para un enfoque escalable para implementar herramientas de predicción de riesgo en la atención médica”.

Ambos modelos, PrismNN y PrismLR, analizan datos de EHR, incluyendo demografía del paciente, diagnósticos, medicamentos y resultados de laboratorio, para evaluar el riesgo de PDAC. PrismNN utiliza redes neuronales artificiales para detectar patrones intrincados en características de datos como edad, historial médico y resultados de laboratorio, proporcionando una puntuación de riesgo para la probabilidad de PDAC. PrismLR utiliza regresión logística para un análisis más simple, generando una puntuación de probabilidad de PDAC basada en estas características. Juntos, los modelos ofrecen una evaluación exhaustiva de diferentes enfoques para predecir el riesgo de PDAC a partir de los mismos datos de EHR.

Un punto fundamental para ganar la confianza de los médicos, señala el equipo, es entender mejor cómo funcionan los modelos, conocido en el campo como interpretabilidad. Los científicos señalaron que, aunque los modelos de regresión logística son inherentemente más fáciles de interpretar, los avances recientes han hecho que las redes neuronales profundas sean algo más transparentes. Esto ayudó al equipo a refinar las miles de características potencialmente predictivas derivadas del EHR de un solo paciente a aproximadamente 85 indicadores críticos. Estos indicadores, que incluyen la edad del paciente, el diagnóstico de diabetes y una frecuencia aumentada de visitas a médicos, son descubiertos automáticamente por el modelo pero coinciden con la comprensión de los médicos sobre los factores de riesgo asociados con el cáncer de páncreas.

El camino a seguir

A pesar de la promesa de los modelos PRISM, como con toda investigación, algunas partes aún están en progreso. Los datos de EE. UU. son actualmente la única fuente para los modelos, lo que requiere pruebas y adaptación para su uso global. El camino a seguir, señala el equipo, incluye expandir la aplicabilidad del modelo a conjuntos de datos internacionales e integrar biomarcadores adicionales para una evaluación de riesgo más refinada.

“Un objetivo posterior para nosotros es facilitar la implementación de los modelos en entornos de atención médica de rutina. La visión es que estos modelos funcionen sin problemas en el fondo de los sistemas de atención médica, analizando automáticamente los datos de los pacientes y alertando a los médicos sobre casos de alto riesgo sin aumentar su carga de trabajo”, dice Jia. “Un modelo de aprendizaje automático integrado con el sistema EHR podría empoderar a los médicos con alertas tempranas para pacientes de alto riesgo, potencialmente permitiendo intervenciones mucho antes de que se manifiesten los síntomas. Estamos ansiosos por desplegar nuestras técnicas en el mundo real para ayudar a todas las personas a disfrutar de vidas más largas y saludables”.

Jia escribió el artículo junto con Applebaum y Martin Rinard, Profesor de EECS en el MIT y Investigador Principal de CSAIL, quienes son coautores senior del artículo. Los investigadores del artículo fueron apoyados durante su tiempo en el CSAIL del MIT, en parte, por la Agencia de Proyectos de Investigación Avanzada de Defensa, Boeing, la Fundación Nacional de Ciencias y Aarno Labs. TriNetX proporcionó recursos para el proyecto, y la Fundación Prevent Cancer también apoyó al equipo.

Tags :

Author: Iván Torres
Author: Iván Torres

Iván Torres actualmente cuenta con una Maestría en Ciencias en Analítica de Negocios e Inteligencia Artificial Aplicada, otorgada por la Universidad de Charleston (West Virginia, USA), también es profesor de Ingeniería y Maestría en la Universidad TecMilenio, y ha contribuido en diferentes proyectos tecnológicos como analista, consultor y líder para empresas de ámbito internacional acumulando más de 15 años de experiencia en los campos de desarrollo de Software, Big Data, analítica de negocio e I.A. Editor de About Data Blog.

Deja un comentario

Categories