ESCUELA INTERNACIONAL DE DOCTORADO Logos-Falcultades

 
Tesis doctorales de la Escuela Internacional de Doctorado de la URJC desde el curso 2024/25
Explainable artificial intelligence models for predicting clinical events in chronic diseases using heterogeneous data
AutorLARA ABELENDA, FRANCISCO JESÚS
DirectorCHUSHIG MUZO, CRISTIAN DAVID
CodirectorSOGUERO RUÍZ, CRISTINA
Fecha de depósito25-06-2025
Periodo de exposición pública26 de junio a 9 de julio de 2025
Fecha de defensaSin especificar
ProgramaTecnologías de la información y las Comunicaciones (TICs)
Mención internacionalNo
ResumenAntecedentes: Las Enfermedades Crónicas (ECs) comprenden condiciones que duran un año o más, requieren atención médica continua y afectan la calidad de vida de los pacientes. Representan uno de los retos más significativos a los que se enfrentan las sociedades contemporáneas, evidenciando una prevalencia en constante incremento en los últimos años. Este aumento se atribuye, en gran medida, al envejecimiento progresivo de la población, así como a la influencia de factores modificables, entre los que destacan los estilos de vida sedentarios y los hábitos alimentarios no saludables. Las ECs abarcan una amplia gama de condiciones, siendo la diabetes y las Enfermedades Cardiovasculares (ECVs) dos de las más comunes.

La diabetes mellitus es un trastorno metabólico complejo que ha emergido como uno de los problemas de salud global más significativos del siglo XXI. Se trata de una condición médica caracterizada por niveles elevados de glucosa en sangre, resultado de una producción insuficiente de insulina o de una función ineficaz de la misma. Esta condición puede derivar en efectos muy perjudiciales para la salud como daños neurológicos o renales, entre otros. Existen diferentes tipos de diabetes, pero uno de los más peligrosos es la Diabetes Tipo 1 (DT1), causada por una destrucción autoinmune de las células B pancreáticas que provoca una ausencia total de producción de insulina. Los pacientes con DT1 necesitan insulina de forma externa lo que puede producir efectos adversos como la Hipoglicemia Severa (HS) que afectan negativamente a la salud. Las ECVs, por su parte, constituyen un término muy amplio que engloba una variedad de condiciones que afectan negativamente al corazón o a los vasos sanguíneos. Constituyen un problema de salud pública de gran relevancia a nivel mundial, al ser la principal causa de enfermedad y morbilidad, así como una de las principales causas de muerte prematura en los países desarrollados. Además de su elevada prevalencia y mortalidad, estas patologías implican una considerable carga económica y asistencial, derivada de la necesidad de tratamientos prolongados, hospitalizaciones recurrentes y un uso intensivo y continuo de los servicios sanitarios.

Una posible ayuda para solucionar este tipo de problemas es la aparación de la Inteligencia Artificial (IA) que ha revolucionado la era digital, con resultados sobresalientes en distintos campos como la ciberseguridad, la economía y la salud. En el ámbito sanitario, los modelos de IA muestran un gran potencial para la detección temprana e identificación de factores de riesgo de enfermedades, apoyando la toma de decisiones clínicas y contribuyendo a la prevención de ECs. Dentro del campo de la IA, se pueden encontrar diversas ramas, siendo una de las más destacadas el aprendizaje automático, que se enfoca en la creación de modelos computacionales capaces de extraer conocimiento a partir de datos, con una razonable capacidad de generalización. En la literatura, se han desarrollado diversos modelos basados en IA para aplicaciones en el ámbito de la salud, alcanzando un rendimiento notable en la identificación de diversas enfermedades. Sin embargo, la aplicación de la IA en salud enfrenta dos grandes desafíos: la naturaleza heterogénea de los datos médicos y la falta de explicabilidad en las decisiones tomadas por los modelos. Los modelos de IA extraen conocimiento a partir de los datos, por tanto, la naturaleza de estos datos juega un papel crucial en el diseño y desempeño de los métodos de IA. En algunos casos, los datos obtenidos de una sola modalidad pueden ser suficientes para caracterizar adecuadamente la evolución del estado de salud de un paciente. La recopilación de datos procedentes de múltiples fuentes ofrece perspectivas complementarias y permite acceder a una información más completa e integral. En este contexto, se hace imprescindible explorar el uso de datos heterogéneos —como series temporales, imágenes o texto— mediante el entrenamiento de distintos modelos de inteligencia artificial que integren dicha diversidad. Asimismo, resulta fundamental garantizar la explicabilidad, entendida como la capacidad de interpretar y comprender el proceso seguido por el modelo para alcanzar su decisión final. Este aspecto resulta especialmente crítico en el ámbito sanitario, donde la falta de explicabilidad en algunos modelos de IA representa una barrera significativa para su implementación práctica en entornos clínicos. Para enfrentar este desafío, en la literatura se han propuesto diversos métodos, creando un subcampo de la IA denominado Inteligencia Artificial Explicable (eXplainable Artificial Intelligence, XAI). Las técnicas de XAI tienen como objetivo proporcionar información clara sobre cómo y por qué los modelos toman sus decisiones, mejorando así la confianza, la transparencia y la interpretabilidad.

Objetivos: Con el propósito de mejorar la calidad de vida de los pacientes diagnosticados con ECs, esta Tesis tiene como objetivo principal el desarrollo de modelos basados en IA capaces de predecir eventos clínicos, centrándose especialmente en personas con DT1 y ECVs. Para ello, se han empleado modelos de IA entrenados con datos heterogéneos y técnicas de XAI que permiten no solo anticipar la aparición de estos eventos, sino también identificar los factores de riesgo asociados, facilitando así estrategias de prevención más eficaces. Los objetivos generales de esta tesis son, en primer lugar, desarrollar modelos de IA robustos capaces de procesar distintos tipos de datos como series temporales, texto e imágenes para predecir la aparición de eventos clínicos peligrosos para la salud relacionados con DT1 y ECVs. En segundo lugar, se busca analizar e interpretar los factores clave vinculados con estas enfermedades mediante el uso de técnicas XAI, con el fin de mejorar la detección temprana y facilitar la implementación de estrategias preventivas.

A partir de estos objetivos generales, se establecen cinco Objetivos Específicos (OEs): OE1: Diseñar un enfoque personalizado para la predicción de los niveles de glucosa en personas con diabetes tipo 1 (DT1), con el fin de anticipar y prevenir episodios de hiperglucemia e hipoglucemia; OE2: Desarrollar una estrategia multimodal para detectar episodios de HS en personas con DT1, integrando datos heterogéneos que incluyen series temporales de glucosa, descripciones clínicas en formato textual sobre enfermedades y tratamientos farmacológicos, así como datos tabulares obtenidos mediante cuestionarios; OE3: Identificar los factores de riesgo que contribuyen a la aparición de episodios de HS en adultos con DT1, utilizando métodos XAI con el propósito de prevenir su aparición; OE4: Diseñar una nueva metodología que combine codificación espacial, aprendizaje profundo y transfer learning, con el fin de predecir la aparición de ECVs sobre conjuntos de datos pequeños con pocas muestras y variables; OE5: Evaluar los factores que contribuyen a la aparición de las ECVs mediante modelos XAI.

Metodología: Para alcanzar los objetivos generales planteados en esta tesis, se diseñó una metodología estructurada en tres etapas principales.

La primera etapa se centró en el desarrollo de un modelo personalizado capaz de predecir los niveles de glucosa en personas con DT1, con el propósito de preveer eventos clínicos como hipoglucemias e hiperglucemias. Esta fase está directamente asociada con el primer objetivo general y el objetivo específico OE1. Para su cumplimiento, se llevaron a cabo diversas tareas: una revisión exhaustiva de la literatura sobre modelos de predicción en series temporales, la evaluación del rendimiento de modelos basados en modelos de lenguaje de gran escala (Large Language Models, LLMs), y la implementación de un enfoque personalizado adaptado a cada paciente. La metodología es personalizable dependiendo del paciente, esto se debe a que el modelo utilizado para la predicción es seleccionado teniendo en cuenta las características individuales de cada paciente. El modelo es elegido de un conjunto de ocho modelos basados en distintas tecnologías (como LLMs, transformers, perceptrones multicapa y redes neuronales recurrentes). Para el análisis de los resultados, se utilizaron dos cohortes de pacientes con DT1: aquellos que utilizan bombas de insulina y aquellos que emplean Inyecciones Múltiples Diarias (IMD). Además, se evaluó el rendimiento de los modelos en tres horizontes temporales distintos: 60, 90 y 120 minutos.

En la segunda etapa se abordaron simultáneamente los dos objetivos generales, mediante el desarrollo de un modelo multimodal e interpretable para predecir episodios de SH en personas con DT1, e identificar los factores de riesgo asociados. Esta fase permitió además alcanzar los objetivos específicos OE2 y OE3. Entre las tareas realizadas se incluyen una revisión bibliográfica y la aplicación de técnicas de representación para transformar datos heterogéneos, como series temporales (nivel de glucosa) y texto (información sobre enfermedades y medicamentos), en vectores numéricos adecuados para su procesamiento. Además, se exploraron técnicas de XAI, aplicando métodos post-hoc que permiten interpretar el modelo, identificar el aporte de cada tipo de dato en la decisión final y evaluar los factores de riesgo implicados. Finalmente, se implementaron diversos métodos de fusión multimodal con el fin de mejorar el rendimiento predictivo y analizar las interacciones entre las distintas modalidades de datos.

La tercera etapa se orientó al cumplimiento de los dos objetivos generales enfocándose esta vez en la predicción de ECVs a partir de conjuntos de datos con pocas muestras y variables. Durante esta fase se alcanzaron los objetivos específicos OE4 y OE5. Las tareas incluyeron una revisión y aplicación de métodos que permiten transformar datos tabulares en imágenes, así como el desarrollo de una estrategia eficiente de aprendizaje por transferencia. Esta estrategia busca aumentar la dimensionalidad de conjuntos de datos con pocas muestras y variables mediante la generación de variables ruidosas, aprovechando información proveniente de bases de datos con más muestras. Posteriormente, se evaluó el uso de redes neuronales convolucionales entrenadas con técnicas de aprendizaje por transferencia (transfer-learning) y ajuste fino (fine-tuning) para predecir la aparición de ECVs. Finalmente, se aplicaron métodos de interpretabilidad post-hoc como Grad-Cam con el objetivo de identificar y analizar los factores de riesgo reflejados en las imágenes generadas a partir de los datos tabulares.

Resultados: En la fase 1 de la metodología, centrada en la DT1, se desarrolló un enfoque personalizado utilizando modelos basados en LLMs para predecir la aparición de eventos hipoglucémicos e hiperglucémicos a medio y largo plazo (horizontes de 60, 90 y 120 minutos), empleando exclusivamente datos de glucosa como entrada. Los modelos basados en LLM demostraron un rendimiento comparable al de los enfoques más avanzados disponibles en la literatura. Aunque no alcanzaron la mejor precisión, sí resultaron ser muy robustos y mostraron poca variación entre pacientes. El enfoque personalizado propuesto obtuvo los mejores resultados para los horizontes de 60 y 90 minutos en ambas cohortes analizadas (usuarios de IMD y bombas de insulina), alcanzando un Error Absoluto Medio (EAM) de 15.7 y 15.2 para IMD, y 20.2 y 17.2 para bombas de insulina, respectivamente. Para el horizonte de 120 minutos, los modelos TiDE y Patch-TST fueron los más precisos, obteniendo EAMs de 19.8 y 18.5 en IMD y bombas, respectivamente.

Durante la fase 2 de la metodología, se desarrolló una estrategia de fusión multimodal orientada a la prevención de episodios severos de hipoglucemia en personas con DT1. El enfoque propuesto integró múltiples fuentes de datos como son series temporales (nivel de glucosa), datos tabulares (respuestas a cuestionarios y texto (condiciones médicas y medicación). Esta integración se llevó a cabo mediante técnicas de representación, fusión temprana y selección de características usando un método filter como Relief. Esta estrategia alcanzó un valor de Área Bajo la curva Característica Operativa del Receptor (Area Under the Curve - Receiver Operating Characteristic, AUC-ROC) del 77.9%, superando en un 5.8% al modelo unimodal de referencia que utilizaba únicamente datos de cuestionarios asociados a la falta de conciencia del nivel propio de glucosa. Además, el uso de técnicas XAI, como explicaciones contrafactuales diversas y explicaciones aditivas de shapley, permitió identificar factores de riesgo relevantes a la hora de sufrir episodios de HS. Estas técnicas revelaron una asociación entre la falta de conciencia del nivel propio de glucosa en sangre y un nivel bajo o medio mantenido en el tiempo de glucosa con una mayor aparición de episodios de HS. También se evidenció una posible relación directa entre la presencia de ECVs y la ocurrencia episodios de HS.

La tercera etapa esta centrada en las ECVs y se desarrolló un enfoque capaz de predecir la aparición de este tipo de condiciones a partir de conjuntos de datos con pocas muestras y características. Para ello, se adaptó y mejoró el método LM-IGTD, incorporando técnicas de transfer-learning y fine-tuning. El modelo propuesto alcanzó un AUC-ROC del 85.5%, superando en un 2% a los modelos tradicionales de aprendizaje automático como aquellos basados en árboles. Además, mediante el uso de la técnica post-hoc Grad-CAM, se identificaron factores de riesgo clave para el desarrollo de ECVs, entre los que destacan una avanzada edad, niveles elevados de glucosa y el sexo biológico.

Conclusiones: Esta tesis representa un avance significativo en la aplicación de modelos de IA para la gestión de ECs, con un enfoque específico en DT1 y ECs. Las metodologías desarrolladas contribuyen tanto a la prevención como a una comprensión más profunda de estas condiciones. Este progreso se demuestra mediante la capacidad de los enfoques de IA para predecir con precisión la aparición de eventos hipoglucémicos y ECVs utilizando modalidades de datos heterogéneos, como series temporales, texto e imágenes, en lugar de depender únicamente de datos tabulares tradicionales. Además, la integración de técnicas XAI ha sido crucial para identificar y comprender los factores de riesgo clave asociados a estos eventos clínicos, apoyando así estrategias preventivas y la toma de decisiones clínicas. En conjunto, esta tesis demuestra el potencial de la IA para mejorar la gestión de ECs, ayudando a los profesionales de la salud y a los pacientes a anticipar y evitar resultados críticos, y contribuyendo en última instancia a reducir tanto la carga sanitaria como económica.

 

 

Enlaces
Universidad Rey Juan Carlos
Escuela Internacional de Doctorado
Toda la actualidad de la EID
Agenda EID
Escuela Internacional de Doctorado
Universidad Rey Juan Carlos
Rectorado – Delegación Madrid
C/ Quintana, 2 - 2ª planta
28008, Madrid
914887056
Buzón de Ayuda al Doctorando
Conecta con nosotros