ESCUELA INTERNACIONAL DE DOCTORADO Logos-Falcultades

 
Tesis doctorales de la Escuela Internacional de Doctorado de la URJC desde el curso 2024/25
Spatio-Temporal Machine Learning Architectures for Clinical Multivariate Time Series: Toward Accurate and Explainable Prediction in ICUs
AutorESCUDERO ARNANZ, ÓSCAR
DirectorSOGUERO RUÍZ, CRISTINA
CodirectorGARCÍA MARQUÉS, ANTONIO
Fecha de depósito25-06-2025
Periodo de exposición pública26 de junio a 9 de julio de 2025
Fecha de defensaSin especificar
ProgramaTecnologías de la información y las Comunicaciones (TICs)
Mención internacionalSolicitada
ResumenResumen

La integración de metodologías basadas en inteligencia artificial (AI, por sus siglas en inglés) en el ámbito clínico se ha consolidado como una línea estratégica para el desarrollo de sistemas avanzados de soporte a la decisión médica. La creciente disponibilidad de datos provenientes de historias clínicas electrónicas (EHR), junto con los avances en el modelado de series temporales multivariables (MTS), ha abierto nuevas posibilidades para mejorar la predicción y personalización de tratamientos. No obstante, el entorno clínico plantea desafíos complejos, con datos faltantes, heterogéneos e irregulares, lo que requiere modelos predictivos no solo robustos, sino también explicables.

En este contexto, esta tesis se sitúa en la intersección entre AI, modelado de MTS y análisis basado en grafos, y aborda un problema clínico de gran relevancia: la predicción de la multirresistencia antimicrobiana (MDR) en unidades de cuidados intensivos (ICU). Identificada por la OMS como una amenaza crítica para la salud pública, la MDR supone un riesgo elevado en pacientes ingresados en la ICU, donde la fragilidad clínica y el uso intensivo de antibióticos son habituales. Anticipar su aparición mediante modelos interpretables y adaptados a la dinámica clínica resulta esencial para mejorar la toma de decisiones médicas.

La tesis propone un enfoque integral basado en tres ejes complementarios. Primero, se desarrollan técnicas para el análisis de MTS extraídas de EHR, que incluyen preprocesamiento, alineación temporal y representaciones basadas en similitud entre pacientes, con el fin de capturar patrones dinámicos relevantes para el riesgo de MDR. Segundo, se introduce un marco de modelado basado en grafos para representar relaciones espacio-temporales entre variables clínicas heterogéneas, mediante arquitecturas de inferencia estructuradas espacial y temporalmente. Tercero, se incorporan mecanismos de explicabilidad temporal que descomponen la evolución del riesgo e identifican, de forma interpretable, las variables y relaciones más relevantes en cada instante.

Los métodos desarrollados se validan sobre datos reales de pacientes ingresados en la ICU del Hospital Universitario de Fuenlabrada (2014–2020), aportando solidez empírica y relevancia clínica. Además de optimizar el rendimiento predictivo, las soluciones propuestas han sido diseñadas para facilitar su integración en la práctica médica mediante explicaciones transparentes y alineadas con el razonamiento clínico.

Este resumen presenta los principales hallazgos de la tesis. Se revisa el estado del arte en AI aplicada a medicina, se exponen los objetivos y retos abordados, se describe la metodología propuesta y, finalmente, se analizan los resultados más relevantes, su impacto clínico y las futuras líneas de investigación.



Antecedentes

La digitalización sanitaria y la adopción masiva de historias clínicas electrónicas (EHR) han generado un volumen creciente de datos clínicos, creando nuevas oportunidades para desarrollar sistemas inteligentes de apoyo a la decisión médica. Sin embargo, esta abundancia conlleva una alta complejidad analítica, al integrar variables de distinta naturaleza—continuas, categóricas, binarias, textuales o estáticas—con significados clínicos diversos. Además, las MTS presentan muestreo irregular, longitudes variables y valores faltantes, lo que dificulta el uso de métodos convencionales diseñados para datos homogéneos y equiespaciados.

En este contexto, la AI se perfila como una herramienta prometedora para analizar EHRs y extraer patrones predictivos útiles. Las técnicas de aprendizaje automático (ML) y profundo han demostrado capacidad para modelar relaciones no lineales y descubrir patrones latentes en datos clínicos complejos. No obstante, su aplicación en entornos reales enfrenta dos limitaciones principales: por un lado, muchos modelos asumen muestreo regular, lo que rara vez ocurre en la práctica clínica, y su adaptación mediante imputación puede introducir sesgos; por otro, su falta de interpretabilidad limita su aceptación por parte del personal sanitario.

Para superar estas limitaciones, ha surgido un enfoque basado en grafos que permite representar explícitamente relaciones espaciales y temporales entre variables, pacientes o eventos. Las redes neuronales basadas en grafos han mostrado eficacia al capturar dependencias complejas mediante inferencia estructurada. Sin embargo, la construcción adecuada de los grafos—en particular, la estimación de la matriz de adyacencia—sigue siendo un reto en presencia de datos heterogéneos e irregulares. La diversidad de tipos de variables y sus distintos significados clínicos y temporales dificultan el uso de métricas estándar como la correlación de Pearson o la distancia euclídea, que no consideran ni la heterogeneidad semántica ni la dinámica temporal.

Paralelamente, ha crecido el interés por desarrollar modelos explicables, tanto intrínsecos como post-hoc, especialmente en medicina, donde la transparencia es esencial. Sin embargo, muchas técnicas de inteligencia artificial explicable (XAI) ofrecen interpretaciones estáticas, sin reflejar la evolución temporal de los factores. Esta limitación resulta especialmente crítica en problemas dinámicos, como la aparición de la MDR, donde los factores de riesgo cambian durante el ingreso hospitalario.

Frente a estos desafíos, es necesario diseñar arquitecturas capaces de integrar la heterogeneidad de los datos, modelar relaciones espacio-temporales mediante grafos y ofrecer explicaciones comprensibles con resolución temporal. Estas arquitecturas deben procesar MTS irregulares, construir grafos clínicamente relevantes e incorporar mecanismos de explicabilidad validados por expertos. La presente tesis se sitúa en esta convergencia, proponiendo soluciones que no solo mejoran el rendimiento predictivo, sino que también promueven su adopción clínica mediante explicaciones claras y alineadas con el juicio profesional, avanzando hacia una AI más confiable, explicable y centrada en el paciente.



Objetivos

Esta tesis propone una metodología orientada al desarrollo de arquitecturas capaces de capturar relaciones espaciales, temporales y espacio-temporales en mts irregulares y heterogéneas, con el objetivo de predecir de forma temprana la MDR en la ICU. En este contexto, la precisión y la explicabilidad son esenciales para respaldar decisiones clínicas críticas. Aunque existen modelos de ML que abordan estas estructuras, su aplicabilidad clínica sigue limitada por tres retos principales:

Reto 1 (R1): Limitaciones de los enfoques actuales de procesamiento para MTS clínicas. Los métodos actuales de embeddings para MTS rara vez abordan de forma conjunta el muestreo irregular y la heterogeneidad de los datos presentes en las EHR. Muchos enfoques aplanan la dimensión temporal o simplifican el preprocesamiento, lo que limita su capacidad para representar la complejidad estructural y dinámica de las trayectorias clínicas. Como consecuencia, tienden a tratar por separado la variabilidad temporal o la diversidad de tipos de datos, generando representaciones que omiten interacciones relevantes y no capturan adecuadamente la evolución del paciente.

Reto 2 (R2): Aprendizaje de grafos espacio-temporales y explicabilidad temporal en arquitecturas basadas en grafos. Se requieren arquitecturas capaces de aprender grafos espacio-temporales que reflejen simultáneamente las dependencias espaciales y temporales en MTS heterogéneas e irregulares. Aunque las Graph Convolutional Neural Networks (GCNNs) son ampliamente utilizadas, suelen operar sobre grafos estáticos y asignar puntuaciones de importancia globales por característica, sin reflejar su evolución temporal. Esta limitación impide capturar perfiles de riesgo dinámicos y dificulta la generación de explicaciones útiles para la toma de decisiones clínicas.

Reto 3 (R3): Explicabilidad para arquitecturas de inferencia de MTS a TS. En modelos que generan una serie temporal (TS) como salida, los métodos XAI existentes asumen entradas de longitud fija y producen explicaciones globales o agregadas. Esta aproximación no permite analizar la relación temporal específica entre las entradas y cada paso de la salida, lo que dificulta a los clínicos interpretar las variaciones temporales en las predicciones y entender la contribución de cada variable en distintos momentos.

Superar estos retos es clave para diseñar arquitecturas interpretables que reflejen la naturaleza temporal del cuidado clínico y respalden intervenciones proactivas basadas en evidencia. Con este propósito, se establecen cuatro objetivos que orientan el enfoque de esta tesis:

Objetivo (O1): Integración y preprocesamiento de datos. Consolidar, unificar y preprocesar los conjuntos de datos heterogéneos proporcionados por el Hospital Universitario de Fuenlabrada, que abarcan el periodo 2004--2020. Estos datos incluyen información de pacientes, tanto estática como temporal, en el entorno de la ICU. Garantizar un formato limpio y estandarizado es fundamental para establecer una base sólida sobre la que se llevarán a cabo todos los avances metodológicos y análisis posteriores.

Objetivo (O2)}: Representaciones de MTS para inferencia y explicabilidad.} Desarrollar métodos robustos para extraer representaciones informativas a partir de las \acrshort{mts}, basados en enfoques clásicos (e.g., extracción de características, métodos kernel), junto con técnicas especializadas. Este enfoque aborda directamente el (R1) al capturar la variabilidad temporal en la importancia de las variables, lo que permite una inferencia más interpretable y eficaz a partir de los datos clínicos.

Objetivo (O3): Arquitectura interpretable basada en grafos para modelado espacio-temporal. Proponer nuevas arquitecturas de inferencia basadas en grafos que integren relaciones espaciales y temporales en datos irregulares de MTS. Al construir un grafo unificado que representa las variables clínicas y sus interacciones sobre el tiempo, este objetivo aborda el (R2) y proporciona explicabilidad con resolución temporal sobre cómo evolucionan las contribuciones de las variables a lo largo de la estancia en la ICU.

Objetivo (O4): Explicabilidad temporal para arquitecturas de inferencia de MTS a TS. Proponer nuevos métodos de XAI, basados en técnicas clásicas, capaces de proporcionar explicaciones detalladas con resolución temporal para modelos cuya salida es una TS. Este objetivo responde (R3) al esclarecer la evolución temporal de la importancia de las variables, mejorando así la transparencia y respaldando intervenciones proactivas basadas en la evidencia.

En conjunto, estos cuatro objetivos posicionan esta tesis para avanzar en el rendimiento predictivo, la transparencia y la aplicabilidad clínica de modelos de AI en la predicción de MDR.



Metodología

La metodología propuesta aborda los retos del análisis de MTS irregulares y heterogéneas en el contexto crítico de la ICU, combinando preprocesamiento clínicamente informado, construcción de representaciones interpretables, estimación de grafos espacio-temporales y mecanismos de explicabilidad temporal. El trabajo se basa en datos reales del Hospital Universitario de Fuenlabrada y se fundamenta en técnicas de procesamiento de señales, aprendizaje automático, análisis de grafos y métodos XAI, con el objetivo de desarrollar herramientas de AI fiables, interpretables y útiles en la práctica clínica. El proceso comienza con el preprocesamiento de EHR, incluyendo sincronización temporal entre pacientes, selección de variables relevantes y etiquetado de casos MDR mediante cultivos microbiológicos. Luego, se construyen representaciones de similitud entre pacientes usando técnicas como Dynamic Time Warping (DTW), Time Cluster Kernel (TCK) y Feature Extraction (FE), generando vectores clínicamente significativos y grafos no dirigidos. Sobre esta base, se desarrolla la arquitectura Explainable Spatio-Temporal Graph Convolutional Neural Network (XST-GCNN), que modela relaciones espacio-temporales mediante convoluciones sobre grafos estimados por correlación, suavidad o la nueva Heterogeneous Gower Distance (HGD). Se integran mecanismos de atención que permiten identificar variables y momentos clave en la evolución del riesgo. Finalmente, se extiende el enfoque a tareas con salida secuencial (MTS-to-TS), incorporando tres métodos de explicabilidad temporal: causal conditional mutual information (pre-hoc), Hadamard attention (intrínseca) e IT-SHAP (post-hoc), para ofrecer interpretaciones detalladas de la dinámica clínica.



Resultados

Los resultados confirman la eficacia del marco propuesto para la predicción temprana de MDR en pacientes de ICU, logrando avances en capacidad predictiva, interpretabilidad temporal y manejo de datos clínicos heterogéneos e irregulares. Las representaciones de similitud obtenidas a partir de MTS, empleadas en clasificadores convencionales, alcanzaron un rendimiento competitivo (ROC AUC hasta 0,810) y permitieron generar grafos no dirigidos que capturan relaciones clínicas latentes. Su visualización mediante t-SNE y clustering espectral evidenció patrones asociados a la evolución de la MDR. La arquitectura XST-GCNN demostró capacidad para modelar simultáneamente dependencias espaciales y temporales. Las mejores configuraciones, especialmente aquellas basadas en grafos STG con adyacencias estimadas mediante HGD, alcanzaron un ROC AUC promedio de 0,810 ± 0,024. La atención nodo-temporal permitió identificar variables y momentos críticos, aportando interpretabilidad clínica. En el escenario MTS-to-TS, las arquitecturas con salida temporal incorporaron métodos de explicabilidad complementarios. IT-SHAP destacó por ofrecer explicaciones temporales coherentes con la evolución clínica, identificando factores de riesgo como cultivos bacterianos y administración temprana de antibióticos. Su utilidad fue validada por expertos y mostró buena generalización en datos externos. En conjunto, los resultados evidencian que la combinación de inferencia y explicabilidad mejora la precisión, comprensión y utilidad clínica de los modelos, avanzando hacia una inteligencia artificial más transparente y centrada en el paciente.



Conclusiones

Esta tesis presenta un marco integral de XAI para el análisis de datos clínicos heterogéneos e irregulares, con el objetivo de mejorar la predicción temprana de MDR en pacientes ingresados en la ICU. La propuesta se articula en torno a tres pilares fundamentales: la construcción de representaciones robustas de MTS, la estimación de grafos espacio-temporales entre variables clínicas y el desarrollo de técnicas de explicabilidad temporal alineadas con el razonamiento médico. Estos avances se concretan en cuatro objetivos: (O1) preprocesamiento clínico y consolidación de datos del Hospital Universitario de Fuenlabrada; (O2) desarrollo de representaciones interpretables mediante DTW, TCK y FE para construir grafos de similitud e inferencia con modelos clásicos; (O3) diseño de la arquitectura XST-GCNN, capaz de modelar relaciones espacio-temporales con mecanismos de atención nodal; y (O4) adaptación de métodos de explicabilidad para arquitecturas con salida temporal, incluyendo enfoques pre-hoc, intrínsecos y post-hoc como IT-SHAP. Los resultados obtenidos demuestran mejoras en rendimiento predictivo e interpretabilidad en contextos clínicos reales, así como la utilidad práctica de las explicaciones generadas para apoyar la toma de decisiones médicas. Asimismo, se abren nuevas líneas de investigación centradas en la estimación topológica de grafos, la incorporación de variables estáticas en arquitecturas multimodales y la exploración de nuevos enfoques de explicabilidad, consolidando el modelado gráfico explicable como un eje clave en el desarrollo de sistemas de soporte a la decisión clínica.

 

 

Enlaces
Universidad Rey Juan Carlos
Escuela Internacional de Doctorado
Toda la actualidad de la EID
Agenda EID
Escuela Internacional de Doctorado
Universidad Rey Juan Carlos
Rectorado – Delegación Madrid
C/ Quintana, 2 - 2ª planta
28008, Madrid
914887056
Buzón de Ayuda al Doctorando
Conecta con nosotros