ESCUELA INTERNACIONAL DE DOCTORADO Logos-Falcultades

 
Tesis doctorales de la Escuela Internacional de Doctorado de la URJC desde el curso 2024/25
Interpretable Latent Spaces as Decision Domains for High-Dimensional and Spatiotemporal Biomedical Data
AutorSÁNCHEZ CARBALLO, ESTELA
DirectorMELGAREJO MESEGUER, FRANCISCO MANUEL
CodirectorROJO ÁLVAREZ, JOSÉ LUIS
Fecha de depósito26-05-2026
Periodo de exposición pública27 de mayo a 9 de junio de 2026
Fecha de defensaSin especificar
ProgramaTecnologías de la información y las Comunicaciones (TICs)
Mención internacionalSolicitada
ResumenAntecedentes. La ingeniería biomédica (BME) aborda el estudio de procesos dinámicos relacionados con la salud y el bienestar humano. Éstos se caracterizan por su elevada complejidad, ya que dependen de dimensiones temporales y espaciales, así como de múltiples variables fisiológicas. Su análisis requiere tanto la adquisición de datos multimodales capaces de capturar estas dimensiones como el desarrollo de herramientas que permitan su estudio considerando dicha complejidad. En este contexto, muchos fenómenos en BME presentan una naturaleza intrínsecamente espaciotemporal, ya que la información relevante se distribuye tanto en el tiempo como en el espacio, y su consideración conjunta resulta fundamental para evitar interpretaciones incompletas. Dos ejemplos representativos de procesos biomédicos espaciotemporales son la electrofisiología cardiaca y la biomecánica de la carrera. En el primer caso, la actividad eléctrica del corazón se propaga a través del tejido cardiaco y se manifiesta en la superficie del torso como una señal que evoluciona en el tiempo. En el segundo, el movimiento coordinado de las articulaciones, distribuidas espacialmente, evoluciona temporalmente y condiciona tanto el rendimiento deportivo como el riesgo de lesión. Ambas áreas presentan un alto interés clínico y aplicado, constituyendo escenarios idóneos para el desarrollo de metodologías avanzadas de análisis de datos espaciotemporales.

En electrofisiología cardiaca, las arritmias ventriculares se encuentran entre las principales causas de muerte súbita cardiaca (SCD). Aunque el electrocardiograma (ECG) es la herramienta estándar para su diagnóstico, su limitada resolución espacial dificulta el análisis detallado del comportamiento eléctrico en distintas regiones del corazón. Para abordar esta limitación, la electrocardiografía por imagen (ECGI) permite obtener representaciones tridimensionales de la actividad eléctrica cardiaca con alta resolución espacial y temporal. En este contexto, la alternancia en la onda T (TWA) del ECG se considera un biomarcador relevante asociado a la aparición de arritmias ventriculares malignas y de SCD. Por ello, su detección y localización espacial resultan esenciales para el desarrollo de estrategias preventivas.

En biomecánica de la carrera, el análisis del movimiento articular permite identificar patrones de movimiento ineficientes y factores de riesgo de lesión. Sin embargo, este tipo de análisis se realiza habitualmente en entornos controlados y requiere equipamiento especializado, lo que limita su accesibilidad para la mayoría de corredores amateurs. En este contexto, métricas fácilmente obtenibles mediante dispositivos portables inteligentes, como la cadencia o la longitud de zancada, han demostrado estar relacionadas con la dinámica articular. La estimación de señales biomecánicas complejas a partir de estas variables permite trasladar el análisis biomecánico a entornos reales, facilitando la mejora del rendimiento y la prevención de lesiones.

Un enfoque prometedor para el análisis de estos procesos es el uso de técnicas de inteligencia artificial (AI) basadas en aprendizaje de representaciones, que permiten transformar datos de alta dimensionalidad en espacios latentes compactos capaces de capturar su estructura subyacente. No obstante, la utilidad de estos métodos en contextos clínicos requiere no solo precisión, sino también interpretabilidad. En este sentido, las técnicas de AI explicable (XAI) permiten vincular las representaciones latentes con conocimiento fisiológico y biomecánico relevante. Bajo este enfoque, el análisis de la TWA y el estudio de la relación entre la dinámica articular y variables accesibles mediante dispositivos portables se plantean como escenarios idóneos para el desarrollo y validación de espacios latentes interpretables con impacto en aplicaciones reales.

Objetivos. Los objetivos de esta Tesis se centran en la construcción de espacios latentes a partir de datos biomédicos espaciotemporales, estableciéndolos como dominios informativos para el análisis y la explotación de la información mediante técnicas de procesado de señal y aprendizaje automático. En este sentido, se busca demostrar que estas representaciones permiten capturar la estructura subyacente de datos complejos y de alta dimensionalidad, facilitando tareas como la estimación, la detección y la extracción de información relevante. Asimismo, la Tesis aborda la necesidad de dotar de interpretabilidad a dichas representaciones mediante el uso sistemático de técnicas de XAI, con el objetivo de comprender cómo la información codificada en los espacios latentes condiciona la toma de decisiones de los modelos y qué factores estructurales y temporales determinan los resultados. La validación de estos objetivos se lleva a cabo en dos escenarios seleccionados por su relevancia y potencial de impacto: la estimación y regionalización de la TWA en electrofisiología cardiaca, por su papel en la estratificación del riesgo de SCD, y la estimación de la cinemática articular a partir de descriptores de zancada en biomecánica de la carrera, como vía para trasladar el análisis biomecánico a entornos reales mediante variables accesibles. Ambos casos constituyen problemas de alto interés clínico y aplicado, y escenarios idóneos para evidenciar el valor de los espacios latentes como herramientas analíticas interpretables, contribuyendo tanto al desarrollo metodológico como al avance en la comprensión de los fenómenos biomédicos estudiados.

A partir de los objetivos generales, se definen los siguientes seis objetivos específicos (SO). (SO1): establecer y formalizar un marco de análisis espaciotemporal para la evaluación de la TWA utilizando datos de ECGI, abordando la ausencia de estudios previos basados en ECGI y analizando las limitaciones de los enfoques convencionales como motivación para el desarrollo de nuevas estrategias de estimación y localización. (SO2): diseñar y desarrollar una metodología basada en espacios latentes para el procesamiento conjunto de señales espaciotemporales de ECGI, que permita la identificación y regionalización de áreas cardiacas con mayor probabilidad de presentar TWA. (SO3): desarrollar un marco probabilístico aplicable al análisis de TWA mediante ECGI, proporcionando decisiones estadísticamente fundamentadas a nivel regional y cuantificando la incertidumbre entre diferentes metodologías de detección. (SO4): desarrollar y adaptar algoritmos de XAI para el análisis de espacios latentes derivados de datos de ECGI, permitiendo explicar las decisiones de detección y localización de la TWA mediante la identificación de los factores estructurales y temporales clave que influyen en las salidas del modelo. (SO5): diseñar y desarrollar una metodología basada en espacios latentes para la estimación temporal de la cinemática articular de las extremidades inferiores durante la carrera, en la que la estructura del espacio latente se restrinja explícitamente durante el entrenamiento para codificar información físicamente significativa alineada con un conjunto de descriptores de zancada. (SO6): analizar y caracterizar estilos de carrera mediante el análisis de espacios latentes basado en XAI, identificando los factores clave de la cinemática articular y los descriptores biomecánicos que diferencian perfiles de corredores y que se asocian con patrones relacionados con riesgo de lesión articular o muscular.

Metodología. La presente Tesis Doctoral propone un marco metodológico para el análisis de datos biomédicos espaciotemporales y de alta dimensionalidad, basado en la construcción y explotación de espacios latentes como dominios principales de análisis. Este enfoque se fundamenta en un paradigma data-driven sustentado en el conocimiento del dominio, en el que todas las decisiones metodológicas se orientan a preservar la estructura temporal y espacial de los fenómenos estudiados. El flujo metodológico se organiza en tres fases interrelacionadas: Definición, Modelado y Validación. En la fase de Definición, se formulan los problemas de investigación y los objetivos asociados, se analizan las características de los datos y se aplican procedimientos de preprocesado destinados a garantizar su calidad, coherencia y adecuación al problema planteado. En la fase de Modelado, se emplean técnicas de aprendizaje de representaciones para proyectar los datos en espacios latentes compactos e informativos, capaces de capturar patrones complejos, relaciones estructurales y dinámicas espaciotemporales, pudiendo además ser condicionados durante el entrenamiento para favorecer propiedades específicas. Una vez construido, el espacio latente se establece como el dominio principal de análisis, en el que se integran técnicas de detección de comunidades, métricas basadas en la representación y enfoques probabilísticos que permiten abordar de forma estructurada tareas de estimación, detección y toma de decisiones. De forma transversal, la interpretabilidad se incorpora mediante técnicas de XAI, que permiten vincular la estructura del espacio latente con características biomédicas relevantes. Finalmente, en la fase de Validación, los resultados se analizan desde un enfoque tanto cuantitativo como cualitativo, evaluando su consistencia, robustez y relevancia en relación con los fenómenos biomédicos de interés. Este marco se concibe de forma iterativa, permitiendo refinar las decisiones metodológicas y mejorar progresivamente el rendimiento y la interpretabilidad del sistema. Por tanto, el enfoque propuesto proporciona una base sólida para abordar de manera sistemática, robusta y transparente el análisis de datos complejos en contextos de apoyo a la decisión en salud.

Resultados. Los resultados de esta Tesis Doctoral han sido publicados en tres artículos científicos revisados por pares en revistas de alto impacto. Estos trabajos han sido desarrollados en cumplimiento de los SOs definidos, cuyo logro implica la consecución de los objetivos generales de la Tesis, y han sido llevados a cabo siguiendo el marco metodológico propuesto.

Durante la primera etapa de la investigación, la atención se centró en el análisis de la TWA. En este contexto, se desarrolló una referencia para la comparación de métodos de estimación aplicados a datos de ECGI, en respuesta a la ausencia de estudios previos basados en datos espaciotemporales. Asimismo, este análisis se amplió con el desarrollo de un método estadístico para la localización robusta de la TWA tanto en el epicardio como en el torso. Los resultados mostraron que, en escenarios con TWA añadida de forma sintética, el método propuesto es capaz de identificar y regionalizar las áreas con presencia del biomarcador. Además, la comparación entre distintos métodos evidenció que, para niveles de ruido superiores a 200mV en señales de ECG, los métodos convencionales degradan su rendimiento, mientras que mantienen su capacidad de detección ante variaciones de aproximadamente 55mV entre ondas T consecutivas. Estos resultados fueron recogidos en el artículo Reference for Electrocardiographic Imaging-Based T-Wave Alternans Estimation, publicado en IEEE Access.

Posteriormente, la investigación se orientó al desarrollo de metodologías basadas en espacios latentes para el análisis de datos espaciotemporales. Para la detección y localización de la TWA, se propuso una metodología robusta capaz de identificar la presencia del biomarcador en datos de ECGI, alcanzando un 100% de acierto en escenarios de solución conocida, sin falsos positivos en casos control y con detección en la totalidad de los casos con TWA sintética. En escenarios más complejos, los resultados fueron coherentes y consistentes, y se validaron mediante el marco estadístico desarrollado. En biomecánica de la carrera, se desarrolló un modelo para la estimación de la cinemática articular de las extremidades inferiores a partir de seis descriptores de zancada, alcanzando un error medio absoluto de 4.75º y una correlación de 0.97 entre señales estimadas y reales. Además, se identificaron distintos grupos de corredores en función de sus métricas de carrera, evidenciando patrones diferenciados tanto en las señales articulares como en variables asociadas al riesgo de lesión, en concordancia con la literatura existente. Estos avances fueron recogidos en los artículos Interpretable Manifold Learning for T-Wave Alternans Assessment with Electrocardiographic Imaging y Methods for Estimating Lower-Limb Joint Kinematics from Six Stride Descriptors, publicados en Engineering Applications of Artificial Intelligence y en Knowledge-Based Systems, respectivamente.

Finalmente, la actividad investigadora se centró en el desarrollo de una metodología de XAI adaptada al análisis de señales espaciotemporales, que permitió explicar las decisiones de los algoritmos propuestos y mejorar su interpretabilidad. En el caso de la TWA, se demostró que las regiones temporales y espaciales identificadas como relevantes por los modelos coincidían con aquellas en las que se observaban indicios claros del biomarcador. En el ámbito biomecánico, las regiones más relevantes de las señales se correspondieron con aquellas en las que existían variaciones significativas entre grupos de corredores. Estos resultados evidencian la capacidad de las metodologías propuestas para generar predicciones precisas y proporcionar explicaciones coherentes y alineadas con el conocimiento del dominio, incrementando su valor clínico y práctico. Estos avances también fueron recogidos en los artículos previamente mencionados.

Conclusiones. Esta Tesis Doctoral demuestra que los espacios latentes pueden establecerse como dominios estructurados e interpretables para el análisis de datos biomédicos espaciotemporales de alta dimensionalidad. A través del desarrollo de un marco metodológico unificado, se ha evidenciado que estas representaciones permiten reducir la complejidad de los datos, capturar su estructura subyacente y abordar tareas como la estimación, la detección y la extracción de información relevante. Además, el marco propuesto ha permitido aportar avances no solo a nivel metodológico, sino también en aplicaciones biomédicas de alto impacto. En electrofisiología cardiaca, se ha contribuido al análisis de la TWA a partir de datos de ECGI, incorporando una perspectiva espaciotemporal que posibilita su detección, localización y la cuantificación de la incertidumbre asociada, facilitando su aplicación en la estratificación del riesgo de SCD. En biomecánica de la carrera, se ha demostrado que es posible estimar la cinemática articular de las extremidades inferiores a partir de variables accesibles mediante dispositivos portables, lo que permite trasladar el análisis biomecánico a entornos reales e identificar patrones asociados al rendimiento y al riesgo de lesión. De forma transversal, la integración de técnicas de XAI ha permitido vincular las representaciones latentes con fenómenos fisiológicos y biomecánicos, proporcionando explicaciones coherentes y alineadas con el conocimiento del dominio. Estos resultados refuerzan el papel de los espacios latentes no solo como herramientas de reducción de dimensionalidad, sino como dominios analíticos capaces de soportar procesos de inferencia, interpretación y toma de decisiones. En este contexto, esta Tesis contribuye a consolidarlos como un paradigma clave en el análisis de datos biomédicos complejos, proporcionando un marco metodológico robusto, interpretable y aplicable que sienta las bases para el desarrollo de futuras soluciones en BME.

 

 

Enlaces
Universidad Rey Juan Carlos
Escuela Internacional de Doctorado
Toda la actualidad de la EID
Agenda EID
Escuela Internacional de Doctorado
Universidad Rey Juan Carlos
Rectorado – Delegación Madrid
C/ Quintana, 2 - 2ª planta
28008, Madrid
914887056
Buzón de Ayuda al Doctorando
Conecta con nosotros