ESCUELA INTERNACIONAL DE DOCTORADO Logos-Falcultades

 
Tesis doctorales de la Escuela Internacional de Doctorado de la URJC desde el curso 2024/25
Processing and learning over irregular domains: Multidimensional signals defined over multiple graphs
AutorTENORIO GÓMEZ, VÍCTOR MANUEL
DirectorGARCÍA MARQUÉS, ANTONIO
Fecha de depósito23-09-2025
Periodo de exposición pública24 de septiembre a 7 de octubre de 2025
Fecha de defensaSin especificar
ProgramaTecnologías de la información y las Comunicaciones (TICs)
Mención internacionalSolicitada
ResumenLos grafos ofrecen un poderoso marco matemático para representar sistemas complejos caracterizados por entidades y sus relaciones por pares, con aplicaciones que abarcan diversas disciplinas científicas y de ingeniería. Aunque el procesamiento de señales sobre grafos tradicional y las redes neuronales sobre grafos (GNNs, por sus siglas en inglés) han logrado un éxito notable, su enfoque se centra predominantemente en señales y tareas de aprendizaje definidas sobre una única estructura de grafo, a menudo estática y homogénea. Sin embargo, muchos fenómenos del mundo real presentan una riqueza y complejidad que no pueden ser adecuadamente capturadas por un único grafo. Esta tesis aborda dicha limitación explorando el paradigma de señales multidimensionales definidas sobre múltiples grafos, con el objetivo de desarrollar metodologías novedosas tanto para generar conjuntos significativos de grafos como para diseñar arquitecturas GNN avanzadas que aprovechen de manera efectiva estas representaciones estructurales más ricas.

La investigación presentada aquí enfrenta varios desafíos clave inherentes a los escenarios con múltiples grafos. Entre ellos se incluyen: la generación de estructuras de grafo realistas, diversas y controladas que puedan servir como entradas para sistemas de aprendizaje; la dificultad de cerrar brechas estructurales y semánticas al procesar, relacionar o transferir información entre grafos que difieren significativamente en conjuntos de nodos, estructuras de aristas o resoluciones; y la necesidad de aumentar la expresividad y adaptabilidad de las GNNs para utilizar eficazmente la información de múltiples grafos complejos, especialmente en escenarios donde los múltiples grafos no están alineados, exhiben características de nodos incompletas o bajo condiciones desafiantes como la heterofilia.

Para abordar estos desafíos, esta tesis realiza cuatro contribuciones principales, cada una de ellas asociada a una o más publicaciones revisadas por pares.

El primer conjunto de contribuciones se centra en el avance de los modelos generativos de grafos. Reconociendo la necesidad de generar grafos que no solo imiten datos observados sino que también cumplan con requisitos estructurales específicos, introducimos Graph Guided Diffusion (GGDiff). Este novedoso marco unifica múltiples estrategias de guía para la generación condicional de grafos mediante modelos de difusión, interpretando el proceso como un problema de control estocástico. GGDiff permite la guía zero-shot de modelos de difusión preentrenados bajo funciones de recompensa tanto diferenciables como no diferenciables, facilitando la generación de grafos con propiedades deseadas, como determinados subgrafos presentes en la estructura o métricas de equidad. Este trabajo amplía significativamente las herramientas disponibles para crear datos de grafos, permitiendo el uso de los grafos generados en tareas posteriores. Adicionalmente, exploramos la generación de grafos desde la perspectiva de los grafones, que son objetos límite para secuencias densas de grafos. Proponemos un método escalable de estimación de grafones que los recupera directamente mediante el ajuste de momentos utilizando representaciones neuronales implícitas. Este enfoque evita la complejidad del modelado de variables latentes y de las optimizaciones métricas costosas, ofreciendo garantías teóricas sobre la precisión de la estimación. Además, introducimos MomentMixup, una técnica de aumento de datos en el espacio de momentos para mejorar tareas de aprendizaje sobre grafos. Estas dos metodologías generativas proporcionan herramientas potentes para crear estructuras de grafo diversas y fundamentadas, sentando las bases para un aprendizaje más sofisticado en entornos con múltiples grafos.

El segundo conjunto de contribuciones se adentra en arquitecturas GNN novedosas diseñadas para operar eficazmente en entornos de múltiples grafos y en grafos individuales complejos. Primero, proponemos una arquitectura GNN flexible para abordar tareas en las que las señales de entrada y salida están definidas sobre dos grafos completamente distintos, que pueden poseer conjuntos de nodos y topologías diferentes. Este marco, denominado Input-Output GNN (IO-GNN), presenta un diseño de tres bloques (una GNN de entrada, una transformación en espacio latente y una GNN de salida), lo que permite un mapeo eficaz de señales y un aprendizaje de representaciones entre dominios de grafos dispares. Además, el marco admite un enfoque de aprendizaje auto-supervisado, inspirado en el análisis de correlación canónica, demostrando la utilidad de aprovechar información de múltiples estructuras de grafo para aprender representaciones latentes informativas. Finalmente, abordamos el problema de la degradación del rendimiento de las GNNs en grafos heterofílicos, donde los nodos conectados a menudo tienen etiquetas distintas. Introducimos Structure-Guided GNN (SG-GNN), una arquitectura que aprovecha atributos estructurales (como propiedades basadas en roles o propiedades globales) para construir vistas alternativas del grafo. Estos grafos estructurales están diseñados para presentar una mayor homofilia, y SG-GNN aprende de manera adaptativa a ponderar las contribuciones del grafo original y de estas nuevas vistas. Este enfoque mejora significativamente el rendimiento en conjuntos de datos heterofílicos al proporcionar a las GNNs información de vecinos más relevante, y subraya el beneficio de considerar múltiples perspectivas de grafo incluso en tareas inicialmente planteadas sobre un único grafo principal. Como complemento a este enfoque de aprovechamiento estructural, también demostramos que atributos estructurales similares pueden utilizarse en escenarios con datos ausentes, permitiendo interpolar características de nodos completamente no disponibles al identificar similitudes estructurales locales.

En conjunto, las contribuciones de esta tesis establecen un conjunto integral de herramientas y metodologías para la generación y el aprendizaje sobre estructuras de grafos múltiples y complejas. Al desarrollar modelos generativos de grafos fundamentados y arquitecturas de GNN innovadoras, este trabajo amplía los límites de cómo podemos procesar y entender señales multidimensionales definidas sobre múltiples grafos. Los resultados demuestran el gran potencial de ir más allá del paradigma de un solo grafo, abriendo nuevas vías para abordar problemas complejos del mundo real donde los datos están estructurados de forma inherente mediante múltiples estructuras subyacentes e interrelacionadas. En resumen, esta investigación aporta tanto conocimientos teóricos como algoritmos prácticos que contribuyen al avance general del aprendizaje automático sobre grafos.

 

 

Enlaces
Universidad Rey Juan Carlos
Escuela Internacional de Doctorado
Toda la actualidad de la EID
Agenda EID
Escuela Internacional de Doctorado
Universidad Rey Juan Carlos
Rectorado – Delegación Madrid
C/ Quintana, 2 - 2ª planta
28008, Madrid
914887056
Buzón de Ayuda al Doctorando
Conecta con nosotros