ESCUELA INTERNACIONAL DE DOCTORADO Logos-Falcultades

 
Tesis doctorales de la Escuela Internacional de Doctorado de la URJC desde el curso 2024/25
Synthetic Data Generation For Dense Crowds Velocity Anomalies Detection
AutorPRIETO MARTÍN, MELANIA
DirectorCASAS GUIX, DAN
CodirectorCOMINO TRINIDAD, MARC
Fecha de depósito24-03-2026
Periodo de exposición pública25 de marzo a 15 de abril de 2026
Fecha de defensaSin especificar
ProgramaTecnologías de la información y las Comunicaciones (TICs)
Mención internacionalSolicitada
ResumenIntroducción y motivación

El crecimiento sostenido de la población mundial y la progresiva concentración en entornos urbanos han incrementado la frecuencia y magnitud de eventos multitudinarios. Conciertos, festivales, celebraciones deportivas o manifestaciones reúnen regularmente a decenas de miles de personas en espacios limitados, donde pequeñas perturbaciones en el movimiento colectivo pueden amplificarse rápidamente y generar situaciones críticas. Las tragedias ocurridas en eventos recientes han puesto de manifiesto la necesidad de desarrollar herramientas tecnológicas que permitan monitorizar, analizar y anticipar dinámicas potencialmente peligrosas en multitudes densas.

Desde una perspectiva computacional, el análisis de multitudes presenta desafíos significativos. En escenarios de alta densidad, las oclusiones impiden el seguimiento individual fiable, y la obtención de datos reales anotados es limitada debido a restricciones éticas, logísticas y legales. Estas limitaciones dificultan el entrenamiento de modelos de aprendizaje automático robustos capaces de detectar comportamientos anómalos en situaciones reales de riesgo.

Esta tesis aborda este problema combinando simulación tridimensional de multitudes y aprendizaje profundo, proponiendo un marco que permite generar datos sintéticos realistas y utilizarlos para entrenar modelos de detección de anomalías en entornos densos.

Antecedentes

La simulación de multitudes ha evolucionado a lo largo de las últimas décadas integrando enfoques macroscópicos, mesoscópicos y microscópicos. Los modelos microscópicos, como los basados en fuerzas sociales o en velocity obstacles, han demostrado ser especialmente eficaces para reproducir interacciones locales y fenómenos emergentes como la formación de carriles o la dinámica en cuellos de botella. No obstante, la mayoría de estas aproximaciones representan a los agentes como entidades bidimensionales simplificadas, lo que limita la riqueza visual y biomecánica de las simulaciones.

En paralelo, la investigación en análisis de multitudes mediante visión por computador ha transitado desde métodos basados en características manuales hacia modelos de aprendizaje profundo. Los enfoques actuales permiten detectar anomalías en escenarios de baja o moderada densidad, identificando objetos inesperados o comportamientos claramente diferenciados. Sin embargo, su rendimiento disminuye considerablemente cuando la densidad aumenta y las oclusiones se vuelven severas. Además, los datasets disponibles suelen estar restringidos a entornos controlados y carecen de representaciones realistas de multitudes densas.

Ante esta situación, han surgido propuestas orientadas a la generación de datos sintéticos y a la reducción de la brecha de dominio entre simulaciones y datos reales. No obstante, persiste la necesidad de un marco integral que combine generación tridimensional realista, extracción coherente de características visuales y modelos de detección capaces de generalizar a escenarios reales.

Objetivos

El objetivo principal de esta tesis es desarrollar un sistema integral que permita generar datos sintéticos tridimensionales de multitudes densas y emplearlos para entrenar un modelo de aprendizaje profundo capaz de detectar anomalías de velocidad en escenas reales capturadas con una sola cámara.

Este propósito incluye mejorar la fidelidad visual de las simulaciones mediante modelos humanos paramétricos, reducir la brecha entre dominios sintético y real utilizando representaciones basadas en movimiento y demostrar la versatilidad del sistema en aplicaciones adicionales como la visualización avanzada, la simulación física y la anonimización de datos.

Metodología

La propuesta se articula en torno a un pipeline 2D–3D que transforma trayectorias bidimensionales en escenas tridimensionales animadas con humanos paramétricos realistas. Las trayectorias pueden proceder tanto de modelos microscópicos de simulación como de experimentos reales de dinámica peatonal. Tras un proceso de preprocesamiento que garantiza suavidad temporal y coherencia espacial, las trayectorias se proyectan en entornos tridimensionales detallados.

Cada agente se instancia utilizando el modelo paramétrico SMPL, lo que permite incorporar variabilidad morfológica y animaciones articuladas realistas. El sistema desacopla la planificación de trayectorias de la animación corporal, manteniendo la eficiencia de los modelos 2D y añadiendo realismo tridimensional.

El pipeline genera no solo imágenes RGB, sino también mapas de segmentación, profundidad y flujo óptico, todos ellos coherentes entre sí. Estas representaciones densas, menos sensibles a diferencias de apariencia, se emplean como entrada de una red neuronal convolucional diseñada para producir mapas de probabilidad de anomalía a nivel de píxel.

La anomalía de velocidad se define como una desviación significativa respecto a la distribución de velocidades esperada en un escenario determinado. El modelo se entrena exclusivamente con datos sintéticos generados bajo múltiples configuraciones de densidad y geometría, y posteriormente se evalúa sobre datasets reales para analizar su capacidad de generalización.

Resultados

Los experimentos demuestran que el pipeline propuesto permite generar escenas densas tridimensionales realistas y altamente configurables, manteniendo coherencia temporal y geométrica en todas las modalidades generadas. La incorporación de modelos humanos paramétricos mejora significativamente la fidelidad visual respecto a representaciones bidimensionales tradicionales.

El modelo de detección de anomalías entrenado únicamente con datos sintéticos logra identificar patrones anómalos de velocidad en secuencias reales, incluso en condiciones de alta densidad donde los métodos basados en seguimiento individual resultan poco fiables. El uso combinado de flujo óptico, profundidad y segmentación contribuye a reducir la brecha sintético–real y mejora la robustez frente a variaciones de iluminación y apariencia.

Asimismo, el sistema demuestra su utilidad en aplicaciones adicionales, como la generación de mallas paramétricas para simulación física avanzada, la creación de estímulos para estudios perceptivos y la anonimización de grabaciones reales mediante la sustitución de individuos por agentes sintéticos.

Conclusiones

Esta tesis confirma que la generación de datos sintéticos tridimensionales constituye una estrategia eficaz para superar la escasez de datasets densos en el análisis de multitudes. Asimismo, demuestra que es posible entrenar modelos de detección de anomalías de velocidad exclusivamente con datos sintéticos y obtener una adecuada generalización a escenarios reales mediante el uso de representaciones basadas en movimiento.

El trabajo aporta un pipeline modular 2D–3D, una formulación específica de anomalías de velocidad en multitudes densas y un modelo de detección a nivel de píxel validado en datos reales. En conjunto, estas contribuciones proporcionan una base metodológica sólida para el desarrollo de sistemas de monitorización orientados a la prevención de riesgos en eventos multitudinarios y entornos urbanos densamente poblados.

 

 

Enlaces
Universidad Rey Juan Carlos
Escuela Internacional de Doctorado
Toda la actualidad de la EID
Agenda EID
Escuela Internacional de Doctorado
Universidad Rey Juan Carlos
Rectorado – Delegación Madrid
C/ Quintana, 2 - 2ª planta
28008, Madrid
914887056
Buzón de Ayuda al Doctorando
Conecta con nosotros