Logos-Falcultades Actividades formativas de doctorado
 
D04300012Métodos estadísticos para la investigación I: análisis exploratorio de datos (EDA) con R
Organiza: Comisión académica del programa Conservación de recursos naturales

Inscripción en: https://doctorado.urjc.es/doctor
(abierta desde 20-03-2025 a las 08:00 h. hasta 30-05-2025)

Coordinación:
Plazas ofertadas: 20
Duración: 10 horas     Tipo: Específico
Modalidad: Presencial    Idioma: Español

Lugar de impartición: Campus de Móstoles. Aula por determinar. (Campus de Móstoles)


Fechas de impartición
16 al 18 de junio de 2025 (L: 10:00-14:00 M:10:00-13:00 y X: 10:00-13:00)


Perfil de los asistentes

Estudiantes matriculados en alguno de los Programas de Doctorado de la rama de Ciencias de la EID de la URJC. Tendrán prioridad los estudiantes del programa que organiza la actividad (PD043 Conservación de recursos naturales).



Objetivos

Equipar al estudiante con los conocimientos necesarios para utilizar métodos estadísticos descriptivos y herramientas de visualización de datos en el entorno de programación R, fortaleciendo su habilidad para identificar patrones y preparar los datos para el análisis posterior.



Contenidos

La actividad contempla una parte teórica y otra práctica con el programa R. El contenido se divide en cuatro bloques temáticos:

 

  1. Introducción a EDA y R (1 hora)
    - Definición de Análisis Exploratorio de Datos (EDA) y su importancia.
    - Introducción a R y RStudio.
    - Importación de datos en R (CSV, Excel, bases de datos).
    - Exploración inicial de los datos con funciones básicas de R (head(), str()).
  2. Estadística Descriptiva (2 hora)

- Cálculo de medidas de tendencia central: Técnicas para calcular y analizar la media, mediana y moda como resúmenes principales de datos.

- Evaluación de la dispersión de los datos: Métodos para medir la variabilidad mediante desviación estándar, rango intercuartílico (IQR) y rango.

- Agrupamiento y análisis comparativo: Estrategias para resumir datos categorizados, comparando medidas de centralidad y dispersión entre diferentes grupos.

- Interpretación de tablas de resumen y análisis de patrones dentro y entre grupos.

  1. Análisis exploratorio de datos con el paquete ggplot2 (4 horas)
    - Introducción a ggplot2 y la gramática de gráficos: conceptos clave para construir visualizaciones efectivas.
    - Análisis de distribuciones:  Construcción e interpretación de histogramas para datos continuos, uso de diagramas de cajas (boxplots) para evaluar dispersión y detectar valores atípicos, gráficos de densidad y de violín para analizar distribuciones más suavizadas.
    - Análisis de relaciones entre variables: Gráficos de dispersión (scatter plots) para explorar correlaciones y tendencias; análisis de relaciones temporales o secuenciales con gráficos de líneas.

- Visualización para múltiples variables: Gráficos de pares (pair plots) para relaciones en conjuntos de variables continuas; facetado para explorar relaciones entre variables categóricas y continuas.

- Personalización avanzada: adaptación de colores, etiquetas y escalas para mejorar la interpretación; aplicación de temas para una presentación profesional de los gráficos.

 

  1. Manejo de Datos Faltantes y Outliers (3 horas)
    - Exploración avanzada de los datos: técnicas para obtener un resumen descriptivo completo y detectar patrones de datos faltantes y valores atípicos.

- Estrategias para manejar datos faltantes: eliminación, imputación y sustitución con valores representativos.

- Opciones para manejar valores atípicos: exclusión, transformación o ajuste en función del contexto del análisis.



Competencias

CB11, CB12, CB15, CA02, CA05, C1.03, C1.08.



Profesorado

Carlos Lara  Romero

https://gestion2.urjc.es/pdi/ver/carlos.lara



Selección de estudiantes

CRITERIOS DE ADMISIÓN:

  1. Haber realizado la inscripción en tiempo y forma.
  2. Una vez cerrado el plazo de inscripción, se asignarán las plazas, ordenadas las solicitudes por orden de solicitud.
  3. Si la demanda es mayor al número de plazas ofertadas, se priorizará a quienes hayan realizado menos actividades ofertadas por la EID y que no tengan penalizaciones.

 

CANCELACIONES:

Si no puede realizar la actividad, cancele su solicitud ANTES de que finalice el plazo de inscripción. La inasistencia a las actividades en las que se inscriba se penalizará en el orden de prelación de las solicitudes de actividades posteriores.

 



Procedimiento de control

Control de asistencia a la actividad formativa, participación del alumno en clase, entrega de ejercicios prácticos resueltos en clase.



Información adicional
  • Para obtener el certificado de la actividad, es necesario cumplir 3 requisitos:

    • Asistencia: haber asistido al menos al 80% de las horas de formación,
    • Evaluación: haber superado las pruebas o actividades de evaluación planteadas por el profesorado y
    • Encuesta de satisfacción: haber accedido a la encuesta de satisfacción de la actividad (estará disponible en la plataforma de gestión de actividades una vez que el profesorado haya cerrado el acta)

    Los certificados se podrán descargar desde la plataforma de gestión de actividades, en la pestaña "Cursos realizados".

  • Dado el número limitado de plazas, se espera que aquellos estudiantes que se preinscriban y sean admitidos, asistan a la actividad formativa. Si no es posible la asistencia, se deberá anular la inscripción con la suficiente antelación (antes de que finalice el periodo de preinscripción). De no hacerlo así, se perderá la prioridad para inscribirse en las siguientes actividades ofertadas por la EID.