Logos-Falcultades Actividades formativas de doctorado
 
D04300010Métodos estadísticos para la investigación I: análisis exploratorio de datos (EDA) con R
Organiza: Comisión académica del programa Conservación de recursos naturales

Inscripción en: https://doctorado.urjc.es/doctor
(abierta desde 19-12-2024 a las 08:00 h. hasta 09-01-2025)

Coordinación:
Plazas ofertadas: 20
Duración: 10 horas     Tipo: Específico
Modalidad: Presencial

Lugar de impartición: Campus de Móstoles. Aula por determinar.
Campus de Móstoles


Fechas de impartición
13 al 15 de enero de 2025 (L: de 10:00-14:00 M:10:00-13:00 y X: 10:00-13:00)


Perfil de los asistentes

Estudiantes matriculados en alguno de los Programas de Doctorado de la rama de Ciencias de la EID de la URJC.



Objetivos

Equipar al estudiante con los conocimientos necesarios para utilizar métodos estadísticos descriptivos y herramientas de visualización de datos en el entorno de programación R, fortaleciendo su habilidad para identificar patrones y preparar los datos para el análisis posterior.



Contenidos

La actividad contempla una parte teórica y otra práctica con el programa R. El contenido se divide en cuatro bloques temáticos:

 

  1. Introducción a EDA y R (1 hora)
    - Definición de Análisis Exploratorio de Datos (EDA) y su importancia.
    - Introducción a R y RStudio.
    - Importación de datos en R (CSV, Excel, bases de datos).
    - Exploración inicial de los datos con funciones básicas de R (head(), str()).
  2. Estadística Descriptiva (2 hora)

- Cálculo de medidas de tendencia central: Técnicas para calcular y analizar la media, mediana y moda como resúmenes principales de datos.

- Evaluación de la dispersión de los datos: Métodos para medir la variabilidad mediante desviación estándar, rango intercuartílico (IQR) y rango.

- Agrupamiento y análisis comparativo: Estrategias para resumir datos categorizados, comparando medidas de centralidad y dispersión entre diferentes grupos.

- Interpretación de tablas de resumen y análisis de patrones dentro y entre grupos.

  1. Análisis exploratorio de datos con el paquete ggplot2 (4 horas)
    - Introducción a ggplot2 y la gramática de gráficos: conceptos clave para construir visualizaciones efectivas.
    - Análisis de distribuciones:  Construcción e interpretación de histogramas para datos continuos, uso de diagramas de cajas (boxplots) para evaluar dispersión y detectar valores atípicos, gráficos de densidad y de violín para analizar distribuciones más suavizadas.
    - Análisis de relaciones entre variables: Gráficos de dispersión (scatter plots) para explorar correlaciones y tendencias; análisis de relaciones temporales o secuenciales con gráficos de líneas.

- Visualización para múltiples variables: Gráficos de pares (pair plots) para relaciones en conjuntos de variables continuas; facetado para explorar relaciones entre variables categóricas y continuas.

- Personalización avanzada: adaptación de colores, etiquetas y escalas para mejorar la interpretación; aplicación de temas para una presentación profesional de los gráficos.

 

  1. Manejo de Datos Faltantes y Outliers (3 horas)
    - Exploración avanzada de los datos: técnicas para obtener un resumen descriptivo completo y detectar patrones de datos faltantes y valores atípicos.

- Estrategias para manejar datos faltantes: eliminación, imputación y sustitución con valores representativos.

- Opciones para manejar valores atípicos: exclusión, transformación o ajuste en función del contexto del análisis.



Competencias

CB11, CB12, CB15, CA02, CA05, C1.03, C1.08.



Profesorado

Carlos Lara  Romero

https://gestion2.urjc.es/pdi/ver/carlos.lara



Procedimiento de control

Control de asistencia a la actividad formativa, participación del alumno en clase, entrega de ejercicios prácticos resueltos en clase.



Información adicional
  • Para obtener el certificado de la actividad, es necesario cumplir 3 requisitos:

    • Asistencia: haber asistido al menos al 80% de las horas de formación,
    • Evaluación: haber superado las pruebas o actividades de evaluación planteadas por el profesorado y
    • Encuesta de satisfacción: haber accedido a la encuesta de satisfacción de la actividad (estará disponible en la plataforma de gestión de actividades una vez que el profesorado haya cerrado el acta)

    Los certificados se podrán descargar desde la plataforma de gestión de actividades, en la pestaña "Cursos realizados".

  • Dado el número limitado de plazas, se espera que aquellos estudiantes que se preinscriban y sean admitidos, asistan a la actividad formativa. Si no es posible la asistencia, se deberá anular la inscripción con la suficiente antelación (antes de que finalice el periodo de preinscripción). De no hacerlo así, se perderá la prioridad para inscribirse en las siguientes actividades ofertadas por la EID.