Estadística Aplicada

Grado y Doble Grado. Curso 2024/2025.

ESTUDIO Y DEPURACIÓN DE DATOS - 801598

Curso Académico 2024-25

Datos Generales

SINOPSIS

COMPETENCIAS

Generales
CG10 Desarrollar habilidades que favorezcan el trabajo en grupo
Específicas
CE2 Preparar y depurar la información disponible para su posterior tratamiento estadístico
CE4 Identificar y organizar la información relevante de un problema
CE21 Utilizar correctamente software estadístico programable y manejar al menos dos de los más utilizados en el mundo empresarial

ACTIVIDADES DOCENTES

Clases teóricas
50%
Clases prácticas
50%
TOTAL
100%

Presenciales

2,4

No presenciales

3,6

Semestre

4

Breve descriptor:

Depuración, codificación, transformaciones y tratamiento previo al análisis estadístico de una base de datos.

Requisitos

Conocimientos básicos de R (se recomienda haber cursado Software II)
Conocimientos básicos de descripción y exploración de datos, azar y probabilidad y estimación I y II.

Contenido

 TEMA 1. ARCHIVOS DE DATOS: CODIFICACIÓN Y TRANSFORMACIÓN
 
1.1 Tipos de variables
1.2 Codificación y transformación de datos
1.3 Gráficos y tablas
  
TEMA 2. CONTROL DE INTEGRIDAD DE LOS DATOS

2.1 Detección y tratamiento de datos atípicos (univariante)
2.2 Detección y tratamiento de datos atípicos (bivariante)
2.3 Detección y tratamiento de datos atípicos (multivariante)
2.4 Revisión de datos duplicados
  
TEMA 3. VALORES PERDIDOS: DETECCIÓN Y TRATAMIENTO
 
3.1 Detección de datos perdidos
3.2 Tratamiento de datos perdidos (imputación simple)
3.3 Tratamento de datos perdidos (imputación múltiple)
 

TEMA 4. EVALUACIÓN DE LAS HIPÓTESIS DE PARTIDA PARA EL ANÁLISIS DE DATOS
 
4.1 Pruebas de normalidad
4.2 Pruebas de homocedasticidad
 

Evaluación

Se valorará la nota final a través de los conocimientos adquiridos mediante el desarrollo de ejercicios, trabajos y participación en el aula , que contribuirán con el 40% a la nota final. El
porcentaje restante, el 60%, corresponderá al examen final.

La nota final tendrá en cuenta tanto la evaluación continua como la prueba final y se calculará como el máximo entre:

a) Calificación de la prueba final.
b) La media ponderada de la evaluación continua y la prueba final, siendo el peso de la evaluación continua del 40%.

Cualquier alumno podrá presentarse al examen final, siendo la valoración del mismo el 100% de su nota final.

En todo caso, sí se podrá superar la asignatura mediante el procedimiento de evaluación continua.

Bibliografía

Introducción a la ciencia de datos con R: Preparación de los datos y análisis no supervisado. Aida Calviño Martínez, Juana María Alonso Revenga. García Maroto Editores , 2022

Alonso Revenga, Juana M. “Depuración de Datos con SPSS y SAS” García Maroto Editores, 2019

Boehmke, Bradley. "Data Wrangling with R". Springer. 2016

Cody, Ron. "Cody's Data Cleaning Techniques Using SAS Software". Ed SAS Publishin; 1999

López, Ana M. “Análisis previo y exploratorio de datos”, [en línea], https://personal.us.es/analopez/aed.pdf

Salvador Figueras, M y Gargallo, P. (2003): "Análisis Exploratorio de Datos", [en línea]

http://www.5campus.com/leccion/aed

R for data science: import, tidy, transform, visualize, and model data. Wickham, H., Grolemund, G. (2017): https://r4ds.hadley.nz/

Data Wrangling with R. Boehmke, Bradley. Springer. 2016

van Buuren, S., & Groothuis-Oudshoorn, K. (2011). mice: Multivariate Imputation by Chained Equations in R. Journal of Statistical Software, 45(3), 1–67. https://doi.org/10.18637/jss.v045.i03

Estructura

MódulosMaterias
ANÁLISIS DE DATOSPREPARACIÓN Y DEPURACIÓN DE DATOS. HERRAMIENTOS DE APOYO

Grupos

Actividades prácticas
GrupoPeriodosHorariosAulaProfesor
Grupo mañana A22/01/2025 - 13/05/2025VIERNES 09:00 - 11:00-SILVIA PINEDA SANJUAN
Grupo tarde B22/01/2025 - 13/05/2025VIERNES 16:00 - 18:00-MARIA GAMBOA PEREZ


Clases teóricas y/o prácticas
GrupoPeriodosHorariosAulaProfesor
Grupo mañana A22/01/2025 - 13/05/2025MIÉRCOLES 11:00 - 13:00-SILVIA PINEDA SANJUAN
Grupo tarde B22/01/2025 - 13/05/2025MARTES 18:00 - 20:00-MARIA GAMBOA PEREZ