Ciencia de los Datos Aplicada

Grado y Doble Grado. Curso 2023/2024.

ESTUDIO Y DEPURACIÓN DE DATOS - 806310

Curso Académico 2023-24

Datos Generales

SINOPSIS

COMPETENCIAS

Generales
CB4 - Que los estudiantes puedan transmitir información, ideas, problemas y soluciones a un público tanto especializado como no especializado.
CB5 - Que los estudiantes hayan desarrollado aquellas habilidades de aprendizaje necesarias para emprender estudios posteriores con un alto grado de autonomía.
CG1 - Comunicar y transmitir la información a un público tanto especializado como no especializado.
CG2 - Adquirir la habilidad para expresarse claramente y de presentar los resultados de sus análisis, oralmente o por escrito, mediante un informe de carácter profesional.
CG4 - Cultivar interés en el conocimiento, descripción e interpretación de fenómenos susceptibles de cuantificación.
CG5 - Desarrollar la capacidad de trabajar de forma autónoma.
CG10 - Desarrollar la capacidad de expresar y aplicar rigurosamente los conocimientos adquiridos en la resolución de problemas.
CG11 - Poner en práctica las técnicas, herramientas y metodologías propias de la Ciencia de los Datos en distintos ámbitos de aplicación.
Específicas
CE2 - Identificar y seleccionar las principales fuentes de información e indicadores en diferentes ámbitos de aplicación como los sociales, económicos, bibliométricos, sanitarios, financieros, geográficos, etc. , incluyendo los aspectos de protección de datos.
CE4 - Identificar la utilidad y el potencial de las técnicas estadísticas y de análisis de datos adquiridas en las distintas áreas de aplicación (como la documental, geográfica, actuarial, económica, financiera, biosanitaria, etc.) y utilizarlas adecuadamente para descubrir patrones de comportamiento en datos de cualquier volumen y tipología y extraer conclusiones relevantes.
CE12 - Identificar y aplicar las técnicas adecuadas de exploración, gestión, procesamiento, explotación y visualización de datos en función de su volumen y complejidad.
CE13 - Identificar y aplicar las técnicas para la extracción de información, preparar y depurar la información disponible para su posterior análisis de datos.

ACTIVIDADES DOCENTES

Clases teóricas
50%
Clases prácticas
50%
TOTAL
100%

Presenciales

2,4

No presenciales

3,6

Semestre

4

Breve descriptor:

Depuración, codificación, transformaciones y tratamiento previo al análisis estadístico de una base de datos.

Contenido

TEMA 1: ANÁLISIS EXPLORATORIO: Tipos de datos, codificación y transformación, obtención  de gráficos y tablas.

 

TEMA 2: CONTROL DE INTEGRIDAD DE LOS DATOS: Detección de datos atípicos univariantes y multivariantes. Detección y tratamiento de duplicados.  

 

TEMA 3: VALORES PERDIDOS: Detección y tratamiento. Análisis de valores perdidos. Imputación de valores perdidos en variables univariantes y multivariantes. Métodos de imputación múltiple.

TEMA 4: EVALUACIÓN DE LAS HIPÓTESIS DE PARTIDA PARA EL ANÁLISIS DE DATOS: Estudio de normalidad, homocedasticidad e independencia.

Evaluación

Se valorará la nota final a través de los conocimientos adquiridos mediante el desarrollo de ejercicios, trabajos y participación en el aula , que contribuirán con el 40% a la nota final. El
porcentaje restante, el 60%, corresponderá al examen final.

La nota final tendrá en cuenta tanto la evaluación continua como la prueba final y se calculará como el máximo entre:

a) Calificación de la prueba final.
b) La media ponderada de la evaluación continua y la prueba final, siendo el peso de la evaluación continua del 40%.

Cualquier alumno podrá presentarse al examen final, siendo la valoración del mismo el 100% de su nota final.

Bibliografía

Introducción a la ciencia de datos con R: Preparación de los datos y análisis no supervisado. Aida Calviño Martínez, Juana María Alonso Revenga. García Maroto Editores , 2022

Depuración de datos con SPSS y SAS. Juana María Alonso Revenga. García Maroto Editores, 2019

R for data science: import, tidy, transform, visualize, and model data. Wickham, H., Grolemund, G. (2017): https://r4ds.hadley.nz/

Data Wrangling with R. Boehmke, Bradley. Springer. 2016

Estructura

MódulosMaterias
No existen datos de módulos o materias para esta asignatura.

Grupos

Clases Teóricas y/o Prácticas
GrupoPeriodosHorariosAulaProfesor
Grupo Único22/01/2024 - 10/05/2024VIERNES 11:00 - 13:00-SILVIA PINEDA SANJUAN


Actividades Prácticas
GrupoPeriodosHorariosAulaProfesor
Grupo Único22/01/2024 - 10/05/2024MARTES 13:00 - 15:00-SILVIA PINEDA SANJUAN