Ciencia de los Datos Aplicada
Grado y Doble Grado. Curso 2023/2024.
ESTUDIO Y DEPURACIÓN DE DATOS - 806310
Curso Académico 2023-24
Datos Generales
- Plan de estudios: 081C - GRADO EN CIENCIA DE LOS DATOS APLICADA (2022-23)
- Carácter: Obligatoria
- ECTS: 6.0
SINOPSIS
COMPETENCIAS
Generales
CB4 - Que los estudiantes puedan transmitir información, ideas, problemas y soluciones a un público tanto especializado como no especializado.
CB5 - Que los estudiantes hayan desarrollado aquellas habilidades de aprendizaje necesarias para emprender estudios posteriores con un alto grado de autonomía.
CG1 - Comunicar y transmitir la información a un público tanto especializado como no especializado.
CG2 - Adquirir la habilidad para expresarse claramente y de presentar los resultados de sus análisis, oralmente o por escrito, mediante un informe de carácter profesional.
CG4 - Cultivar interés en el conocimiento, descripción e interpretación de fenómenos susceptibles de cuantificación.
CG5 - Desarrollar la capacidad de trabajar de forma autónoma.
CG10 - Desarrollar la capacidad de expresar y aplicar rigurosamente los conocimientos adquiridos en la resolución de problemas.
CG11 - Poner en práctica las técnicas, herramientas y metodologías propias de la Ciencia de los Datos en distintos ámbitos de aplicación.
CB5 - Que los estudiantes hayan desarrollado aquellas habilidades de aprendizaje necesarias para emprender estudios posteriores con un alto grado de autonomía.
CG1 - Comunicar y transmitir la información a un público tanto especializado como no especializado.
CG2 - Adquirir la habilidad para expresarse claramente y de presentar los resultados de sus análisis, oralmente o por escrito, mediante un informe de carácter profesional.
CG4 - Cultivar interés en el conocimiento, descripción e interpretación de fenómenos susceptibles de cuantificación.
CG5 - Desarrollar la capacidad de trabajar de forma autónoma.
CG10 - Desarrollar la capacidad de expresar y aplicar rigurosamente los conocimientos adquiridos en la resolución de problemas.
CG11 - Poner en práctica las técnicas, herramientas y metodologías propias de la Ciencia de los Datos en distintos ámbitos de aplicación.
Específicas
CE2 - Identificar y seleccionar las principales fuentes de información e indicadores en diferentes ámbitos de aplicación como los sociales, económicos, bibliométricos, sanitarios, financieros, geográficos, etc. , incluyendo los aspectos de protección de datos.
CE4 - Identificar la utilidad y el potencial de las técnicas estadísticas y de análisis de datos adquiridas en las distintas áreas de aplicación (como la documental, geográfica, actuarial, económica, financiera, biosanitaria, etc.) y utilizarlas adecuadamente para descubrir patrones de comportamiento en datos de cualquier volumen y tipología y extraer conclusiones relevantes.
CE12 - Identificar y aplicar las técnicas adecuadas de exploración, gestión, procesamiento, explotación y visualización de datos en función de su volumen y complejidad.
CE13 - Identificar y aplicar las técnicas para la extracción de información, preparar y depurar la información disponible para su posterior análisis de datos.
CE4 - Identificar la utilidad y el potencial de las técnicas estadísticas y de análisis de datos adquiridas en las distintas áreas de aplicación (como la documental, geográfica, actuarial, económica, financiera, biosanitaria, etc.) y utilizarlas adecuadamente para descubrir patrones de comportamiento en datos de cualquier volumen y tipología y extraer conclusiones relevantes.
CE12 - Identificar y aplicar las técnicas adecuadas de exploración, gestión, procesamiento, explotación y visualización de datos en función de su volumen y complejidad.
CE13 - Identificar y aplicar las técnicas para la extracción de información, preparar y depurar la información disponible para su posterior análisis de datos.
ACTIVIDADES DOCENTES
Clases teóricas
50%
Clases prácticas
50%
TOTAL
100%
Presenciales
2,4
No presenciales
3,6
Semestre
4
Breve descriptor:
Depuración, codificación, transformaciones y tratamiento previo al análisis estadístico de una base de datos.
Contenido
TEMA 1: ANÁLISIS EXPLORATORIO: Tipos de datos, codificación y transformación, obtención de gráficos y tablas.
TEMA 2: CONTROL DE INTEGRIDAD DE LOS DATOS: Detección de datos atípicos univariantes y multivariantes. Detección y tratamiento de duplicados.
TEMA 3: VALORES PERDIDOS: Detección y tratamiento. Análisis de valores perdidos. Imputación de valores perdidos en variables univariantes y multivariantes. Métodos de imputación múltiple.
TEMA 4: EVALUACIÓN DE LAS HIPÓTESIS DE PARTIDA PARA EL ANÁLISIS DE DATOS: Estudio de normalidad, homocedasticidad e independencia.
Evaluación
Se valorará la nota final a través de los conocimientos adquiridos mediante el desarrollo de ejercicios, trabajos y participación en el aula , que contribuirán con el 40% a la nota final. El
porcentaje restante, el 60%, corresponderá al examen final.
La nota final tendrá en cuenta tanto la evaluación continua como la prueba final y se calculará como el máximo entre:
a) Calificación de la prueba final.
b) La media ponderada de la evaluación continua y la prueba final, siendo el peso de la evaluación continua del 40%.
Cualquier alumno podrá presentarse al examen final, siendo la valoración del mismo el 100% de su nota final.
porcentaje restante, el 60%, corresponderá al examen final.
La nota final tendrá en cuenta tanto la evaluación continua como la prueba final y se calculará como el máximo entre:
a) Calificación de la prueba final.
b) La media ponderada de la evaluación continua y la prueba final, siendo el peso de la evaluación continua del 40%.
Cualquier alumno podrá presentarse al examen final, siendo la valoración del mismo el 100% de su nota final.
Bibliografía
Introducción a la ciencia de datos con R: Preparación de los datos y análisis no supervisado. Aida Calviño Martínez, Juana María Alonso Revenga. García Maroto Editores , 2022
Depuración de datos con SPSS y SAS. Juana María Alonso Revenga. García Maroto Editores, 2019
R for data science: import, tidy, transform, visualize, and model data. Wickham, H., Grolemund, G. (2017): https://r4ds.hadley.nz/
Data Wrangling with R. Boehmke, Bradley. Springer. 2016
Depuración de datos con SPSS y SAS. Juana María Alonso Revenga. García Maroto Editores, 2019
R for data science: import, tidy, transform, visualize, and model data. Wickham, H., Grolemund, G. (2017): https://r4ds.hadley.nz/
Data Wrangling with R. Boehmke, Bradley. Springer. 2016
Estructura
Módulos | Materias |
---|---|
No existen datos de módulos o materias para esta asignatura. |
Grupos
Clases Teóricas y/o Prácticas | ||||
---|---|---|---|---|
Grupo | Periodos | Horarios | Aula | Profesor |
Grupo Único | 22/01/2024 - 10/05/2024 | VIERNES 11:00 - 13:00 | - | SILVIA PINEDA SANJUAN |
Actividades Prácticas | ||||
---|---|---|---|---|
Grupo | Periodos | Horarios | Aula | Profesor |
Grupo Único | 22/01/2024 - 10/05/2024 | MARTES 13:00 - 15:00 | - | SILVIA PINEDA SANJUAN |