Ciencia de los Datos Aplicada
Grado y Doble Grado. Curso 2023/2024.
APRENDIZAJE SUPERVISADO I - 806305
Curso Académico 2023-24
Datos Generales
- Plan de estudios: 081C - GRADO EN CIENCIA DE LOS DATOS APLICADA (2022-23)
- Carácter: Obligatoria
- ECTS: 6.0
SINOPSIS
COMPETENCIAS
Generales
CG1 - Comunicar y transmitir la información a un público tanto especializado como no especializado.
CG2 - Adquirir la habilidad para expresarse claramente y de presentar los resultados de sus análisis, oralmente o por escrito, mediante un informe de carácter profesional.
CG3 - Coordinar trabajo en equipo con grupos multidisciplinares y organizar y gestionar proyectos.
CG4 - Cultivar interés en el conocimiento, descripción e interpretación de fenómenos susceptibles de cuantificación.
CG5 - Desarrollar la capacidad de trabajar de forma autónoma.
CG6 - Realizar lecturas críticas de informes y publicaciones científicas.
CG7 - Plantear políticas de actuación encaminadas a tomar las mejores decisiones posibles.
CG8 - Demostrar un pensamiento lógico y un razonamiento estructurado.
CG9 - Sintetizar las ideas principales de un texto o discurso.
CG10 - Desarrollar la capacidad de expresar y aplicar rigurosamente los conocimientos adquiridos en la resolución de problemas.
CG11 - Poner en práctica las técnicas, herramientas y metodologías propias de la Ciencia de los Datos en distintos ámbitos de aplicación.
CG2 - Adquirir la habilidad para expresarse claramente y de presentar los resultados de sus análisis, oralmente o por escrito, mediante un informe de carácter profesional.
CG3 - Coordinar trabajo en equipo con grupos multidisciplinares y organizar y gestionar proyectos.
CG4 - Cultivar interés en el conocimiento, descripción e interpretación de fenómenos susceptibles de cuantificación.
CG5 - Desarrollar la capacidad de trabajar de forma autónoma.
CG6 - Realizar lecturas críticas de informes y publicaciones científicas.
CG7 - Plantear políticas de actuación encaminadas a tomar las mejores decisiones posibles.
CG8 - Demostrar un pensamiento lógico y un razonamiento estructurado.
CG9 - Sintetizar las ideas principales de un texto o discurso.
CG10 - Desarrollar la capacidad de expresar y aplicar rigurosamente los conocimientos adquiridos en la resolución de problemas.
CG11 - Poner en práctica las técnicas, herramientas y metodologías propias de la Ciencia de los Datos en distintos ámbitos de aplicación.
Específicas
CE3 - Describir situaciones con comportamiento aleatorio y aplicar la Ciencia de los Datos para resolver un problema real mediante los distintos pasos: identificar la información, diseñar el estudio, analizar los datos, construir un modelo adecuado, interpretar los resultados y emitir informes técnicos.
CE6 - Aplicar técnicas estadísticas y de aprendizaje automático en el análisis de datos cualitativos y cuantitativos de cualquier volumen y tipo, tales como espaciales, de texto, imágenes, etc.
CE12 - Identificar y aplicar las técnicas adecuadas de exploración, gestión, procesamiento, explotación y visualización de datos en función de su volumen y complejidad.
CE6 - Aplicar técnicas estadísticas y de aprendizaje automático en el análisis de datos cualitativos y cuantitativos de cualquier volumen y tipo, tales como espaciales, de texto, imágenes, etc.
CE12 - Identificar y aplicar las técnicas adecuadas de exploración, gestión, procesamiento, explotación y visualización de datos en función de su volumen y complejidad.
ACTIVIDADES DOCENTES
Presenciales
2,4
No presenciales
3,6
Semestre
4
Breve descriptor:
Introducción al aprendizaje supervisado: modelos lineales. Regresión lineal univariante y multivariante. Selección de variables. Introducción a modelos glm: modelos logit y probit
Contenido
- Introducción al aprendizaje estadístico. Diferencias de paradigma: aprendizaje supervisado vs no supervisado.
- Introducción a la modelización lineal. Correlación y causalidad. Introducción histórica de la regresión
- Regresión lineal univariante. Análisis exploratorio y estimación: método de los mínimos cuadrados. Interpretación de los coeficientes
- Diagnosis. Inferencia sobre los parámetros. Predicción
- Análisis de la varianza: ANOVA one-way. Anova two-way.
- Evaluación del modelo: coeficientes de bondad de ajuste y métricas de error
- Regresión lineal multivariante. Selección de variables e introducción a modelos penalizados.
- Linealización de modelos no lineales. Tratamiento de predictoras cualitativas. Análisis de la covarianza: ANCOVA
- Regresión logística.: logit y probit. Introducción a lo modelos lineales generalizados
Evaluación
A lo largo del curso los alumnos tendrán que realizar entregas de manera individual, tanto teóricas como aplicadas (implementando lo aprendido en R). Se podrá plantear una entrega final grupal.
La nota final tendrá en cuenta tanto la evaluación continua como la prueba final y se calculará como el máximo entre:
a) Calificación de la prueba final.
b) La media ponderada de la evaluación continua y la prueba final, siendo el peso de la evaluación continua de al menos el 35%.
Cualquier alumno podrá presentarse al examen final, siendo la valoración del mismo el 100% de su nota final.
La nota final tendrá en cuenta tanto la evaluación continua como la prueba final y se calculará como el máximo entre:
a) Calificación de la prueba final.
b) La media ponderada de la evaluación continua y la prueba final, siendo el peso de la evaluación continua de al menos el 35%.
Cualquier alumno podrá presentarse al examen final, siendo la valoración del mismo el 100% de su nota final.
Bibliografía
Recursos teóricos:
- Hastie, T., Tibshirani, R., Friedman, J. (2009). «The Elements of Statistical Learning». Springer Series in Statistics. New York: Springer. https://doi.org/10.1007/978-0-387-84858-7.
- James, G., Witten, D. , Hastie, T., Tibshirani, R. (2013). «An Introduction to Statistical Learning». Vol. 103. Springer Texts in Statistics. New York: Springer. https://doi.org/10.1007/978-1-4614-7138-7.
- Kuhn, M., Johnson, K. (2013). «Applied Predictive Modeling». New York: Springer. https://doi.org/10.1007/978-1-4614-6849-3.
- Box, G. E. P., Cox, D. R. (1964). «An Analysis of Transformations». Journal of the Royal Statistical Society, Series B (Methodological) 26 (2): 21152. https://doi.org/10.1111/j.2517-6161.1964.tb00553.x.
- McCullagh, P., Nelder, J. A. (1983). «Generalized Linear Models. Monographs on Statistics and Applied Probability». London: Chapman & Hall. https://doi.org/10.1007/978-1-4899-3244-0.
- Seber, G. A. F., Lee A. J. (2003). «Linear Regression Analysis». Wiley Series in Probability and Statistics. Hoboken: Wiley-Interscience. https://doi.org/10.1002/9780471722199.
- Zhao, P., and Yu B. (2006). «On Model Selection Consistency of Lasso» Journal of Machine Learning Research 7: 254163. https://www.jmlr.org/papers/v7/zhao06a.html.
Recursos prácticos:
- Kuhn, M., Silge, J. «Tidy modeling with R». Disponible gratuitamente en https://www.tmwr.org/
- Wickham, H., Grolemund, G.. «R for Data Science». Disponible gratuitamente en https://r4ds.had.co.nz/index.html
- Álvarez-Liébana, J. (2023). Curso introductorio de manejo y depuración de datos. «Manejo de datos en R». Disponible gratuitamente en https://javieralvarezliebana.es/curso-R-RTVE/#/title-slide
- Álvarez-Liébana, J. (2021). Manual introductorio a R base. «Aprendiendo R sin morir en el intento». Disponible gratuitamente en https://javieralvarezliebana.es/curso-intro-R/
Estructura
Módulos | Materias |
---|---|
No existen datos de módulos o materias para esta asignatura. |
Grupos
Clases Teóricas y/o Prácticas | ||||
---|---|---|---|---|
Grupo | Periodos | Horarios | Aula | Profesor |
Grupo Único | 22/01/2024 - 10/05/2024 | MARTES 11:00 - 13:00 | - | JAVIER ALVAREZ LIEBANA |
Actividades Prácticas | ||||
---|---|---|---|---|
Grupo | Periodos | Horarios | Aula | Profesor |
Grupo Único | 22/01/2024 - 10/05/2024 | JUEVES 09:00 - 11:00 | - | JAVIER ALVAREZ LIEBANA |