Ciencia de Datos e Inteligencia de Negocios
Máster. Curso 2024/2025.
PREPARACIÓN DE DATOS Y MODELOS PREDICTIVOS - 610505
Curso Académico 2024-25
Datos Generales
- Plan de estudios: 069D - MÁSTER UNIVERSITARIO EN CIENCIA DE DATOS E INTELIGENCIA DE NEGOCIOS (2024-25)
- Carácter: OBLIGATORIA
- ECTS: 6.0
SINOPSIS
COMPETENCIAS
Generales
RA13, RA15, RA16, RA17, RA19, RA20, RA21
RA23, RA25, RA26, RA27
ACTIVIDADES DOCENTES
Clases teóricas
Clases prácticas
Presenciales
No presenciales
Semestre
Breve descriptor:
Esta asignatura se contempla como una introducción al análisis de datos integrado utilizando software estadístico (Miner SAS y R). Se describen técnicas estadísticas habituales con el objetivo de que se conozca el entorno informático.
Se hace especial hincapié en la presentación y resolución de problemas prácticos a los que se les va aplicando diferentes técnicas, entendiéndolas como un procedimiento sistemático de trabajo. El método de trabajo consistirá en utilizar dos grandes bases de datos y trabajar con ellas de forma integrada.
Las técnicas a las que se dará prioridad en esta asignatura son los métodos de exploración y depuración de datos, la creación de modelos predictivos como la regresión lineal, la regresión logística y los árboles de regresión y clasificación.
Objetivos
Obtener las habilidades básicas-medias de lenguajes de programación orientados al manejo y análisis de datos.
Saber cargar, manipular y depurar conjuntos de datos de manera eficiente y óptima.
Comprender, aplicar y desarrollo de modelos predictivos, tales como regresión lineal, regresión logística y árboles.
Contenido
Metodologías de Minería de Datos y Machine Learning.
Técnicas de exploración, visualización y depuración de datos.
Introducción a los modelos predictivos.
Regresión lineal
Regresión logística.
Árboles de clasificación y regresión.
Evaluación
Para aquello alumnos que renuncien a la evaluación continua o que no alcancen los objetivos mínimos se les evaluará a través de un examen que constituirá el 100% de la nota.
Cualquier alumno tendrá derecho a una prueba final pudiendo resultar su calificación la nota final del curso
Bibliografía
- Kuhn, Max y Johnson, Kjell (2016). Applied Predictive Modelling. Springer. - Gareth, James et. al (2015). An introduction to statistical learning : with applications in R. Springer.
Brett Lantz (2019).Machine learning with R
- Swirl stats: aprendizaje básico de R dentro del propio R. Disponible gratuitamente en https://swirlstats.com/ - Wright, C., Ellis, S.E., Hicks, S. C., Peng, R. D. (2021). «Tidyverse skills for data science». Disponible gratuitamente en https: //jhudatascience.org/tidyversecourse/
- Matloff, N (2011). The Art of R Programming. A tour of statistical software design. Disponible como recurso electrónico en la biblioteca de la UCM. - Crawley, M.J. The R book. Disponible como recurso electrónico en la biblioteca de la UCM
- Santin González, Daniel y Pérez, López, César (2007). Minería de datos, técnicas y herramientas. Tomson.
- Cerrito B. Patricia (2006). Introduction to Data Mining Using SAS Enterprise Miner. SAS Institute.
Estructura
Módulos | Materias |
---|---|
No existen datos de módulos o materias para esta asignatura. |
Grupos
Clases teóricas y/o prácticas | ||||
---|---|---|---|---|
Grupo | Periodos | Horarios | Aula | Profesor |
Grupo A | 09/09/2024 - 10/01/2025 | VIERNES 18:00 - 19:30 | - | JUAN ANTONIO GUEVARA GIL |
Grupo B | 09/09/2024 - 10/01/2025 | MIÉRCOLES 18:00 - 19:30 | - | DANIEL MARTIN GARCIA |
Actividades Prácticas | ||||
---|---|---|---|---|
Grupo | Periodos | Horarios | Aula | Profesor |
Grupo A | 09/09/2024 - 10/01/2025 | VIERNES 19:30 - 21:00 | - | JUAN ANTONIO GUEVARA GIL |
Grupo B | 09/09/2024 - 10/01/2025 | MIÉRCOLES 19:30 - 21:00 | - | DANIEL MARTIN GARCIA |