Ingeniería Matemática

Máster. Curso 2023/2024.

ESTADÍSTICA APLICADA Y MINERÍA DE DATOS - 604330

Curso Académico 2023-24

Datos Generales

SINOPSIS

COMPETENCIAS

Generales

CG1 - Aprender a aplicar los conocimientos adquiridos y a explotar su potencial para la resolución de problemas en entornos nuevos o poco conocidos dentro de contextos más amplios (o multidisciplinares) en el tratamiento estadístico-computacional de la información.

CG2 - Elaborar adecuadamente y con originalidad argumentos motivados y proyectos de trabajo, redactar planes, así como formular hipótesis y conjeturas razonables en su área de especialización.

CG3 - Integrar los conocimientos adecuados y enfrentarse a la complejidad de emitir juicios en función de criterios, de normas externas o de reflexiones personales justificadas

CG4 - Comunicar y presentar públicamente ideas, procedimientos o informes de investigación, así como asesorar a personas u organizaciones en el tratamiento estadístico-computacional de la información. La presentación de estas ideas debe transmitir de forma clara y precisa las conclusiones de forma que sean entendidas tanto por el especialista como por el profano en temas estadístico-computacionales.

CG7 - Saber abstraer en un modelo matemático las propiedades y características esenciales de un problema real reconociendo su rango de aplicabilidad y limitaciones.

Transversales

CT1 - Saber aplicar sus conocimientos a su trabajo o vocación de una forma profesional y poseer las competencias que suelen demostrarse por medio de la elaboración y defensa de argumentos y en la resolución de problemas y estudio de casos. Esto implica, más concretamente: Integrar creativamente conocimientos y aplicarlos a la resolución de problemas complejos, perseguir objetivos de calidad en el desarrollo de su actividad profesional, adquirir capacidad para la toma de decisiones y de dirección de recursos humanos, ser capaz de mostrar creatividad, iniciativa y espíritu emprendedor para afrontar los retos de su actividad, valorar la importancia de los métodos estadístico-computacionales en el contexto industrial, económico, administrativo, medio ambiental y social.

CT2 - Tener la capacidad de reunir e interpretar datos relevantes para emitir juicios que incluyan una reflexión sobre temas relevantes de índole científica, tecnológica y empresarial. Demostrar razonamiento crítico y gestionar información científica y técnica de calidad, bibliografía, bases de datos especializadas y recursos accesibles a través de Internet.
Específicas

CE1 - Adquisición de una formación sólida y rigurosa en temas avanzados de Estadística, Matemática computacional, Modelos estocásticos y Metodología de la toma de Decisiones aplicadas al tratamiento de la Información.

CE2 - Capacidad para planificar la resolución de un problema en función de las herramientas de que se disponga y, en su caso, de las restricciones de tiempo y
recursos.

CE3 - Capacidad para utilizar aplicaciones informáticas estadísticas, de cálculo numérico y simbólico, visualización gráfica, optimización u otras para resolver problemas con un elevado grado de complejidad.

CE4 - Desarrollar habilidades de aprendizaje en Estadística Computacional y Matemáticas, así como en sus respectivas aplicaciones, que permitan al alumno continuar estudiando y profundizando en la materia de modo autónomo, así como el desarrollo profesional con un alto grado de independencia.

CE5 - Resolver problemas y casos reales planteados en el tratamiento estadístico-computacional de la información generada en los ámbitos de la ciencia, la tecnología y la sociedad mediante habilidades de modelización matemática, estimación y computación.

CE7 - Capacidad de utilización de herramientas de búsqueda de recursos bibliográficos, así como manejo, gestión y análisis de grandes bases de datos.

ACTIVIDADES DOCENTES

Clases teóricas

Método expositivo de los contenidos teóricos.


Clases prácticas

Estudio de casos
Prácticas de ordenador utilizando SAS, R o Python, donde se pretende que los estudiantes aprendan a aplicar e interpretar las diferentes técnicas estudiadas.

Presenciales

3,6

No presenciales

5,4

Semestre

1

Breve descriptor:


Modelización analítica supervisada y no supervisada


Requisitos


Conocimientos de Probabilidad y Estadística.

Objetivos

Se trata de que el alumno adquiera los conocimientos suficientes para la aplicación adecuada de un conjunto de herramientas estadísticas para el análisis de datos además de adquirir los conocimientos teóricos que las sustentan. Los objetivos de estas técnicas son entre otros: 

(1) modelización de series temporales

(2) resumir los conjuntos de datos con múltiples variables mediante un conjunto reducido de nuevas variables, con la mínima perdida de información 

(3) analizar las relaciones entre variables o entre individuos de un conjunto de datos, para formar grupos de clasificación con características similares 

(4) explicar posibles interrelaciones entre diferentes variables de interés asociadas al experimento en estudio

(5) ajustar modelos para la clasificación/predicción de nuevas observaciones 

 Asimismo, se pretende que los estudiantes aprendan a aplicar e interpretar estas técnicas con varios lenguajes de programación: SAS/ R / PYTHON

Contenido


TEMA 1. Programación en SAS

TEMA 2. Modelización de series temporales

TEMA 3. Metodología de modelización analítica: análisis descriptivo, técnicas de muestreo, procesamiento de datos (imputación de missings y tratamiento de outliers), métricas de validación de resultados

TEMA 4. Modelización no supervisada: Análisis de Componentes Principales, Análisis de Correspondencias, Análisis de Conglomerados (Clustering)

TEMA 5. Modelización supervisada: Análisis Discriminante, Métodos Avanzados de Regresión, Árboles de Decisión, Redes Neuronales, Ensamblaje de Modelos: (bagging, random forest, boosting, stacking)

Evaluación


La nota se establecerá en función de los siguientes criterios:

- Asistencia: 10%
- El contenido referente al tema 2 se cubrirá con la realización de una práctica que constituiría el 30% de la calificación global de la asignatura.
- El contenido comprendido del tema 4 se cubrirá con la realización de una práctica que constituiría el 30% de la calificación global de la asignatura.
- El contenido comprendido del tema 5 se cubrirá con la realización de una práctica que constituiría el 30% de la calificación global de la asignatura.

En caso de que alguna de las tres partes no resultase aprobada, dicha parte debería ser aprobada en la convocatoria extraordinaria, por lo que el alumno podría tener que realizar uno, dos o tres nuevas prácticas.

Bibliografía


1. Aznar, A., Trívez, F.J., Métodos de predicción en economía II, Análisis de Series Temporales. Ariel Economía 1993
2. Bishop, C.M., Pattern Recognition and Machine Learning. Springer 2006
3. Breiman, L., Friedman, J.H., Olshen, R.A. & Stone, C.J. (1984): Classification and Regression Trees. Wadsworth.
4. Cuadras, C.M. Nuevos Métodos de Análisis Multivariante. Ed. CMC Editions Barcelona 2007
5. Data Science for Business: What You Need to Know about Data Mining and Data-Analytic Thinking. Provost y Fawcett. Publisher: O'Reilly Media (2013).
6. Hair-Anderson-Tatham-Black, Análisis multivariante. Prentice Hall 1999
7. Hastie, T., Tibshirani, R., Friedman, J., The Elements of Statistical Learning. Springer 2001
8. James, G., Witten, D., Hastie, T., Tibshirani, R., An introduction to Statistical Learning. Springer 2013
9. Johnson A.Richard, Wichern D.W. Applied Multivariate Statistical Analysis. Pearson International Ed 2007
10. Lebart, L.; Morineau, A.; Warwick, K.M. Multivariate Descriptive Statistical Analysis. New York John Wiley & sons 1984
11. Mardia, K.V.; Kent J.T.; Bibby, J.M. Multivariate Analysis. Academic Press 1979
12. Morrison, D. Multivariate Statistical Methods. Mac Graw Hill 1990
13. Peña D., Análisis de Datos Multivariante. Mac Graw Hill 2002
14. Peña, D., Análisis de Series Temporales, Alianza Editorial 2010
15. Schutt, R.; O'Neil, C. (2013). Doing data science: Straight talk from the frontline. O'Reilly Media, Inc.

Otra información relevante


Profesorado:
Nombre – Despacho – Teléfono - Email
Carlos Rivero, Despacho 4, Edificio Central, Fac. Económicas, 913942304, crivero@ucm.es
Jorge Marco Blanco, Despacho 303-J, Facultad de Matemáticas, 91 3945017, jorgmarc@ucm.es
Daniel Vélez Serrano, Despacho 303I, Facultad de Matemáticas, 91 3944656 danvelez@ucm.es

Estructura

MódulosMaterias
No existen datos de módulos o materias para esta asignatura.

Grupos

Clases teóricas y/o prácticas
GrupoPeriodosHorariosAulaProfesor
Grupo único02/10/2023 - 06/10/2023LUNES 16:30 - 18:30-CARLOS RIVERO RODRIGUEZ
DANIEL VELEZ SERRANO
JORGE MARCO BLANCO
LUNES 19:00 - 21:00-CARLOS RIVERO RODRIGUEZ
DANIEL VELEZ SERRANO
JORGE MARCO BLANCO
MARTES 16:30 - 18:30-CARLOS RIVERO RODRIGUEZ
DANIEL VELEZ SERRANO
JORGE MARCO BLANCO
MARTES 19:00 - 21:00-CARLOS RIVERO RODRIGUEZ
DANIEL VELEZ SERRANO
JORGE MARCO BLANCO
MIÉRCOLES 16:30 - 18:30-CARLOS RIVERO RODRIGUEZ
DANIEL VELEZ SERRANO
JORGE MARCO BLANCO
MIÉRCOLES 19:00 - 21:00-CARLOS RIVERO RODRIGUEZ
DANIEL VELEZ SERRANO
JORGE MARCO BLANCO
JUEVES 16:30 - 18:30-CARLOS RIVERO RODRIGUEZ
DANIEL VELEZ SERRANO
JORGE MARCO BLANCO
JUEVES 19:00 - 21:00-CARLOS RIVERO RODRIGUEZ
DANIEL VELEZ SERRANO
JORGE MARCO BLANCO
10/10/2023 - 21/12/2023MARTES 16:30 - 18:30-CARLOS RIVERO RODRIGUEZ
DANIEL VELEZ SERRANO
JORGE MARCO BLANCO
JUEVES 16:30 - 18:30-CARLOS RIVERO RODRIGUEZ
DANIEL VELEZ SERRANO
JORGE MARCO BLANCO
09/01/2024 - 26/01/2024MARTES 16:30 - 18:30-CARLOS RIVERO RODRIGUEZ
DANIEL VELEZ SERRANO
JORGE MARCO BLANCO
JUEVES 16:30 - 18:30-CARLOS RIVERO RODRIGUEZ
DANIEL VELEZ SERRANO
JORGE MARCO BLANCO
VIERNES 16:30 - 18:30-CARLOS RIVERO RODRIGUEZ
DANIEL VELEZ SERRANO
JORGE MARCO BLANCO