Tratamiento Estadístico Computacional de la Información (conjunto con UPM)

Máster. Curso 2024/2025.

MINERÍA DE DATOS - 607582

Curso Académico 2024-25

Datos Generales

SINOPSIS

COMPETENCIAS

Generales
CG1 - Aprender a aplicar los conocimientos adquiridos y a explotar su potencial para la resolución de problemas en entornos nuevos o poco conocidos dentro de contextos más amplios (o multidisciplinares) en el tratamiento estadístico-computacional de la información.

CG2 - Elaborar adecuadamente y con originalidad argumentos motivados y proyectos de trabajo, redactar planes, así como formular hipótesis y conjeturas razonables en su área de especialización.

CG3 - Integrar los conocimientos adecuados y enfrentarse a la complejidad de emitir juicios en función de criterios, de normas externas o de reflexiones personales justificadas

CG4 - Comunicar y presentar públicamente ideas, procedimientos o informes de investigación, así como asesorar a personas u organizaciones en el tratamiento estadístico-computacional de la información. La presentación de estas ideas debe transmitir de forma clara y precisa las conclusiones de forma que sean entendidas tanto por el especialista como por el profano en temas estadístico-computacionales.

CG7 - Saber abstraer en un modelo matemático las propiedades y características esenciales de un problema real reconociendo su rango de aplicabilidad y limitaciones.
Transversales
CT1 - Saber aplicar sus conocimientos a su trabajo o vocación de una forma profesional y poseer las competencias que suelen demostrarse por medio de la elaboración y defensa de argumentos y en la resolución de problemas y estudio de casos. Esto implica, más concretamente: Integrar creativamente conocimientos y aplicarlos a la resolución de problemas complejos, perseguir objetivos de calidad en el desarrollo de su actividad profesional, adquirir capacidad para la toma de decisiones y de dirección de recursos humanos, ser capaz de mostrar creatividad, iniciativa y espíritu emprendedor para afrontar los retos de su actividad, valorar la importancia de los métodos estadístico-computacionales en el contexto industrial, económico, administrativo, medio ambiental y social.

CT2 - Tener la capacidad de reunir e interpretar datos relevantes para emitir juicios que incluyan una reflexión sobre temas relevantes de índole científica, tecnológica y empresarial. Demostrar razonamiento crítico y gestionar información científica y técnica de calidad, bibliografía, bases de datos especializadas y recursos accesibles a través de Internet.
Específicas
CE1 - Adquisición de una formación sólida y rigurosa en temas avanzados de Estadística, Matemática computacional, Modelos estocásticos y Metodología de la toma de Decisiones aplicadas al tratamiento de la Información.

CE2 - Capacidad para planificar la resolución de un problema en función de las herramientas de que se disponga y, en su caso, de las restricciones de tiempo y recursos.

CE3 - Capacidad para utilizar aplicaciones informáticas estadísticas, de cálculo numérico y simbólico, visualización gráfica, optimización u otras para resolver problemas con un elevado grado de complejidad.

CE4 - Desarrollar habilidades de aprendizaje en Estadística Computacional y Matemáticas, así como en sus respectivas aplicaciones, que permitan al alumno continuar estudiando y profundizando en la materia de modo autónomo, así como el desarrollo profesional con un alto grado de independencia.

CE5 - Resolver problemas y casos reales planteados en el tratamiento estadístico-computacional de la información generada en los ámbitos de la ciencia, la tecnología y la sociedad mediante habilidades de modelización matemática, estimación y computación.

CE7 - Capacidad de utilización de herramientas de búsqueda de recursos bibliográficos así como manejo, gestión y análisis de grandes bases de datos.

ACTIVIDADES DOCENTES

Clases teóricas
Método expositivo de los contenidos teóricos

Clases prácticas
Estudio de casos

Laboratorios
• Prácticas de ordenador utilizando R y/o python con Jupyter Notebooks.
• Elaboración de memorias.

Presenciales

1,4

No presenciales

1,6

Semestre

1

Requisitos

Conocimientos de Probabilidad y Estadística.
También es conveniente que haya cursado la asignatura de Análisis Multivariante

Objetivos


El alumno adquirirá los conocimientos teóricos necesarios para abordar diferentes problemáticas de negocio a través del tratamiento de datos y el ajuste de modelos de carácter supervisado y no supervisado.

Contenido

1. Métricas de validación.

2. Métodos de remuestreo

3. Métodos avanzados en regresión: target encoding, Regularización (métodos lasso y ridge)

4. Árboles de decisión

5. Ensamblaje de modelos: bagging, random forest, boosting...

6. Clustering


Evaluación

Entrega de trabajos (por grupos): 55%
Examen teórico-práctico: 35%
Asistencia y participación activa: 10%

Para aprobar, hay que obtener una nota mínima de 4/10 en el examen teórico-práctico

Bibliografía

1. Bishop, C.M. (2006), “Pattern Recognition and Machine Learning”, Springer
2. Hair-Anderson-Tatham-Black (1999), “Análisis multivariante”, Prentice Hall
3. Hastie, T., Tibshirani, R., Friedman, J. (2001), “The Elements of Statistical Learning”, Springer
4. James, G., Witten, D., Hastie, T., Tibshirani, R. (2013), “An introduction to Statistical Learning”, Springer
5. Kevin, P.M. (2013) “Machine Learning. A probabilistic Perspective”.

Otra información relevante

Profesor:
Nombre: Pablo Olaso Redondo
Facultad de Matemáticas
Despacho: 504
Teléfono: 91 394 4656
Correo electrónico: polaso@ucm.es

Estructura

MódulosMaterias
No existen datos de módulos o materias para esta asignatura.

Grupos

Clases teóricas y/o prácticas
GrupoPeriodosHorariosAulaProfesor
Grupo único09/12/2024 - 19/02/2025LUNES 18:00 - 19:30-PABLO OLASO REDONDO
MIÉRCOLES 18:00 - 19:30-PABLO OLASO REDONDO