Bioestadística
Máster. Curso 2023/2024.
SOFTWARE PARA GESTIÓN DE BASES DE DATOS - 608530
Curso Académico 2023-24
Datos Generales
- Plan de estudios: 064V - MÁSTER UNIVERSITARIO EN BIOESTADÍSTICA (2016-17)
- Carácter: OBLIGATORIA
- ECTS: 6.0
SINOPSIS
COMPETENCIAS
Generales
CG3,CG5
Específicas
CE6, CE7
ACTIVIDADES DOCENTES
Clases teóricas
30%
Clases prácticas
70%
TOTAL
100%
Presenciales
1,8
No presenciales
4,2
Semestre
1
Breve descriptor:
Los estudiantes aprenderán a modelizar, construir y diseñar bases de datos multidimensionales de tal manera que se agilicen sus consultas y puedan ser explotadas posteriormente según el objetivo del estudio. También comprenderán la necesidad de estas técnicas, sus objetivos y sus aplicaciones en función del tipo de información disponible en cada caso.
Requisitos
No hay requisitos previos.
Contenido
- Introducción a R y RStudio. Organización del trabajo. Introducción a R base. Tipos de variables y concatenación (vectores). Operaciones con vectores. Tipos de datos especiales: fechas y cadenas de textos.
- Presentación de resultados: introducción a Quarto y rmarkdown. Elaborar apuntes y diapositivas.
- Primeras estructuras de datos: matrices. Inconvenientes y limitaciones. Primeros datasets: data.frame y tibble.
- Introducción a tidyverse. Tidydata. Pivotar tablas. Importar/exportar datasets.
- Manejo de tidyverse. Operaciones por filas y columnas. Cruce de tablas. Depuración de datos: detección de ausentes y outliers e imputación. Recategorización de variables.
- Estructuras de control, bucles y funciones propias. Variables locales vs globales. Manejo de listas y variables cualitativas. Paquetes purrr y forcats.
- Introducción a módulos de acceso a SQL desde R.
- Introducción a ggplot. Visualización de datos.
- Control de versiones: uso de Github.
- Introducción a Stata
Evaluación
A lo largo del curso se plantearán una serie de entregas individuales aplicando los conocimientos aprendidos a datasets reales. Se realizará también una entrega final grupal (máximo 4 personas) en la que tendrán que exponer el análisis realizado con un caso real.
La nota final en cualquier caso tendrá en cuenta tanto la evaluación continua como la prueba final y se calculará como el máximo entre:
a) Calificación de la prueba final.
b) La media ponderada de la evaluación continua y la prueba final, siendo el peso de la evaluación continua de al menos el 35% (pudiendo ser el 100%)
Cualquier alumno podrá presentarse al examen final, siendo la valoración del mismo el 100% de su nota final.
La nota final en cualquier caso tendrá en cuenta tanto la evaluación continua como la prueba final y se calculará como el máximo entre:
a) Calificación de la prueba final.
b) La media ponderada de la evaluación continua y la prueba final, siendo el peso de la evaluación continua de al menos el 35% (pudiendo ser el 100%)
Cualquier alumno podrá presentarse al examen final, siendo la valoración del mismo el 100% de su nota final.
Bibliografía
- Wickham, H., Grolemund, G.. «R for Data Science». Disponible gratuitamente en https://r4ds.had.co.nz/index.html
- Álvarez-Liébana, J. (2023). Curso introductorio de manejo y depuración de datos. «Manejo de datos en R». Disponible gratuitamente en https://javieralvarezliebana.es/curso-R-RTVE/#/title-slide
- Álvarez-Liébana, J. (2022). Curso introductorio a la visualización de datos. «Analizando datos, visualizando información, contando historias». Disponible gratuitamente en https://javieralvarezliebana.es/curso-slides-dataviz-ECI-2022/#1
- Álvarez-Liébana, J. (2021). Manual introductorio a R base. «Aprendiendo R sin morir en el intento». Disponible gratuitamente en https://javieralvarezliebana.es/curso-intro-R/
- Wright, C., Ellis, S.E., Hicks, S. C., Peng, R. D. (2021). «Tidyverse skills for data science». Disponible gratuitamente en https://jhudatascience.org/tidyversecourse/
- Matloff, N (2011). The Art of R Programming. A tour of statistical software design. Disponible como recurso electrónico en la biblioteca de la UCM.
- Crawley, M.J. The R book. Disponible como recurso electrónico en la biblioteca de la UCM
- Álvarez-Liébana, J. (2023). Curso introductorio de manejo y depuración de datos. «Manejo de datos en R». Disponible gratuitamente en https://javieralvarezliebana.es/curso-R-RTVE/#/title-slide
- Álvarez-Liébana, J. (2022). Curso introductorio a la visualización de datos. «Analizando datos, visualizando información, contando historias». Disponible gratuitamente en https://javieralvarezliebana.es/curso-slides-dataviz-ECI-2022/#1
- Álvarez-Liébana, J. (2021). Manual introductorio a R base. «Aprendiendo R sin morir en el intento». Disponible gratuitamente en https://javieralvarezliebana.es/curso-intro-R/
- Wright, C., Ellis, S.E., Hicks, S. C., Peng, R. D. (2021). «Tidyverse skills for data science». Disponible gratuitamente en https://jhudatascience.org/tidyversecourse/
- Matloff, N (2011). The Art of R Programming. A tour of statistical software design. Disponible como recurso electrónico en la biblioteca de la UCM.
- Crawley, M.J. The R book. Disponible como recurso electrónico en la biblioteca de la UCM
Otra información relevante
La presencialidad de las asignaturas de Máster es del 30%, lo que significa que la carga de trabajo de un alumno, para cada asignatura de 6 créditos ECTS, se divide en 45 horas lectivas presenciales y en 105 de trabajo personal adicional.
Estructura
Módulos | Materias |
---|---|
No existen datos de módulos o materias para esta asignatura. |
Grupos
Clases teóricas y/o prácticas | ||||
---|---|---|---|---|
Grupo | Periodos | Horarios | Aula | Profesor |
Grupo A | 06/09/2023 - 10/10/2023 | LUNES 16:00 - 18:00 | - | JAVIER ALVAREZ LIEBANA |
MIÉRCOLES 16:00 - 18:00 | - | JAVIER ALVAREZ LIEBANA |
Actividades prácticas | ||||
---|---|---|---|---|
Grupo | Periodos | Horarios | Aula | Profesor |
Grupo A | 11/10/2023 - 28/10/2023 | LUNES 16:00 - 18:00 | - | JAVIER ALVAREZ LIEBANA |
MIÉRCOLES 16:00 - 18:00 | - | JAVIER ALVAREZ LIEBANA | ||
29/10/2023 - 21/12/2023 | LUNES 16:00 - 18:00 | - | JAVIER ALVAREZ LIEBANA |