Ciencia de los Datos Aplicada

Grado y Doble Grado. Curso 2023/2024.

SOFTWARE ESTADÍSTICO II - 806308

Curso Académico 2023-24

Datos Generales

SINOPSIS

COMPETENCIAS

Generales
CG1 - Comunicar y transmitir la información a un público tanto especializado como no especializado.
CG2 - Adquirir la habilidad para expresarse claramente y de presentar los resultados de sus análisis, oralmente o por escrito, mediante un informe de carácter profesional.
CG3 - Coordinar trabajo en equipo con grupos multidisciplinares y organizar y gestionar proyectos.
CG5 - Desarrollar la capacidad de trabajar de forma autónoma.
CG6 - Realizar lecturas críticas de informes y publicaciones científicas.
CG8 - Demostrar un pensamiento lógico y un razonamiento estructurado.
CG9 - Sintetizar las ideas principales de un texto o discurso.
Específicas
CE7 - Utilizar las herramientas de software necesarias para almacenar, procesar y visualizar datos de cualquier volumen sobre distintos ámbitos, tales como datos textuales, datos espaciales, relaciones espacio temporales, etc.
CE10 - Diseñar, programar e implantar aplicaciones de análisis y Ciencia de los Datos.
CE11 - Identificar y aplicar las técnicas adecuadas de programación y utilizarlas en el diseño de soluciones eficientes para problemas en distintos ámbitos, como el biosanitario, la geolocalización, la minería de texto, el procesamiento de imágenes, etc.

ACTIVIDADES DOCENTES

Presenciales

2,4

No presenciales

3,6

Semestre

3

Breve descriptor:

Introducción al análisis de datos con R. Manejo del entorno de tidyverse. Manejo de paquetes actuales. Visualización de datos

Contenido

  1. Introducción a R y RStudio. Organización del trabajo. Manejo de errores
  2. Introducción a R base. Tipos de variables y concatenación (vectores). Operaciones con vectores. Tipos de datos especiales: fechas y cadenas de textos. Uso de primeros paquetes.
  3. Presentación de resultados: introducción a Quarto y rmarkdown. Elaborar apuntes y diapositivas
  4. Primeras estructuras de datos: matrices. Inconvenientes y limitaciones. Primeros datasets: data.frame y tibble. Ventajas respecto a data.frame: rapidez, legibilidad, recursividad y memoria.
  5. Introducción a tidyverse. Tidydata. Pivotar tablas. Importar/exportar datasets. Cruce de tablas
  6. Manejo de tidyverse. Operaciones por filas y columnas
  7. Estructuras de control, bucles y funciones propias. Variables locales vs globales
  8. Manejo de listas y cualitativas. Paquetes purrr y forcats.
  9. Introducción a ggplot. Visualización de datos. Animación de gráficas y mapas.
  10. Uso de control de versiones. Github y gitkraken. 


Evaluación

A lo largo del curso se plantearán una serie de entregas individuales aplicando los conocimientos aprendidos a datasets reales.
Se realizará también una entrega final grupal (máximo 4 personas) en la que tendrán que exponer el análisis realizado con un caso real.

La nota final tendrá en cuenta tanto la evaluación continua como la prueba final y se calculará como el máximo entre:

a) Calificación de la prueba final.
b) La media ponderada de la evaluación continua y la prueba final, siendo el peso de la evaluación continua de al menos el 35% (pudiendo ser el 100%)

Cualquier alumno podrá presentarse al examen final, siendo la valoración del mismo el 100% de su nota final.

Bibliografía

- Wickham, H., Grolemund, G.. «R for Data Science». Disponible gratuitamente en https://r4ds.had.co.nz/index.html
- Álvarez-Liébana, J. (2023). Curso introductorio de manejo y depuración de datos. «Manejo de datos en R». Disponible gratuitamente en https://javieralvarezliebana.es/curso-R-RTVE/#/title-slide
- Álvarez-Liébana, J. (2022). Curso introductorio a la visualización de datos. «Analizando datos, visualizando información, contando historias». Disponible gratuitamente en https://javieralvarezliebana.es/curso-slides-dataviz-ECI-2022/#1
- Álvarez-Liébana, J. (2021). Manual introductorio a R base. «Aprendiendo R sin morir en el intento». Disponible gratuitamente en https://javieralvarezliebana.es/curso-intro-R/
- Wright, C., Ellis, S.E., Hicks, S. C., Peng, R. D. (2021). «Tidyverse skills for data science». Disponible gratuitamente en https://jhudatascience.org/tidyversecourse/
- Matloff, N (2011). The Art of R Programming. A tour of statistical software design. Disponible como recurso electrónico en la biblioteca de la UCM.
- Crawley, M.J. The R book. Disponible como recurso electrónico en la biblioteca de la UCM

Estructura

MódulosMaterias
No existen datos de módulos o materias para esta asignatura.

Grupos

Clases Teóricas y/o Prácticas
GrupoPeriodosHorariosAulaProfesor
Grupo Único11/09/2023 - 21/12/2023VIERNES 11:00 - 13:00-JAVIER ALVAREZ LIEBANA


Actividades Prácticas
GrupoPeriodosHorariosAulaProfesor
Grupo Único11/09/2023 - 21/12/2023MARTES 13:00 - 15:00-JAVIER ALVAREZ LIEBANA