Procesamiento de datos: limpieza y transformación, análisis exploratorio, visualización.

Esta materia tiene como objetivo que los/las estudiantes aprendan técnicas de limpieza de datos y transformación que les permitan definir el modelo de datos que mejor se adapte a sus fines de análisis. A lo largo del curso se verán funciones condicionales, expresiones regulares, librerías para el manejo de datos de texto y fecha, automatización del armado de bases de datos, tratamiento de missings, métodos de imputación, análisis de componentes principales, normalización y estandarización de variables.

Esta materia tiene como objetivo el dominio de los conceptos de visualización para lograr una presentación atractiva y eficiente de los datos. Al finalizar los/las estudiantes podrán definir la visualización que mejor se adapte a cada proyecto de análisis de datos particular, desarrollar presentaciones de proyectos de ciencias de datos atractivas y autocontenidas.


Esta materia tiene como objetivo introducir a los/las estudiantes a las principales herramientas de presentación de hallazgos y resultados obtenidos de la etapa de visualización. El curso comprenderá la construcción de aplicaciones web con shiny que permiten la interacción con visualizaciones y datos, así como el armado de reportes con R Markdown y la integración de ambas.

Esta materia tiene como objetivo introducir a los/las estudiantes a las principales técnicas de análisis exploratorio de datos a partir de las cuales obtener importantes insights y detectar patrones. La primera parte del curso estará orientada a las estadísticas descriptivas, filtrado y armado de bases auxiliares. La segunda al manejo de variables: creación, modificación y eliminación. La tercera parte a gráficos exploratorios, correlación de variables y detección de missings (diferencia entre NAN y NA).