Unidad Temática 1 – Exploración de Datos y Fuentes de Información¶
En esta primera unidad se trabajaron los fundamentos de análisis exploratorio de datos (EDA) y la preparación de fuentes en distintos formatos.
El objetivo fue aplicar técnicas básicas con Pandas, crear visualizaciones con Matplotlib/Seaborn y documentar hallazgos siguiendo buenas prácticas.
Prácticas realizadas¶
-
Explorando el Iris Dataset: primeros patrones florales y variables predictivas
Análisis exploratorio de un dataset clásico para identificar relaciones y variables con potencial predictivo. -
Configuración del portfolio en GitHub
Estructuración del entorno de trabajo y documentación profesional con MkDocs. -
Explorando el catálogo de Netflix: tendencias globales y patrones de contenido audiovisual
Análisis de datos reales con valores faltantes y categorizaciones aplicadas a un contexto de negocio. -
Analizando los viajes de Nueva York: integración de múltiples fuentes y comparación con Joins
Uso de joins y análisis temporal para estudiar comportamiento urbano en datasets abiertos. -
Explorando el catálogo de moda: análisis de precios y marcas
Comparación de precios, marcas y temporadas en datos de retail utilizando un dataset en formato JSON.
Reflexión de la unidad¶
- Iris permitió afianzar conceptos básicos de EDA y practicar correlaciones y visualizaciones rápidas.
- Configuración del portafolio fue clave para organizar todo el flujo de trabajo en GitHub Pages y asegurar que la documentación sea clara y accesible desde el inicio.
- Netflix enfrentó al desafío de limpiar datos reales con valores faltantes, aplicar filtros y generar visualizaciones que aporten insights concretos.
- Taxis NYC consolidó el uso de joins y métricas temporales, lo que ayudó a comprender la importancia de integrar fuentes distintas para enriquecer un análisis.
- Moda Retail incorporó un análisis aplicado sobre un nuevo formato de datos (JSON), reforzando la capacidad para adaptar procesos de limpieza, exploración y visualización a distintas estructuras y dominios. Además, permitió comparar precios y marcas en distintos contextos estacionales, ampliando la perspectiva analítica hacia escenarios comerciales reales.
En conjunto, la UT1 permitió pasar de un EDA introductorio a la integración de múltiples fuentes, conectando el análisis exploratorio con la organización de proyectos reproducibles.
Este proceso prepara para las siguientes unidades, donde se espera profundizar en técnicas de modelado y análisis avanzado, aplicando lo aprendido sobre limpieza, visualización y documentación como base sólida.
Flujo de trabajo de UT1¶
Este esquema refleja cómo cada práctica aportó a un ciclo completo de trabajo, desde la carga de datos hasta la comunicación de resultados reproducibles.
Conclusión final de UT1¶
La UT1 permitió integrar técnica y reflexión, consolidando un flujo reproducible de análisis de datos con limpieza, visualización y documentación clara. Estas bases preparan para avanzar hacia análisis más complejos con mayor solidez metodológica.
