Saltar a contenido

Unidad Temática 1 – Exploración de Datos y Fuentes de Información

En esta primera unidad se trabajaron los fundamentos de análisis exploratorio de datos (EDA) y la preparación de fuentes en distintos formatos.
El objetivo fue aplicar técnicas básicas con Pandas, crear visualizaciones con Matplotlib/Seaborn y documentar hallazgos siguiendo buenas prácticas.

Prácticas realizadas

Reflexión de la unidad

  • Iris permitió afianzar conceptos básicos de EDA y practicar correlaciones y visualizaciones rápidas.
  • Configuración del portafolio fue clave para organizar todo el flujo de trabajo en GitHub Pages y asegurar que la documentación sea clara y accesible desde el inicio.
  • Netflix enfrentó al desafío de limpiar datos reales con valores faltantes, aplicar filtros y generar visualizaciones que aporten insights concretos.
  • Taxis NYC consolidó el uso de joins y métricas temporales, lo que ayudó a comprender la importancia de integrar fuentes distintas para enriquecer un análisis.
  • Moda Retail incorporó un análisis aplicado sobre un nuevo formato de datos (JSON), reforzando la capacidad para adaptar procesos de limpieza, exploración y visualización a distintas estructuras y dominios. Además, permitió comparar precios y marcas en distintos contextos estacionales, ampliando la perspectiva analítica hacia escenarios comerciales reales.

En conjunto, la UT1 permitió pasar de un EDA introductorio a la integración de múltiples fuentes, conectando el análisis exploratorio con la organización de proyectos reproducibles.
Este proceso prepara para las siguientes unidades, donde se espera profundizar en técnicas de modelado y análisis avanzado, aplicando lo aprendido sobre limpieza, visualización y documentación como base sólida.

Flujo de trabajo de UT1

Este esquema refleja cómo cada práctica aportó a un ciclo completo de trabajo, desde la carga de datos hasta la comunicación de resultados reproducibles.

Conclusión final de UT1

La UT1 permitió integrar técnica y reflexión, consolidando un flujo reproducible de análisis de datos con limpieza, visualización y documentación clara. Estas bases preparan para avanzar hacia análisis más complejos con mayor solidez metodológica.


📓 Índice del portafolio