Saltar a contenido

Unidad Temática 2 – Limpieza, Imputación y Ética de Datos

En esta segunda unidad se trabajó sobre la calidad y responsabilidad en el manejo de datos, aplicando técnicas de imputación contextual, escalado reproducible y evaluación ética de sesgos.
El objetivo fue asegurar la integridad, trazabilidad y equidad en el preprocesamiento antes del modelado.

Prácticas realizadas

Reflexión de la unidad

  • Ames Housing permitió practicar estrategias de imputación contextual aplicadas a datos reales y heterogéneos.
  • Anti-Leakage Pipeline consolidó el diseño de flujos de preprocesamiento éticos y técnicamente robustos.
  • Fairlearn introdujo el componente social y ético del análisis de datos, vinculando rendimiento con equidad.
  • German Credit reforzó la importancia de la calidad del dato como condición previa para la equidad: pequeñas distorsiones en atributos sensibles pueden amplificar desigualdades y conducir a decisiones injustas, incluso cuando el modelo técnico parece correcto.

En conjunto, la UT2 marcó el paso del análisis exploratorio hacia el procesamiento responsable de datos, donde cada decisión técnica considera su impacto en la transparencia, la reproducibilidad y la justicia algorítmica.

Flujo de Trabajo de UT2

Este flujo resume el proceso central de la UT2: diagnóstico de la calidad de los datos, imputación contextual, preprocesamiento sin fuga de información y evaluación ética mediante métricas de fairness.

Conclusión final de UT2

La Unidad Temática 2 permitió integrar técnica y reflexión, comprendiendo que la limpieza y el preprocesamiento de datos no son solo pasos previos, sino etapas críticas para la calidad y la equidad de los modelos.
Estas prácticas consolidaron la base ética y metodológica necesaria para avanzar hacia la modelización predictiva y la evaluación de desempeño que se desarrollarán en la UT3.


📓 Índice del portafolio