Inicio
Bienvenido a mi portafolio académico del curso de Ingeniería de Datos.
Aquí recopilo mis avances, reflexiones y prácticas, organizadas por Unidades Temáticas.
🎯 Objetivo del curso¶
Dominar las técnicas de preparación y limpieza de datos, explorar formas de representación y aplicar estrategias adecuadas para proyectos de Inteligencia Artificial.
📘 Contenido¶
Unidad Temática 1¶
EDA inicial, limpieza y visualización básica
Esta unidad aborda los fundamentos del análisis exploratorio de datos, partiendo desde datasets simples hasta la integración de fuentes más complejas y la comunicación de resultados visuales.
Unidad Temática 2¶
Calidad & Ética en el ciclo de datos
En esta unidad se trabajaron técnicas de imputación de datos faltantes, normalización y detección de sesgos en modelos predictivos.
Se incorporaron buenas prácticas de validación cruzada y documentación ética para asegurar procesos justos y reproducibles en proyectos de Machine Learning.
Unidad Temática 3¶
Feature Engineering
En esta unidad se trabajaron técnicas de feature engineering aplicadas al machine learning, abarcando transformaciones numéricas, encoding categórico avanzado, reducción dimensional mediante PCA y selección de características.
También se introdujo la ingeniería temporal de features, aplicando lags, rolling windows y agregaciones sin incurrir en data leakage.
Unidad Temática 4¶
Datos Especiales
En esta unidad se trabajó con datos no tradicionales, incorporando técnicas de procesamiento geoespacial, imágenes y audio.
Se utilizaron herramientas como GeoPandas, Shapely, OpenCV y librosa para construir pipelines capaces de manipular datos complejos y prepararlos para sistemas de analítica avanzada.
Unidad Temática 5¶
Pipelines ETL
En esta unidad se diseñaron arquitecturas ETL/ELT escalables utilizando servicios de Google Cloud.
Se aplicaron principios de DataOps, orquestación de flujos y procesamiento basado en eventos para construir pipelines reproducibles y automatizados.
Para un resumen de objetivos y hallazgos clave, consultá el Índice del Portafolio.