Saltar a contenido

Inicio

Bienvenido a mi portafolio académico del curso de Ingeniería de Datos.
Aquí recopilo mis avances, reflexiones y prácticas, organizadas por Unidades Temáticas.

🎯 Objetivo del curso

Dominar las técnicas de preparación y limpieza de datos, explorar formas de representación y aplicar estrategias adecuadas para proyectos de Inteligencia Artificial.


📘 Contenido

Unidad Temática 1

EDA inicial, limpieza y visualización básica
Esta unidad aborda los fundamentos del análisis exploratorio de datos, partiendo desde datasets simples hasta la integración de fuentes más complejas y la comunicación de resultados visuales.

🔗Ver Unidad 1

Unidad Temática 2

Calidad & Ética en el ciclo de datos
En esta unidad se trabajaron técnicas de imputación de datos faltantes, normalización y detección de sesgos en modelos predictivos.
Se incorporaron buenas prácticas de validación cruzada y documentación ética para asegurar procesos justos y reproducibles en proyectos de Machine Learning.

🔗Ver Unidad 2

Unidad Temática 3

Feature Engineering
En esta unidad se trabajaron técnicas de feature engineering aplicadas al machine learning, abarcando transformaciones numéricas, encoding categórico avanzado, reducción dimensional mediante PCA y selección de características.
También se introdujo la ingeniería temporal de features, aplicando lags, rolling windows y agregaciones sin incurrir en data leakage.

🔗 Ver Unidad 3

Unidad Temática 4

Datos Especiales
En esta unidad se trabajó con datos no tradicionales, incorporando técnicas de procesamiento geoespacial, imágenes y audio.
Se utilizaron herramientas como GeoPandas, Shapely, OpenCV y librosa para construir pipelines capaces de manipular datos complejos y prepararlos para sistemas de analítica avanzada.

🔗 Ver Unidad 4

Unidad Temática 5

Pipelines ETL
En esta unidad se diseñaron arquitecturas ETL/ELT escalables utilizando servicios de Google Cloud.
Se aplicaron principios de DataOps, orquestación de flujos y procesamiento basado en eventos para construir pipelines reproducibles y automatizados.

🔗 Ver Unidad 5


Para un resumen de objetivos y hallazgos clave, consultá el Índice del Portafolio.