Análisis de Data Drift en Series Temporales: Generación de Datos Sintéticos, Aumentación de Datos y Evaluación de Modelos Predictivos
Este proyecto ofrece un entorno completo para el análisis y monitoreo de drift en series temporales, complementado con herramientas de generación de datos sintéticos, técnicas de aumentación y evaluación de modelos predictivos.
- Clona el repositorio
git clone https://github.com/davidraamirez/drift-detection_data-augmentation.git
cd drift-detection_data-augmentation
- Crea un entorno virtual e instala las dependencias:
python -m venv env
source env/bin/activate
pip install -r requirements.txt
- Copia el archivo de entorno de ejemplo y configura tus variables personalizadas:
cp .env.template .env
Edita el archivo .env con tus credenciales o parámetros necesarios, como claves de API, rutas de datos, etc.
- Iniciar la API local Arranca la API principal para que pueda ser utilizada por la aplicación en casos_uso/ u otras herramientas que dependan de ella:
fastapi dev main_api.py --port=8000
Esto levantará la API localmente en: http://127.0.0.1:8000
Este proyecto cuenta con una interfaz web desarrollada en Streamlit, accesible localmente, que permite explorar todas las funcionalidades del sistema de forma visual y ordenada. La interfaz está dividida en distintas secciones, cada una enfocada en un aspecto clave del análisis de series temporales:
📊 Página de Inicio: Reporte Estadístico Muestra un informe descriptivo y visual de las series temporales cargadas, incluyendo estadísticas básicas.
🧪 Ampliación de Características Ofrece herramientas para aplicar técnicas de aumentación y enriquecimiento de variables sobre las series temporales, con el objetivo de mejorar el rendimiento predictivo de los modelos.
➕ Variable Exógena Sección para crear e incorporar una variable exógena adicional, y comparar los resultados de predicción del modelo con y sin dicha variable, evaluando su impacto en la mejora del rendimiento.
streamlit run casos_uso/Report.py
Esto abrirá automáticamente la interfaz en: http://localhost:8501/
aumentacion/ Técnicas de aumentación de datos aplicadas a series temporales.
casos_uso/ Aplicación que prueba la API en los casos de uso de ampliación de características, creación de variables exógenas y detección de drift.
drift/ Modelos y métodos para la detección de drift en los datos.
ejemplos/ Ejemplos de series sintéticas, técnicas de aumentación y el dataset usado en el caso de uso de creación de variable exógena.
modelos_prediccion/ Contiene los modelos de predicción implementados.
series_sinteticas/ Modelos para la generación de series sintéticas.
main_api.py Archivo principal de la API que centraliza el acceso a los modelos de Detección de Data Drift en Series Temporales, Generación de Datos Sintéticos, Aumentación de Datos y Evaluación de Modelos Predictivos.