Skip to content

Realizar un análisis completo de un conjunto de datos de asteroides para identificar posibles riesgos de impacto con la Tierra, utilizando técnicas de análisis exploratorio, preprocesamiento y uso de redes neuronales.

Notifications You must be signed in to change notification settings

dg2c4/Asteroids-Orbits-Data-Elective-I

Folders and files

NameName
Last commit message
Last commit date

Latest commit

 

History

19 Commits
 
 
 
 

Repository files navigation

Asteroids-Orbits-Data-Elective-I

Penguin-Species-Clasification-Illustration

Link video del avance realizado:

https://www.youtube.com/watch?v=5tpeUpoG8dY

Detalles del proyecto final:

• Usar un conjunto de datos de mínimo 2000 registros.
• Desarrollar un análisis exploratorio de datos y preprocesamiento.
• Entrenamiento de una red neuronal y modelo machine learning.

Objetivo:

Realizar un análisis completo de un conjunto de datos de asteroides para identificar posibles riesgos de impacto con la Tierra, utilizando técnicas de análisis exploratorio, preprocesamiento y uso de redes neuronales. El trabajo se divide en tres componentes principales:

1. Análisis Exploratorio:

- Formulación de preguntas de investigación.
- Creación de hipótesis basadas en un problema específico.
- Análisis inicial del conjunto de datos seleccionado.

2. Preprocesamiento de Datos:

- Limpieza de datos.
- Transformación de variables.
- Reducción de datos cuando sea necesario.
- Discretización de datos según corresponda.

3. Modelado y Evaluación:

- Implementación de modelo de regresión lineal o logística
- Selección y cálculo de métricas de evaluación
- Análisis del rendimiento del modelo

Conjunto de datos:

Contiene datos sobre posibles impactos de asteroides con la Tierra.

https://www.kaggle.com/datasets/nasa/asteroid-impacts

Ejercicio:

A. Realizar un análisis exploratorio al conjunto de datos entregado, para ello debe crear diferentes preguntas e hipótesis a resolver en los datos partiendo de un problema que cada grupo debe plantear.

B. Después de realizar el análisis exploratorio, debe hacer el preprocesamiento de los datos según como considere: limpieza, transformación, reducción de datos o discretización de los datos. Para esto, puede usar pandas.

C. Luego de hacer el preprocesamiento y tener el conjunto de datos final, debe crear un modelo de Machine Learning de regresión lineal, puede usar scikit learn. Este modelo puede ser de predicción o regresión logística para clasificación. Debe buscar la forma de evaluar si el modelo está bien o no con métricas que permitan determinar si el modelo aprende o no.

Evaluación:

Ítem Puntos
Análisis exploratorio en notebook 10 pts
Preprocesamiento de los datos 15 pts
Entrenamiento del Modelo de Machine Learning con redes neuronales 15 pts
Evaluación del modelo 75% Accuracy 10 pts
Total 50 pts

Systems engineering:

User: David Gutierrez Chaves
Code: 506222728
Subject: Big Data Electiva-I
Institution: Fundación Universitaria Konrad Lorenz
Institutional email david.gutierrec@konradlorenz.edu.co

Created By:

https://github.com/dg2c4

Date: 06/03/2025 - 20/03/2025 Avance Proyecto Final 10%

Date: 22/03/2025 - 29/05/2025 Presentación Proyecto final 20%

About

Realizar un análisis completo de un conjunto de datos de asteroides para identificar posibles riesgos de impacto con la Tierra, utilizando técnicas de análisis exploratorio, preprocesamiento y uso de redes neuronales.

Topics

Resources

Stars

Watchers

Forks

Releases

No releases published

Packages

No packages published