Predicción temprana de huracanes utilizando aprendizaje automático y datos de IBTrACS
Early hurricane prediction using machine learning and ibtracs data
Autor
Rodríguez, Aaron
Meza, David
Noriega, Edinson
Maestre, Juan
Fecha
2025-05-31Resumen
Los huracanes son fenómenos meteorológicos altamente destructivos que generan importantes pérdidas humanas y económicas. Predecir su intensidad con antelación es un desafío debido a la complejidad de los factores atmosféricos, oceánicos y geográficos involucrados. Este proyecto propone un modelo de aprendizaje automático basado en Random Forest para predecir la intensidad de los huracanes utilizando datos históricos del conjunto IBTrACS. Se siguió el enfoque CRISP-ML(Q), que abarca todas las etapas, desde la comprensión del problema hasta la implementación del modelo. Tras analizar 18.354 observaciones históricas y aplicar un riguroso proceso de depuración, se utilizaron 2.638 registros completos para el entrenamiento. Las variables más relevantes incluyen el estado del huracán, los radios de viento de 64 nudos y las coordenadas geográficas. La solución incluye módulos de análisis, procesamiento, modelado y visualización, así como una plataforma web interactiva que clasifica la intensidad de los huracanes según la escala Saffir-Simpson. También se desarrolló un panel de control en Looker Studio para visualizar patrones geoespaciales históricos. Los resultados demuestran el potencial del aprendizaje automático para mejorar los sistemas de alerta temprana y la gestión del riesgo de huracanes. Hurricanes are highly destructive meteorological phenomena that cause significant human and economic losses. Predicting their intensity in advance is a challenge due to the complexity of the atmospheric, oceanic, and geographic factors involved. This project proposes a machine learning model based on Random Forest to predict hurricane intensity using historical data from the IBTrACS dataset. The CRISP-ML(Q) methodology was followed, covering all stages from problem understanding to model deployment. After analyzing 18,354 historical observations and applying a rigorous data-cleaning process, 2,638 complete records were used for training. The most relevant variables include hurricane status, 64-knot wind radii, and geographic coordinates. The solution includes analysis, processing, modeling, and visualization modules, as well as an interactive web platform that classifies hurricane intensity according to the Saffir-Simpson scale. A dashboard was also developed in Looker Studio to visualize historical geospatial patterns. The results demonstrate the potential of machine learning to enhance early warning systems and hurricane risk management.
