Estimación del tiempo de llegada de buses urbanos a la parada del usuario utilizando datos de Sri Lanka
Estimation of urban bus arrival time at the user's Stop using data from Sri Lanka
Autor
Gómez, Maria
Gómez, Giuseppe
Padilla, Juan
Fecha
2025-06-01Resumen
Este proyecto propone una solución basada en inteligencia artificial para estimar el tiempo de llegada de buses urbanos a la parada del usuario, utilizando datos reales de Sri Lanka. El estudio emplea dos modelos predictivos: LightGBM y LSTM, entrenados con información GPS recolectada en la ruta 654 (Kandy–Digana), la cual comprende más de 10.000 viajes. Se desarrolló un pipeline completo de analítica de datos, incluyendo limpieza, análisis exploratorio, ingeniería de características y validación, apoyado en la metodología CRISP-DM.
El análisis reveló que la duración promedio de los viajes oscila entre 45 y 60 minutos, con picos de congestión en horas específicas. LightGBM logró un Error Absoluto Medio (MAE) de 32.46 segundos, superando a LSTM (MAE de 45.05 s), con mejor rendimiento especialmente en viajes de duración común. Además, se desarrolló un dashboard interactivo para visualizar predicciones, métricas clave y patrones geoespaciales. Los resultados evidencian que LightGBM es una opción más precisa y eficiente para este tipo de problemas, aunque LSTM puede ser útil cuando las dependencias temporales son críticas. This project proposes an artificial intelligence-based solution to estimate the arrival time of urban buses at the user's stop, using real-world data from Sri Lanka. The study employs two predictive models: LightGBM and LSTM, trained with GPS data collected from route 654 (Kandy–Digana), covering over 10,000 trips. A complete data analytics pipeline was developed, including data cleaning, exploratory analysis, feature engineering, and validation, following the CRISP-DM methodology.
The analysis revealed that the average trip duration ranges between 45 and 60 minutes, with congestion peaks at specific hours. LightGBM achieved a Mean Absolute Error (MAE) of 32.46 seconds, outperforming LSTM (MAE of 45.05 s), especially in predicting common-duration trips. Additionally, an interactive dashboard was developed to visualize predictions, key metrics, and geospatial patterns. Results show that LightGBM is a more accurate and efficient option for this type of problem, although LSTM may be useful when modeling long-term temporal dependencies.