Modelo predictivo y Análisis de Datos para eventos criminales en Barranquilla orientado en Data Mining
Predictive Model and Data Analysis for criminal events in Barranquilla based on Data Mining
Autor
Camargo Rodriguez, Jesús Antonio
Márquez Escalante, Henry Andrés
Lastra Guerrero, Rafael Tobías
Fecha
2020-05-30Resumen
Actualmente la criminalidad es un concepto que con el paso del tiempo ha crecido tanto en intensidad como en complejidad; ya que este varía en gran medida, a causa y en relación al marco cultural y social en el cual se encuentre inscrito. En Barranquilla, al igual que en Colombia los índices de criminalidad aumentan de manera desmesurada año tras año, lo cual deja en evidencia la gran problemática existente debido a los altos indicadores de inseguridad que se encuentran presentes y denota la necesidad un estudio pertinente al respecto. Como solución a esto se propone elaborar un modelo predictivo para la incidencia criminal en la ciudad de Barranquilla, el cual brinde a la comunidad y a las autoridades competentes mediante un aplicativo web, la posibilidad de anticipar sucesos de esta índole, así como poder establecer un foco de interés en los barrios con mayor incidencia delictiva. Esta propuesta consta de dos apartados, en primer lugar una API que hace hace uso de Flask para resolver peticiones HTTP y en la cual se genera el modelo predictivo basado en árboles de decisión que busca dar respuesta a qué día y en qué barrio ocurrirá un evento criminal. Lo anterior es llevado a cabo debido al uso de un dataset de hurtos que brinda la policía nacional como fuente de datos. Y en segundo lugar, la capa de presentación desarrollada en React, que muestra información tanto descriptiva como predictiva de los datos obtenidos, haciendo uso de Power BI para la generación de gráficas y de la API de Google Maps para visualizar mapas de calor en los cuales se representa la cantidad de crímenes registrados por barrio. La sección predictiva de esta capa se conecta con la API mencionada previamente para poder interactuar con el modelo y obtener la información pertinente a cambio. Al finalizar las pruebas se cumple con el objetivo planteado y se logra obtener una certeza en las predicciones realizadas con los datos reservados para validación de un 75% aproximadamente. Currently, crime is a concept that has grown in intensity and complexity over time, since it varies greatly due to and in relation to the cultural and social framework in which it is found. In Barranquilla, as in Colombia, crime rates increase disproportionately year after year, which highlights the great problems that exist due to the high indicators of insecurity that are present and indicates the need for a relevant study in this regard. As a solution to this, a predictive model for the incidence of crime in the city of Barranquilla is proposed, which will provide the community and the competent authorities, by means of a web application, with the possibility of anticipating events of this nature, as well as being able to establish a focus of interest in the neighbourhoods with the highest incidence of crime. This proposal consists of two sections, firstly an API that makes use of Flask to resolve HTTP requests and in which the predictive model based on decision trees is generated that seeks to respond to which day and in which neighbourhood a criminal event will occur. This is done using a theft dataset provided by the national police as a source of data. And secondly, the presentation layer developed in React, which shows both descriptive and predictive information from the data obtained, making use of Power BI for the generation of graphics and the Google Maps API to visualize heat maps in which the number of crimes recorded per neighborhood is represented. The predictive section of this layer connects to the API mentioned previously in order to interact with the model and obtain the relevant information in return. At the end of the tests, the objective is achieved and a certainty with the model is obtained through the data reserved for validation of approximately 75%.