Diseño de un Modelo matemático para la predicción de fuga de clientes en el área de telefonía
Design of a mathematical model for predicting customer churn in the telephone area
Autor
Camargo Ramos, Juan José
Morales Cotes, Eduardo Alberto
Orozco Polo, Ivan Andrés
Fecha
2020-06-03Resumen
Hoy en día, debido a la necesidad de estar comunicados telefónicamente y a la gran cantidad de empresas que ofrecen este servicio en Colombia, la telefonía móvil enfrenta una feroz competencia por retener usuarios, buscando evitar la fuga de sus clientes a otras entidades y no incurrir en costos adicionales al tratar de atraer a nuevos clientes. Por lo que es de suma importancia para las empresas de este sector, el predecir si un usuario abandonará sus servicios.
Como solución a esta problemática, se propone el diseño de modelos matemáticos que predigan intención de fuga de clientes mediante el uso de técnicas clasificadoras de minería de datos (Naïve Bayes, Random Forest, Redes Neuronales y Regresión Logística). Para ello, se recurrió a una base de datos históricos perteneciente a una empresa de telefonía, la cual contenía información de tipo demográfica y conductual de alrededor de 7000 clientes. Así, luego de analizar y tratar estos datos, fue posible determinar las variables explicativas y su respectivo impacto sobre la variable respuesta. Posteriormente tales variables servirían como entrada para el diseño de los modelos mediante el software R.
Finalmente, se evaluó el desempeño de cada uno de los modelos propuestos, al aplicar el análisis ROC (Receiver Operating Characteristic) tanto para la fase de entrenamiento como para la de validación. Reflejando, que aún con presencia de sobreajuste en esta última etapa, los modelos de Random Forest y de Redes Neuronales resultaron ser significativos, dado a que el valor de la exactitud en ambos casos (77.76% y 76,7% respectivamente) fue mayor al No Information Rate (NIR) de los datos, a diferencia de los otros modelos que no lo fueron. Lo que indica que estas dos técnicas, muestran ser alternativas atractivas para emplearlas al seguimiento de clientes y disminuir cifras de fuga. Nowadays, due to the need of being communicated by phone and the amount of companies that offer this service in Colombia, the mobile telephony faces a tough competition for retaining users, trying to avoid the flight of them to other firms or incurring in additional costs trying to attract new clients. So, it is of great importance for the companies of this sector predict if a user will abandon their services.
As a solution of this problem, is proposed the design of mathematical models that predict the intention of customers churn through the use of classificatory techniques of data mining (Naïve Bayes, Random Forest, Neural Networks and Logistic Regression). For this, a historical database belonging to a telephone company was used, which contained demographic and behavioral information of around 7000 clients. Thus, after analyzing and treating these data, it is possible to determine the explanatory variables and their respective impact on the response variable. Subsequently, these variables would serve as input for the design of the models using the R software.
Finally, the performance of each of the proposed models was evaluated by applying the ROC (Receiver Operating Characteristic) analysis for both the training phase and the validation. Reflecting that, even with the presence of an overfit in this last stage, the Random Forest and Neural Networks models were significant, given a value of accuracy in both cases (77.76% and 76.7% respectively) was higher than No Information Rate (NIR) of the data, unlike the other models that were not. This assumes that these two techniques show to be attractive alternatives to be used to follow up clients and reduce dropouts.