Diseño de un modelo de simulación para la reducción de errores asociados a las máquinas virtuales de Azure
Design a simulation model to reduce errors associated with Azure VMs
Autor
Martínez Ruiz, Valentina Eugenia
Montoya Carvajal, Miriam Valentina
Castrillo Navas, Kelly Gregoria
Serrano Narváez, María Mercedes
Fecha
2022-12-02Resumen
El presente trabajo se desarrolló con base en los errores identificados en la utilización del servicio de escritorios remotos de Microsoft Azure, por el área Network Cloud Infrastructure (NCI) de la multinacional automotriz, Inchcape. El foco principal es resolver el interrogante: ¿Cómo mejorar la asignación de los recursos con el fin de disminuir la frecuencia de errores en Azure? partiendo de una investigación acerca de las fuentes y causas de errores representativas con un diagrama de causa-efecto y un diagrama de Pareto, donde se identificó que en el 82% de los casos corresponde a las fuentes RDGateway (58%) seguido de Client (24%), y posteriormente identificando que solo ciertos errores son mitigables.
Seguidamente, se enfatiza en la fuente RDBroker (5%) dado que es aquella que representa la insuficiencia de recursos o escritorios remotos para el usuario final. Por consiguiente, se construye un pronóstico para medir la demanda de escritorios requeridos en base al comportamiento histórico de los usuarios y se plantea un modelo de simulación en Arena Software, que nos permite medir el impacto del ajuste de la metodología de asignación de escritorios remotos para la demanda diaria. Igualmente, nos ayuda a determinar como la variación de la regla de asignación incide en la frecuencia y comportamiento de errores y parámetros del proceso (recurso RAM).
A partir de la evaluación de los resultados obtenidos en el modelo se sugiere que el asignar los escritorios bajo la regla Largest Remaining Capacity demuestra una reducción en parámetros primordiales tales como la utilización del recurso RAM en un 34%, error de capacidad en un 42%, clientes insatisfechos en un 37% y evade la necesidad de crear nuevas máquinas virtuales o aumentar el número de escritorios por máquina que corresponde a un ahorro de £281 por máquina adicional. A manera de recomendación se crearon cartas de control U para monitorear los tickets de incidentes que recibe el área NCI. This paper was developed based on the errors identified in the use of the Microsoft Azure remote desktop service, by the Network Cloud Infrastructure (NCI) area of the automotive multinational, Inchcape. The main focus is to solve the question: How to improve the allocation of resources in order to reduce the frequency of failures in Azure? starting from an investigation about the sources and causes of representative errors with a cause-effect diagram and a Pareto chart, where it was identified that in 82% the cases it corresponds to RDGateway sources (58%) followed by Client (24%), and subsequently identifying that only certain errors are mitigable.
Therefore, emphasis is placed on the RDBroker source (5%) since it is the one that represents end user’s insufficiency of resources or remote desktops. Consequently, a forecast is built to measure the demand for required desktops based on the historical behavior of users and a simulation model in Arena Software is proposed, which allows us to measure the impact of adjusting the remote desktop allocation methodology for daily demand. Likewise, it helps us to determine how the variation of the allocation rule affects the frequency and behavior of errors and process parameters (RAM resource).
From the evaluation of the results obtained in the model it is suggested that allocating desktops under the Largest Remaining Capacity rule demonstrates a reduction in primary parameters such as RAM resource utilization by 34%, capacity error by 42%, dissatisfied customers by 37% and evades the need to create new virtual machines or increase the number of remote desktops per VM which resembles a saving of £ 281 per additional VM. As a recommendation, U control chart were created to monitor incident tickets received by the NCI area.