Sistema de demostración de inteligencia artificial para el control de robots móviles en un entorno lúdico
Autor
Perafán Bermúdez, Álvaro Alfonso
Rinaldy Potes, Martha Lucía
Fecha
2021-05-31Resumen
El siguiente proyecto busca demostrar, de manera didáctica, el desarrollo de un sistema de inteligencia artificial a partir de un algoritmo de aprendizaje por refuerzo ilustrado en un juego de captura y escape. El propósito de este proyecto es abarcar el funcionamiento de herramientas como los algoritmos de Reinforcement Learning o más específicamente, Q-Learning, programados en Python, con el motivo de instruir la importancia de estas en el futuro de las ingenierías y la industria. Adicionalmente, se aplican estos conceptos a un problema físico, en este caso, el movimiento de dos robots a través de una cuadrícula de 6x6. Esta demostración se hace bajo la estructura del videojuego ‘El Gato & El Ratón’, donde, a los mencionados se les conoce como agentes. El juego tiene dos modos de jugador, el Jugador-Jugador (JcJ) y el Jugador-Máquina (JcM).
Para el caso del Jugador-Jugador, se crea una interfaz que puede ser controlada manualmente. Esta se enlaza al entorno real por medio de una conexión de bluetooth aplicada para la manipulación de los robots móviles desde el ordenador. En el caso del modo Jugador-Máquina, el ordenador toma el rol de uno de los agentes (En este caso, el agente entrenado es el ratón) gracias al algoritmo de Q-Learning, que le permite también tomar, de manera autónoma, el control de uno de los robots. Este mismo controla físicamente al robot encargado de simular al agente en cuestión. El juego finaliza una vez el agente ratón haya encontrado al queso o el agente gato haya atrapado al agente ratón. Finalmente, según las simulaciones realizadas, se observó el comportamiento a partir de las recompensas y penalizaciones digitadas para cada decisión realizada por el ratón. Estas simulaciones modelan la creación de una personalidad de este agente las cuales se consideraron con las etiquetas miedoso, hambriento y balanceado. The following project seeks to demonstrate, in a didactic way, the development of an Artificial Intelligence system based on a reinforcement learning algorithm illustrated in a capture and escape game. The purpose of this project is to cover the operation of tools such as Reinforcement Learning algorithms or more specifically, Q-Learning, programmed in Python, in order to teach the importance of these in the future of engineering and industry. Additionally, these concepts are applied to a physical problem, in this case, the movement of two robots through a 6x6 grid. This demonstration is done under the structure of the video game 'The Cat & The Mouse', where the mentioned are known as agents. The game has two player modes, Player-Player (JcJ) and Player-Machine (JcM).
In the case of the Player-Player mode, an interface is created that can be controlled manually. This is linked to the real environment by means of a bluetooth connection applied for the manipulation of the mobile robots from the computer. In the case of the Player-Machine mode, the computer takes the role of one of the agents (in this case, the trained agent is the mouse) thanks to the Q-Learning algorithm, which also allows it to autonomously take control of one of the robots. It physically controls the robot in charge of simulating the agent in question. The game ends once the mouse agent has found the cheese or the cat agent has caught the mouse agent. Finally, according to the simulations performed, the behavior was observed from the rewards and penalties typed for each decision made by the mouse. These simulations model the creation of a personality of this agent, which were considered with the labels shyl, hungry and balanced.