Implementación de protocolo para entrenamiento federado de modelos de clasificación preservando la privacidad de los datos sobre una red de computadores
Autor
Conrado Amaranto, Carlos Andrés
Fecha
2023Resumen
Gracias a herramientas como chatGPT, MidJourney, y GitHub Copilot, entre otros; los productos basados en Inteligencia Artificial, específicamente Machine Learning (ML) y Deep Learning (DL), se han popularizado entre un público no especializado. Esto conlleva una responsabilidad mayor por parte de los especialistas y proveedores de productos basados en ellos, ya que el principal componente en cualquier producto basado en modelos de ML y DL son los datos. La privacidad de estos es uno de los principales temas de discusión alrededor este tipo de productos, el público en general muestra escepticismo respecto a su información cuando es utilizada por terceros. Por esta razón, el presente trabajo se enfoca en una rama de las ciencias computacionales, que busca proteger la privacidad de los datos, específicamente se trata de la implementación de un protocolo de entrenamiento de modelos MLP mediante un esquema de aprendizaje federado, utilizando datos locales distribuidos y donde se conserva su privacidad. La preservación de la privacidad se logra a través del uso de un esquema criptográfico homomórfico que permite operar sobre los datos cifrados. La implementación del protocolo es desplegada en una nube, donde máquinas virtuales actúan como clientes y servidores, esto es cercano a un escenario práctico de la vida real, donde los participantes no pueden compartir los datos. La verificación de protocolo se realiza mediante simulaciones compuestas de distintos escenarios en los cuales se varían el número de clientes, la arquitectura de la red MLP, la distribución de los datos, y los hyper-parametros, entre otros. En estos escenarios se realiza un análisis del desempeño del protocolo comparado a un entrenamiento local. Por último, se destaca el valor agregado de la implementación realizada en este trabajo comparándolo con los trabajos más recientes del estado del arte.