SafeRecords, una solución de software para la anonimización de registros médicos usando modelos de reconocimiento de entidades
SafeRecords: A Software Solution for Medical Record Anonymization Using Entity Recognition Models
Autor
Mercado, Santiago Andrés
Gutiérrez, Daniel David
Henríquez, David Daniel
Fecha
2024-11-28Resumen
SafeRecords es una solución innovadora de software que aborda la necesidad crítica de anonimizar registros médicos, protegiendo la privacidad de los pacientes mientras preserva la utilidad de los datos para investigaciones científicas. Inspirado en los avances recientes de la inteligencia artificial, el proyecto implementa un modelo BERT de reconocimiento de entidades para identificar y eliminar información sensible de manera precisa.
La solución se desarrolla como una aplicación web accesible, diseñada para procesar datos localmente en el navegador. Esto elimina la necesidad de transferir información a servidores externos, garantizando una mayor privacidad. Utilizando tecnologías modernas como Transformers.js y ONNX, SafeRecords puede anonimizar registros en múltiples idiomas con alta precisión, manteniendo un equilibrio entre seguridad y eficiencia.
El proyecto incluye funcionalidades como carga de documentos en formatos comunes, selección de modos de anonimización (genérico y avanzado), y la opción de descargar los resultados procesados. Las pruebas demostraron que la herramienta es capaz de procesar grandes volúmenes de datos de forma estable, alcanzando un promedio de precisión del 74 %.
Con un enfoque en la usabilidad, SafeRecords está diseñado para profesionales de la salud e investigadores, ofreciendo una solución práctica para manejar datos sensibles en conformidad con normativas legales como el GDPR y HIPAA. Este proyecto establece un precedente en la aplicación de IA para la protección de datos en el sector salud. SafeRecords is an innovative software solution addressing the critical need for anonymizing medical records, ensuring patient privacy while preserving the data's utility for scientific research. Inspired by recent advancements in artificial intelligence, the project leverages a BERT-based named entity recognition model to accurately identify and remove sensitive information.
The solution is developed as an accessible web application designed to process data locally within the browser, eliminating the need for external server transfers and enhancing privacy. By employing modern technologies such as Transformers.js and ONNX, SafeRecords can anonymize records in multiple languages with high precision, striking a balance between security and efficiency.
The project features capabilities such as uploading documents in common formats, selecting anonymization modes (generic and advanced), and downloading processed results. Tests demonstrated the tool's ability to handle large data volumes reliably, achieving an average accuracy of 74%.
Focused on usability, SafeRecords is designed for healthcare professionals and researchers, offering a practical solution to manage sensitive data in compliance with legal regulations like GDPR and HIPAA. This project sets a benchmark for applying AI to data protection in the healthcare sector.