Aplicación Software para la clasificación de pacientes con Alzheimer basado en técnicas de Data Mining
Software application for the classification of Alzheimer's patients based on Data Mining techniques
Autor
Álvarez, Valeria
Padilla, Jesús
Sepúlveda, Luis
Fecha
2020-05-30Resumen
En Colombia, 342.956 personas mayores de 60 años padecerán algún tipo de demencia, de las cuales cerca del 75% sufrirán Alzheimer (EA) (OISS, 2019), es por ello que tener una buena percepción de la data disponible es importante para mejorar el tratamiento de la EA. En la actualidad muchos hospitales cuentan con sistemas automatizados para el registro de sus pacientes, sin embargo pocos de estos sistemas apoyan al tratamiento de estos. Por esto el equipo de trabajo desarrolló una herramienta software que permite la clasificación de pacientes respecto al nivel de demencia que poseen a partir de los datos ingresados por doctores al realizar una nueva consulta donde dichos pacientes son sometidos a un test de evaluación de demencia, para esto se utilizó la base de datos abierta OASIS. Se creó un script en Python el cual es integrado en Django y se apoya de los datos abiertos analizados. Por otro lado, se implementó la técnica de Random Forest utilizando conjuntos de árboles clasificadores CART, los cuales utilizan el índice Gini para la separación de la criteria. Por medio de este modelo y de los resultados obtenidos en el área bajo la curva ROC (AUC) el programa logra clasificar correctamente a los pacientes con una probabilidad de 92% entre sujetos con sanidad y con demencia, adicionalmente se realiza una clasificación con una probabilidad del 81% con respecto al Clinical Dementia Rating (CDR) de los pacientes. Agregado a esto se obtienen los factores de riesgo asociados a cada paciente a partir de la información suministrada en los formularios y las evaluaciones, dicha información es analizada en relación a la importancia de cada uno de los atributos dentro del dataset y es posteriormente comparada con respecto a la media. La información es presentada en la herramienta web utilizando Vue.js y ZingChart.js para la visualización del comportamiento de los datos demográficos y clínicos de los pacientes así como el monitoreo de estos a partir de los tests que realizan. In Colombia, 342,956 people over 60 will suffer from some type of dementia, of which about 75% will suffer from Alzheimer's disease (AD)(OISS, 2019), which is why having a good perception of the available data is important to improve the treatment of AD. Currently, many hospitals have automated systems for registering their patients, however few of these systems support their treatment. For this reason, the team developed a software tool that allows the classification of patients with respect to the level of dementia they have from the data entered by doctors when conducting a new consultation where said patients undergo a dementia evaluation test, for this was used the OASIS open database. A Python script was created which is integrated in Django and is supported by the analyzed open data. On the other hand, the Random Forest technique was implemented using sets of CART classifier trees, which use the Gini index to separate the criteria. Using this model and the results obtained in the area under the ROC curve (AUC), the program successfully classifies patients with a 92% probability among subjects with sanity and dementia, in addition, a classification with a probability of 81% with respect to the Clinical Dementia Rating (CDR) of the patients is done. Added to this, the risk factors associated with each patient are obtained from the information provided in the forms and evaluations, this information is analyzed in relation to the importance of each of the attributes within the dataset and is subsequently compared with respect to the mean. The information is presented in the web tool using Vue.js and ZingChart.js for the visualization of the behavior of the demographic and clinical data of the patients as well as the monitoring of these from the tests they perform.