Please use this identifier to cite or link to this item:
http://dspace.utpl.edu.ec/handle/29.500.19856/70964
Title: | Predicción de riesgo cardio vascular a través de los algoritmos supervisados: KNN, Árboles de decisión y Random Forest. |
Authors: | Reátegui Rojas, Ruth María Tandazo Malla, Carlos Andrés |
Keywords: | Ecuador. Tesis digital. |
Issue Date: | 2025 |
Citation: | Tandazo Malla, C. A. Reátegui Rojas, R. M. (2025) Predicción de riesgo cardio vascular a través de los algoritmos supervisados: KNN, Árboles de decisión y Random Forest. [Tesis de Posgrado, Universidad Técnica Particular de Loja]. Repositorio Institucional. https://dspace.utpl.edu.ec/handle/29.500.19856/70964 |
Abstract: | Abstract: This thesis is aimed at predicting cardiovascular risk through supervised Machine Learning algorithms, such as KNN, Decision Trees and Random Forest, models noted for their ability to identify complex patterns and make accurate predictions in data sets related to clinical variables and cardiovascular risk factors. In a context where cardiovascular diseases are the main cause of mortality in Ecuador, a database with relevant information on cardiovascular risk factors was used, and through a process that included exploratory analysis, data preprocessing, application of balancing techniques and refinement of hyperparameters by means of Grid Search, the proposed models were implemented and evaluated. The results indicate that the balancing techniques, especially the hybrid use of ROS and SMOTE, were important to improve the performance of the models, precisely in the minority classes, likewise, the elimination of highly correlated variables optimized the predictive capacity of the algorithms, resulting that in experiment three, the Random Forest algorithm achieved an accuracy of 0.83 and a better performance in the handling of unbalanced data. This study demonstrates the potential of supervised algorithms as effective tools for cardiovascular risk prediction, providing a basis for the development of technological solutions, such as web or mobile applications, that support clinical practice and contribute to health prevention strategies. |
Description: | Resumen: El presente Trabajo de Titulación (TT) está orientado a predecir el riesgo cardiovascular a través de algoritmos supervisados de Machine Learning, como KNN, Árboles de Decisión y Random Forest, modelos destacados por su capacidad para identificar patrones complejos y realizar predicciones precisas en conjuntos de datos relaciones con variables clínicas y factores de riesgo cardiovascular. En un contexto donde las enfermedades cardiovasculares son la principal causa de mortalidad en Ecuador, se utilizó una base de datos con información relevante sobre factores de riesgo cardiovascular, que a través de un proceso que incluyó análisis exploratorio, preprocesamiento de datos, aplicación de técnicas de balance y afinamiento de hipérparametros mediante Grid Search, se implementaron y evaluaron los modelos propuestos. Los resultados indican que las técnicas de balanceo, especialmente el uso híbrido de ROS y SMOTE, fueron importantes para mejorar el rendimiento de los modelos, precisamente en las clases minoritarias, asimismo, la eliminación de variables altamente correlacionadas optimizó la capacidad predictiva de los algoritmos, dando como resultado que en el experimento tres, el algoritmo Random Forest logró un accuracy de 0.83 y un mejor desempeño en el manejo de datos desbalanceados. Este estudio demuestra el potencial de los algoritmos supervisados como herramientas efectivas en la predicción del riesgo cardiovascular, ofreciendo una base para el desarrollo de soluciones tecnológicas, como aplicaciones web o móviles, que apoyen la práctica clínica y contribuyan a las estrategias de prevención en la salud. |
URI: | https://bibliotecautpl.utpl.edu.ec/cgi-bin/abnetclwo?ACC=DOSEARCH&xsqf99=145891.TITN. |
Appears in Collections: | Maestría en Inteligencia Artificial Aplicada |
Files in This Item:
Items in DSpace are protected by copyright, with all rights reserved, unless otherwise indicated.