Please use this identifier to cite or link to this item:
http://dspace.utpl.edu.ec/handle/29.500.19856/71688
Title: | Predicción de riesgo cardiovascular a través de los algoritmos supervisados: Support Vector Machine, Gradient Boosting y Naïve Bayes |
Authors: | Reátegui Rojas, Ruth María Ordóñez Sanmartín, Joselito Miguel |
Keywords: | Ecuador. Tesis digital. |
Issue Date: | 2025 |
Citation: | Ordóñez Sanmartín, J. M. Reátegui Rojas, R. M. (2025) Predicción de riesgo cardiovascular a través de los algoritmos supervisados: Support Vector Machine, Gradient Boosting y Naïve Bayes [Tesis de Posgrado, Universidad Técnica Particular de Loja]. Repositorio Institucional. https://dspace.utpl.edu.ec/handle/29.500.19856/71688 |
Abstract: | Abstract: The primary objective of this titration work (TT) is to predict cardiovascular risk using supervised Machine Learning algorithms. Three models were evaluated, Support Vector Machine (SVM), Gradient Boosting (GB), and Naïve Bayes (NB), analyzing their performance through evaluation metrics such as accuracy, recall and F1-Score, in the four experiments carried out, a normalization technique was applied using StandardScaler, and class balancing techniques such as SMOTE and Random Over Sampling to improve the minority classes. The GB model, in experiment number four, was the most effective model, reaching an accuracy of 0.87%, which worked with normalized and balanced data, SVM was the second model with the best results in its evaluation metrics, while the NB model worked with unnormalized, but balanced data, where it presented more difficulties compared to the other models, presenting very low metrics. It is important to carry out an adequate analysis of the data and select the most optimal model with the best metrics, which will allow us to identify cardiovascular risk more accurately and quickly. |
Description: | Resumen: El presente trabajo de titulación (TT) tiene como objetivo primordial predecir el riesgo cardiovascular utilizando algoritmos supervisados de Machine Learning, Se evaluaron tres modelos, Support Vector Machine (SVM), Gradient Boosting (GB), y Naïve Bayes (NB), analizando su rendimiento mediante las métricas de evaluación como accuracy, recall y F1- Score, en los cuatro experimentos realizados, se aplicó técnica de normalización utilizando StandardScaler, y técnicas de balanceo de calases como SMOTE y Random Over Sampling para mejorar las clases minoritaria. El modelo GB, en el experimento número cuatro fue el modelo más efectivo alcanzando un accuracy del 0,87%, el cual trabajo con datos normalizados y balanceados, SVM fue el segundo modelo con mejores resultados en sus métricas de evaluación, mientras que el modelo de NB trabajo con datos sin normalizar, pero balanceados, donde presento más dificultades en comparación con los demás modelos presentando métricas muy bajas. Es importante realizar un análisis adecuado de los datos, y seleccionar el modelo más optimo y con las mejores métricas, que nos permitirá identificar el riesgo cardiovascular de manera más precisa y rápida. |
URI: | https://bibliotecautpl.utpl.edu.ec/cgi-bin/abnetclwo?ACC=DOSEARCH&xsqf99=146058.TITN. |
Appears in Collections: | Maestría en Inteligencia Artificial Aplicada |
Files in This Item:
Items in DSpace are protected by copyright, with all rights reserved, unless otherwise indicated.