Por favor, use este identificador para citar o enlazar este ítem:
http://dspace.utpl.edu.ec/handle/20.500.11962/29467
Título : | Aplicación de técnicas de aprendizaje de máquina para la predicción de riesgos en la salud ginecológica |
Autor : | Reátegui Rojas, Ruth María Ortiz Torres, Christian Alfonso. |
Palabras clave : | Ecuador. Tesis digital. |
Fecha de publicación : | 2022 |
Citación : | Ortiz Torres, C. A. Reátegui Rojas, R. M. (2022) Aplicación de técnicas de aprendizaje de máquina para la predicción de riesgos en la salud ginecológica [Tesis de Posgrado, Universidad Técnica Particular de Loja]. Repositorio Institucional. https://dspace.utpl.edu.ec/handle/20.500.11962/29467 |
Resumen : | Abstract: Cervical cancer is one of the leading causes of death in women, in 2020, 604,127 cases of cervical cancer were diagnosed, with a mortality of 341,831 cases worldwide.The objective of this work is to analyze, explore, compare and identify the best cervical cancer prediction method using machine learning techniques. To achieve this objective, 17 investigations obtained from six scientific databases of the last 5 years were analyzed, and experiments were carried out with 7 algorithms: 1. Decision Tree (DT), 2. Random Forest (RF), 3. Logistic Regression (LR), 4. XGBoost (XG), 5. Naive Bayes (NB), 6. Multi-layer Perceptron(MLP), 7. K-Nearest Neighbors (KNN). Three data balancing techniques were applied: 1. SMOTETomek, 2. SMOTE, 3. ROS, for the four target variables: Hinselmann, Schiller, Citology and Biopsy. In addition, we worked with accuracy, precision, recall, f-score, AUC and the ROC curve to evaluate the values obtained from the prediction algorithms.The algorithm that stood out the best is Random Forest with an accuracy of 94.57% for selection of variables and reduction of PCA variables. |
Descripción : | Resumen: El cáncer cervical es una de las causas principales de muerte en las mujeres, en el año 2020, se diagnosticaron 604.127 casos de cáncer de cuello uterino, con una mortalidad de 341.831 casos en todo el mundo.El objetivodel presente trabajo es analizar, explorar, comparar e identificar el mejor método de predicción del cáncer cervical aplicando técnicas de machine learning. Para lograr dicho objetivo se analizaron 17 investigaciones obtenidas de seis bases de datos científicas de los últimos 5 años, y, se realizaron experimentos con 7 algoritmos: 1. Decision Tree (DT), 2. Random Forest (RF), 3. Logistic Regression (LR), 4. XGBoost (XG), 5. Naive Bayes (NB), 6. Multi-layer Perceptron (MLP), 7. K-Nearest Neighbors (KNN). Seaplicaron trestécnicas de balanceo de datos: 1. SMOTETomek, 2. SMOTE, 3.ROS, para las cuatro variables objetivo: Hinselmann, Schiller, Citology y Biopsy. Además,se trabajó con accuracy, precisión, recall, f-score, AUC y la curva ROC para evaluar los valores obtenidos de los algoritmos depredicción.El algoritmo que mejor destacó es Random Forestcon un accuracy de 94.57%paraselección de variablesy reducción de variables PCA. |
URI : | https://bibliotecautpl.utpl.edu.ec/cgi-bin/abnetclwo?ACC=DOSEARCH&xsqf99=128185.TITN. |
Aparece en las colecciones: | Magister en Ciencias y Tecnologías de la Computación |
Ficheros en este ítem:
Los ítems de DSpace están protegidos por copyright, con todos los derechos reservados, a menos que se indique lo contrario.