Please use this identifier to cite or link to this item: http://dspace.utpl.edu.ec/handle/20.500.11962/29467
Title: Aplicación de técnicas de aprendizaje de máquina para la predicción de riesgos en la salud ginecológica
Authors: Reátegui Rojas, Ruth María
Ortiz Torres, Christian Alfonso.
Keywords: Ecuador.
Tesis digital.
Issue Date: 2022
Citation: Ortiz Torres, C. A. Reátegui Rojas, R. M. (2022) Aplicación de técnicas de aprendizaje de máquina para la predicción de riesgos en la salud ginecológica [Tesis de Posgrado, Universidad Técnica Particular de Loja]. Repositorio Institucional. https://dspace.utpl.edu.ec/handle/20.500.11962/29467
Abstract: Abstract: Cervical cancer is one of the leading causes of death in women, in 2020, 604,127 cases of cervical cancer were diagnosed, with a mortality of 341,831 cases worldwide.The objective of this work is to analyze, explore, compare and identify the best cervical cancer prediction method using machine learning techniques. To achieve this objective, 17 investigations obtained from six scientific databases of the last 5 years were analyzed, and experiments were carried out with 7 algorithms: 1. Decision Tree (DT), 2. Random Forest (RF), 3. Logistic Regression (LR), 4. XGBoost (XG), 5. Naive Bayes (NB), 6. Multi-layer Perceptron(MLP), 7. K-Nearest Neighbors (KNN). Three data balancing techniques were applied: 1. SMOTETomek, 2. SMOTE, 3. ROS, for the four target variables: Hinselmann, Schiller, Citology and Biopsy. In addition, we worked with accuracy, precision, recall, f-score, AUC and the ROC curve to evaluate the values obtained from the prediction algorithms.The algorithm that stood out the best is Random Forest with an accuracy of 94.57% for selection of variables and reduction of PCA variables.
Description: Resumen: El cáncer cervical es una de las causas principales de muerte en las mujeres, en el año 2020, se diagnosticaron 604.127 casos de cáncer de cuello uterino, con una mortalidad de 341.831 casos en todo el mundo.El objetivodel presente trabajo es analizar, explorar, comparar e identificar el mejor método de predicción del cáncer cervical aplicando técnicas de machine learning. Para lograr dicho objetivo se analizaron 17 investigaciones obtenidas de seis bases de datos científicas de los últimos 5 años, y, se realizaron experimentos con 7 algoritmos: 1. Decision Tree (DT), 2. Random Forest (RF), 3. Logistic Regression (LR), 4. XGBoost (XG), 5. Naive Bayes (NB), 6. Multi-layer Perceptron (MLP), 7. K-Nearest Neighbors (KNN). Seaplicaron trestécnicas de balanceo de datos: 1. SMOTETomek, 2. SMOTE, 3.ROS, para las cuatro variables objetivo: Hinselmann, Schiller, Citology y Biopsy. Además,se trabajó con accuracy, precisión, recall, f-score, AUC y la curva ROC para evaluar los valores obtenidos de los algoritmos depredicción.El algoritmo que mejor destacó es Random Forestcon un accuracy de 94.57%paraselección de variablesy reducción de variables PCA.
URI: https://bibliotecautpl.utpl.edu.ec/cgi-bin/abnetclwo?ACC=DOSEARCH&xsqf99=128185.TITN.
Appears in Collections:Magister en Ciencias y Tecnologías de la Computación



Items in DSpace are protected by copyright, with all rights reserved, unless otherwise indicated.