Please use this identifier to cite or link to this item:
http://dspace.utpl.edu.ec/handle/29.500.19856/76444| Title: | Comparación de métodos de balanceo para la predicción de depresión con algoritmos de aprendizaje automático |
| Authors: | Benítez Lanche, Patricio Bolívar |
| Director: | Reátegui Rojas, Ruth María |
| Keywords: | Ecuador. Tesis digital. |
| Issue Date: | 2026 |
| Citation: | Benítez Lanche, P. B. Reátegui Rojas, R. M. (2026) Comparación de métodos de balanceo para la predicción de depresión con algoritmos de aprendizaje automático [Tesis de Posgrado, Universidad Técnica Particular de Loja]. Repositorio Institucional. https://dspace.utpl.edu.ec/handle/29.500.19856/76444 |
| Abstract: | Abstract: Studies on depression make it possible to identify data records, data balancing techniques, models, and variables that are relevant for determining whether a person is experiencing a depressive state. Therefore, it is essential to carry out this type of research in order to analyze and determine which factors are associated with depressive symptoms. This thesis aims to compare data balancing methods for depression prediction using machine learning algorithms, following the CRISP-DM methodology. A review of related work is conducted to define the data balancing techniques, the best-performing models, and the metrics used for model evaluation. Data balancing techniques (oversampling, undersampling, and hybrid approaches) and supervised learning algorithms (Decision Trees, Random Forest, Gradient Boosting, XGBoost, LightGBM, AdaBoost, and CatBoost) are implemented, with hyperparameters tuned using GridSearchCV. The results are compared using evaluation techniques (confusion matrix, accuracy, precision, recall, F1-score, and AUC-ROC) to identify that the best-performing models were Random Forest, XGBoost, and LightGBM. |
| Description: | Resumen: Los estudios sobre depresión nos permiten identificar los registros de datos, técnicas de balanceo de datos, modelos y variables que inciden para establecer que una persona atraviesa por un estado depresivo; por tanto, es imprescindible realizar este tipo de investigaciones para analizar y determinar qué factores se asocian a los síntomas de depresión. Este trabajo de titulación tiene la finalidad de realizar la comparación de métodos de balanceo para la predicción de depresión con algoritmos de aprendizaje automático, mediante la implementación de la metodología CRISP-DM. Se realiza una revisión de trabajos relacionados para definir las técnicas de balanceo de datos, mejores modelos y métricas utilizadas para la evaluación de los modelos. Se implementa técnicas de balanceo de datos (OverSampling, UnderSampling e Híbridas) y algoritmos de aprendizaje supervisado (Árboles de decisión, Random Forest, Gradient Boosting, XGBoost, LightGBM, AdaBoost y CatBoost) adaptando hiperparámetros mediante la aplicación de GridSearchCV para el modelado. Los resultados se comparan mediante las técnicas de evaluación (matriz de confusión, accuracy, precisión, recall, f1-score, AUC-ROC) para identificar que los modelos con mejor rendimiento fueron Random Forest, XGBoost y LightGBM. |
| Identifier : | Cobarc: 1380230 |
| URI: | https://bibliotecautpl.utpl.edu.ec/cgi-bin/abnetclwo?ACC=DOSEARCH&xsqf99=151911.TITN. |
| Type: | masterThesis |
| Appears in Collections: | Maestría en Inteligencia Artificial Aplicada |
Files in This Item:
Items in DSpace are protected by copyright, with all rights reserved, unless otherwise indicated.
