Please use this identifier to cite or link to this item: http://dspace.utpl.edu.ec/handle/20.500.11962/26711
Title: Aplicación de un modelo de minería de datos para predecir el posible consumo de drogas
Authors: Valdiviezo Díaz, Priscila Marisela
Rivadeneira Cajas, Yoder Omar.
Keywords: Ecuador.
Tesis digital.
Issue Date: 2020
Citation: Rivadeneira Cajas, Y. O. Valdiviezo Díaz, P. M. (2020) Aplicación de un modelo de minería de datos para predecir el posible consumo de drogas [Tesis de N/D, Universidad Técnica Particular de Loja]. Repositorio Institucional. https://dspace.utpl.edu.ec/handle/20.500.11962/26711
Abstract: Abstract: This degree work is focused on the application of data mining techniques to predict possible drugs consumption, it used on information collected by the CEPRA XII project: Automatic processing techniques applied to the analysis and prediction of tobacco consumption. drugs , which contains data related to the consumption of tobacco and other drugs, this information is organized into health variables, sociodemographic variables, tests and standardized questionnaires, a data treatment was carried out applying different types of normalization, for the creation of the models, the supervised learning algorithms were selected: Decision_tree, GaussianNB and Logistic_regression, experiments were carried out with the data submitted to different types of normalization, the metrics were applied: Accuracy, Recall, F1-score and mean square error to evaluate the results of each model. Finally, a web prototype was developed in order to load the datasets and visualize the results of each model.It is shown that it is feasible to apply data mining techniques to predict tobacco consumption on the information provided bythe CEPRA project, since the Logistic_regresion and Decision_tree algorithm obtained quite significant results, likewise it is verified that the results of each model vary according to the type of normalization to which the data were subjected.
Description: Resumen: El presente trabajo de titulación está enfocado en la aplicación de técnicas de minería de datos para predecir el posible consumo de drogas, se trabajó sobre información recolectada y proporcionada por el proyecto CEPRA XII: Técnicas de procesamiento automático aplicadas al análisis y predicción del consumo de drogas , la cual contiene datos relacionados alconsumo de tabaco y otras drogas, esta información está organizada en variables de salud, variables sociodemográficas, tests y cuestionarios estandarizados, se realizó un tratamiento de datos aplicando distintos tipos de normalización, para la creación delos modelos se seleccionó los algoritmos de aprendizaje supervisado: Decisión_tree, GaussianNB y Logistic_regression, se realizó experimentaciones con los datos sometidos a distintos tipos de normalización, se aplicó las métricas: Accuracy, Recall, F1-score y error cuadrático medio para evaluar los resultados de cada modelo. Finalmente se desarrolló un prototipo web con la finalidad de cargar los datasets y visualizar los resultados de cada modelo.Se demuestra que es factible aplicar técnicas de minería de datos para predecir el consumo de tabaco sobre la información proporcionada por el proyecto CEPRA, pues el algoritmo Logistic_regresion y Decision_tree obtuvieron resultados bastante significativos, así mismo se comprueba que los resultados de cada modelo varían acorde al tipo de normalización a la que fueron sometidos los datos.
URI: https://bibliotecautpl.utpl.edu.ec/cgi-bin/abnetclwo?ACC=DOSEARCH&xsqf99=124254.TITN.
Appears in Collections:Ingeniero en Sistemas Informáticos y Computación



Items in DSpace are protected by copyright, with all rights reserved, unless otherwise indicated.