Please use this identifier to cite or link to this item: http://dspace.utpl.edu.ec/jspui/handle/123456789/15591
Title: Análisis de Rendimiento de Librerías de aprendizaje automático a través de lenguaje de programación Python para hacer predicciones, estimaciones y clasificadores
Authors: Pablo Vicente, Bastidas Mendieta
metadata.dc.contributor.advisor: Elizalde Solano, Rene Rolando
Keywords: Lenguaje de programación – Análisis
Librerías de aprendizaje – Análisis
Aprendizaje automático – Python
Ingeniero en sistemas informáticos y computación – Tesis y disertaciones académicas.
metadata.dc.date.available: 2016-09-09
Issue Date: 2016
Citation: Pablo Vicente Bastidas Mendieta. (2016). Análisis de Rendimiento de Librerías de aprendizaje automático a través de lenguaje de programación Python para hacer predicciones, estimaciones y clasificadores. (Trabajo de Titulación de Ingeniero en Sistemas Informáticos y Computación ). UTPL, Loja
Abstract: This work presents a performance analysis of machine learning libraries through Python programming language. This analysis was done to demonstrate the advantages of this programming language in the field of data science. The basic information that has been analyzed with the machine learning libraries, are data from the National Institute of Statistics and Censuses with the theme marriages and divorces in Ecuador. To obtain a comparison balanced of libraries performance, the experimentation was done on the same set of training (80% Data) and testing (20% Data) in each of the libraries. This comparison was useful in order to determinate among other parameters, speed and accuracy, offered by some Python's machine learning libraries. In general, based on a number of parameters evaluation among them “Accuracy” (accuracy of the model) in the experiment of classification and “MSE” (mean square error) in the experiment of regression, the library Scikit-Learn obtained the best performance, on these two approaches.
Description: El presente trabajo de fin de titulación presenta un análisis de rendimiento de librerías de aprendizaje automático en Python. Se realiza este análisis con el fin de demostrar las ventajas que tiene este lenguaje de programación en el campo de la ciencia de los datos. La información base que ha sido analizada con las librerías de aprendizaje automático, son datos del Instituto Nacional de Estadísticas y Censos con la temática matrimonios y divorcios en el Ecuador. Para obtener una comparación equilibrada del rendimiento de las librerías, se realizó los experimentos sobre el mismo conjunto de entrenamiento (80% de los datos) y pruebas (20% de los datos) en cada una de las librerías. Resulta útil realizar esta comparación para poder determinar entre otros parámetros la velocidad y exactitud que ofrecen algunas librerías de aprendizaje automático en Python. De manera general, en base a varios parámetros de evaluación entre ellos “Exactitud” del modelo en el experimento de clasificación y “MSE” (error cuadrático medio) en el experimento de regresión, la librería Scikit-Learn obtuvo un mejor rendimiento, en estos dos enfoques.
metadata.dc.identifier.other: 1181853
URI: http://dspace.utpl.edu.ec/handle/123456789/15591
metadata.dc.language: spa
metadata.dc.type: bachelorThesis
Appears in Collections:Ingeniero en Sistemas Informáticos y Computación

Files in This Item:
File Description SizeFormat 
Bastidas Mendieta Pablo Vicente.pdf4.46 MBAdobe PDFView/Open


Items in DSpace are protected by copyright, with all rights reserved, unless otherwise indicated.