Please use this identifier to cite or link to this item: http://dspace.utpl.edu.ec/handle/20.500.11962/23406
Title: Clasificación de documentos científicos mediante técnicas de procesamiento de lenguaje natural y minería de texto
Authors: Ortiz Serrano, Yesenia Andreina
Director: Segarra Faggioni, Verónica Alexandra
Keywords: Ecuador.
Tesis digital.
Issue Date: 2018
Citation: Ortiz Serrano, Y. A. Segarra Faggioni, V. A. (2018) Clasificación de documentos científicos mediante técnicas de procesamiento de lenguaje natural y minería de texto [Tesis de Grado, Universidad Técnica Particular de Loja]. Repositorio Institucional. https://dspace.utpl.edu.ec/handle/20.500.11962/23406
Abstract: Abstract:The Universidad Técnica Particular de Loja, , with the aim of promoting scientific research, creates groups of research lines to create, socialize research and disseminate in several scientific databases. The articles that are included in the different lines. This degree work aims to determine the relationships between the research lines and the terms of the articles uploaded to SCOPUS from 2003 to 2017; through the collection of information, elaboration of vocabulary, supervised classification, preprocessing and data training. The methodology is the "metametodología", composed of four principles that allow to obtain the result of the proposed research: obtain the result of 623 documents in plain text; Information on the abstract, the author and the keywords of each article was compiled, and a new classification was made due to inconsistencies in the classification. The application of the nearest k algorithms (KNN) and linear discriminant analysis (LDA) shows the accuracy of the classification of the articles, as well as the relationship that exists between them.
Description: Resumen:La Universidad Técnica Particular de Loja, con el objetivo de incentivar la investigación científica ha creado grupos de líneas de investigación para crear, socializar investigaciones y difundirlas en varias bases de datos científicas. Los artículos desarrollados en las diferentes líneas no poseen una clasificación que permitan extraer información de términos. Este trabajo de titulación pretende determinar las relaciones entre las líneas de investigación y términos comunes de los artículos subidos a SCOPUS desde el 2003 al 2017; mediante la recolección información, elaboración de vocabulario, clasificación supervisada, preprocesamiento y entrenamiento de datos. Se utilizó como Metodología la metametodologia , compuesta de cuatro principios que permite obtener el resultado de la investigación propuesta: obteniendo el resultado de 623 documentos en texto plano; se consideró recolectar información del resumen, autor y palabras claves por cada artículo, además se realizó una re clasificación debido a inconsistencias en la clasificación. La aplicación de los algoritmos k vecinos más cercanos (KNN) y análisis discriminante lineal (LDA) muestran la precisión de la clasificación de artículos, como también la relación que existe entre los mismos.
Identifier : Cobarc: 1285071
URI: https://bibliotecautpl.utpl.edu.ec/cgi-bin/abnetclwo?ACC=DOSEARCH&xsqf99=119953.TITN.
Type: bachelorThesis
Appears in Collections:Ingeniero en Sistemas Informáticos y Computación



Items in DSpace are protected by copyright, with all rights reserved, unless otherwise indicated.